Работа с динамически создаваемыми страницами HTML

Динамически создаваемые страницы HTML представляют собой некий информационный объект, создаваемый на лету, подобно информации, извлекаемой из баз данных. Дина- мические страницы также содержат код HTML, который либо извлекается из базы дан- ных, либо генерируется сценариями PHP, JSP, ASP или CGI, т.е. код HTML страницы создается только после запроса страницы у сервера. Здесь, как везде и всюду, перед вами встают призраки потенциальных проблем. Главная проблема такова - если содержимое страницы создается на лету, в зависимости от действий пользователя, то машинам поиска здесь просто нечего индексировать.

Другая проблема состоит в том, что если адреса URL динамических страниц имеют в своем составе дополнительные символы, то машины поиска, как правило, их не индек- сируют. Эти символы действуют подобно стоп-сигналу, и машины поиска, натолкнув- шись на такой символ, сразу прекращают работу.

Какие же символы мы имеем в виду? В частности, это знак вопроса (?), а также ампер- сант (&), процент (%), плюс (+) и знак доллара (S).

Но проблемы доставляют не только символы. Многие машины поиска отказываются от индексирования страниц, адреса URL которых содержат ссылки на каталог CGIbin, по- скольку они боятся зависнуть при обработке бесконечного числа адресов URL, предос- тавляемых базами данных.

Итак, при использовании динамических страниц мы встречаемся с двумя проблемными ситуациями. Если адреса URL содержат символы или ссылки на каталог CGIbin, мы, ве- роятно, не сможем вообще проиндексировать страницы. Если же символов и ссылок нет, то мы сможем включить страницы в индекс, но, поскольку в них отсутствует содержи- мое для анализа страницы машиной поиска, будет очень сложно добиться для таких страниц высоких позиций в списках результатов.

Если вы имеете динамически генерируемые страницы, которые создаются без всяких параметров в адресе URL, и без передачи каких либо указаний серверу сгенерировать страницу на лету, вы также сможете включить такие страницы в индексный указатель. Но, поскольку страница лишена содержимого, она, вероятно, столкнется с проблемами достижения высоких позиций в результатах поиска, даже если сайт имеет высокую ссы- лочную популярность, и/или популярность, оцениваемую по числу выборов сайта из списка информационных ресурсов.

Чтобы определить, возможно ли индексирование страницы, попытайтесь удалить из ад- реса URL страницы все символы, начиная со знака вопроса (?). Если страница загрузится корректно, вы сможете ее проиндексировать. Если нет, вам следует найти обходной путь, Также вам следует, по возможности, отказаться от использования символов в ваших ад- ресах URL. Некоторые серверы, например, Apache или GoldFusion, разрешают преобра- зование адресов URL с дополнительными символами в адреса URL, воспринимаемые машинами поиска, так что, можно воспользоваться и таким методом обхода проблемы, Как и при решении проблем со многими технологиями, описываемыми в этой главе, для обхода проблем с динамическими страницами, содержимое которых не может быть проиндексировано, можно использовать статические страницы Web с обширным содержимым.

Другой путь обхода проблем, возникающих при извлечении содержимого страниц из баз данных, СОСТОИТЕ использовании маскирования.

Один из студентов Академии достиг больших успехов в разработке сайта Cruise Discounts Online с доставкой содержимого из базы данных. Одна из страниц этого сайта по адресу http://www.cruisediscountsonline.com/Royal- Caribbean-cruise-line/index.asp создавалась только с использованием таблицы базь; данных Access. Все время своего существования этот сайт занимал по- зицию #4 в списках результатов поиска на машине Google по ключевой фразе «Royal Caribbean cruise line» (Королевский круиз по Карибам).

Он использовал ту же самую страницу, что и на основном сайте по адресу: http://www.cruisediscount$on!ine.com/CruiseRoyalCaribbean.html, который не- когда имел высокую позицию в результатах поиска на машине NBCi. Обяза- тельно обратите внимание на эффективный тег <NOFRAMES> страницы. Владелец сайта Эд Кинг (Ed King) заявляет следующее: «Кто сказал, что стра- ницы с фреймами не могут использоваться эффективно?»

Учтите, Эд потратил массу времени, изучая стратегии оптимизации сайтов под характеристики машин поиска и применяя их к своему сайту. Все на его сайте подчинено одной единственной теме: круизы.

Продолжение темы:

Полезная информация