Регистрация сайта в поисковых машинах Рунета
Автоматическая регистрация в иностранных поисковых машинах (тест)
Небольшой список иностранных поисковых машин
Список ботов
Генератор мета-тегов поможет оптимизировать страницу под поисковую машину
Несколько слов о поисковой оптимизации (SEO - Search Engine Optimization)
|
"Поисковая система - вебсайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet. В последнее время появился новый тип поисковых движков, основанных на технологии RSS.
Комплекс программ, обеспечивающий функциональность поисковой системы, называют поисковый движок или поисковая машина. Основными критериями качества работы поисковой машины являются релевантность, полнота базы, учёт морфологии языка. Индексация информации осуществляется специальными поисковыми роботами."
Поисковый робот (робот поисковой системы - web-crawler, spider) является неотемлимой частью поисковой системы/машины (web search engine).
Он представляет собой программу со следующими основными функциями:
посещение страницы веб-узлов (сайтов)
индексация содержимого страниц
Кроме содержимого страниц поисковый робот индексирует и найденные на страницах ссылки на другие веб-ресурсы (именно по-этому для рейтинга вашего сайта важно, чтобы на других веб-сайтах имелись ссылки на ваш ресурс).
Робот может возвращаться на сайт через определенный промежуток времени и заново проиндексировать содержимое сайта (для этого используется тег
<meta name=" revisit-after" content="# days ">,
где вместо решётки # указывается количество дней).
Полученная таким образом информация заносится в базу (индекс) поисковой машины, из которой впоследствии выбирается информация по пользовательскому запросу.
Индекс поисковой системы - это база поисковой машины, которая хранит в себе информацию о проиндексированных поисковым роботом html-страниц, а также файлов других типов, расположенных в каталогах веб-сервера.
Поисковый робот руководствуется инструкциями из файла robots.txt [?].
|