Что происходит за кулисами Яндекса: немного о принципах работы поисковых ресурсов!

Все мы ежедневно прибегаем к помощи поисковых систем. Уже привычными движениями вводим запрос и через несколько секунд получаем необходимую информацию. Что при этом происходит "за кулисами" поисковика? Какие процессы предшествуют появлению страницы с необходимыми нам данными?

В основе поиска информации в интернете лежит специальная программа, паук. Принцип работы программы заключается в том, что она беспрерывно переходит по обнаруженным ссылкам, анализирует информацию и сверяет с имеющейся в базе данных поисковой системы. В случае обнаружения новых документов, они скачиваются и сохраняются в базе данных поисковой системы. То есть, для выдачи результатов запросов поисковик использует не непосредственно информацию, находящуюся в Сети, а свою собственную базу данных, в которой хранятся копии страниц.

Обработка, ранжирование и сортировка информации

После сохранения страниц происходит обработка содержащейся на них информации и ее классификация. Распределение информации происходит в зависимости от релевантности к определенным поисковым запросам. Другими словами, релевантность - это соответствие содержащихся на странице данных запросам пользователей.

После этого происходит ранжирование информации и ее сортировка. Просто собрать наиболее похожие и соответствующие запросу страницы недостаточно. Необходимо их отсортировать таким образом, чтобы на верхних позициях находились наиболее подходящие под запрос и полезные для пользователя.

Добавление документов в базу данных может происходить как непрерывно, так и в виде апдейта - одномоментного обновления. Примером второго случая является Яндекс. Новые страницы, найденные и скачанные пауком, отправляются в отдельное хранилище, где они постепенно накапливаются и через определенное время добавляются в основную базу данных, которая используется непосредственно для работы с запросами пользователей. Обычно апдейт Яндекса происходит раз в неделю, в основном в ночное время суток, когда нагрузка на серверы поисковой системы снижается. При этом обновление информации на страницах сайтов, уже находящихся в базе данных поисковика быстрее попадет в выдачу, чем информация с сайта, появившегося в Сети недавно и впервые проиндексированного.

Выдача информации по запросу

Существует множество факторов, влияющих на место страницы в выдаче поисковика. Важнейшие из них можно поделить на такие группы:

  • 1. Внешние. В первую очередь к ним относится так называемая авторитетность сайта. Сюда относится количество ссылок на данную страницу со сторонних ресурсов, авторитетность ссылающихся и близость их содержимого к тематике сайта, регистрация сайта в каталогах. Для более подробной информации, по внешнему продвижению сайта ссылками, рекомендуем изучить статью "Какими ссылками можно раскрутить сайт в топ".
  • 2. Внутренние. К ним относятся наполненность страницы информацией, качество ее оформления, структурированность. Данные показателя зависят непосредственно от вебмастера, администрации сайта и естественно от самой внутренней оптимизации.
  • 3. Поведенческие. В первую очередь это активность пользователей сайта: количество посещений, просмотров страниц, переходы по размещенным ссылкам, время нахождения на сайте, оформление главной страницы. Чем выше эти показатели, тем выше позиция сайта в выдаче поисковой системы.

Данные факторы являются общеизвестными, но далеко не единственными. Поисковыми системами учитываются сотни других факторов, коэффициентов и значений, составляющих алгоритм, по которому выдается результат на запрос пользователя. Но эта информация относится к тайной и тщательно оберегается для создания равных условий и конкуренции среди сайтов. У каждого поисковика эти значения и алгоритм разные, но общие принципы одинаковые. Вокруг них и построена работа SEO-оптимизаторов, направленная на поднятие позиции сайтов при ранжировании, и, соответственно, рейтинга.