Поисковая система

ПОИСКОВАЯ СИСТЕМА – (англ. search engine, синонимы: искалка, поисковый сервер, поисковая машина) – Инструмент для поиска информации в Интернете. Как правило, работа поисковой машины состоит из двух этапов. Специальная программа (поисковый робот, автомат, агент, паук, червяк, crawler) постоянно обходит сеть и собирает информацию с зарегистрированных в данной системе веб-страниц (индексирует их). Когда пользователь задает запрос, поиск идет по предварительно построенному индексу. Результатом поиска является так называемая поисковая выдача – список ссылок на документы (веб-страницы), соответствующие запросу. Поисковые машины различаются по области действия на локальные (ограничивающиеся национальным доменом, определенным языком) и глобальные. Обычно глобальные системы хорошо покрывают американский интернет (который действительно является значительной частью мирового) и несколько хуже «знают» остальную часть. Поэтому, если ваш поиск заведомо ограничен страной или языком, лучше пользоваться локальной системой. Интернет – живая динамическая система, которая меняется быстрее, чем об этом успевает узнать робот поисковой машины. Поэтому иногда найденные документы могут оказаться измененными или вообще не существовать. Некоторые поисковые машины при индексации сохраняют у себя образ индексируемого документа и могут показать его пользователю даже после того, как оригинал перестал соответствовать образу. Скорость обновления индекса и полнота покрытия (размер поисковой базы) являются важной характеристикой поисковой машины. Ссылки на документы в результатах поиска сортируются по степени соответствия запросу. Этот критерий называется «релевантность». Способ вычисления релевантности является собственным know-how каждой поисковой машины, поэтому выдача по одному и тому же запросу в разных системах может заметно отличаться. Поисковые машины обычно имеют специальный язык запросов, с помощью которого можно точнее объяснить машине, что именно надо искать. Однако большинство систем не требуют от пользователя знания этого языка, как правило, достаточно просто написать в строке запроса несколько ключевых слов, определяющих область вашего интереса. Самым современным системам можно задавать запросы просто на естественном, «человеческом» языке. Система сама разберется, какие слова и словосочетания являются ключевыми. Основной объект индексации поисковой машины – тексты. Однако существуют системы, позволяющие осуществлять поиск по картинкам, по mp3, по архивам программ, по новостям и т.д. Все поисковые машины сталкиваются с проблемой так называемого поискового «спама». С большинством сайтов-спамеров удается бороться с помощью специальных алгоритмов, и меры, применяемые к спамерам, могут быть довольно суровыми – вплоть до полного исключения сайта из поисковой базы.

Князев А.А. Энциклопедический словарь СМИ. КРСУ, 2002.