Поисковые машины имеют 3 основные составляющие:
Поисковый робот
Поисковый робот - это специальная программа (называемая также "пауком"), которая обходит сеть и собирает информацию о новых страницах, передавая ее впоследствии в базу данных (индекс).
Индекс
Индекс представляет собой базу данных, которая содержит копию каждой найденной страницы. Обновление базы происходит каждый раз, когда поисковый робот находит новые страницы.
Механизм ранжирования
Механизм ранжирования - это программа, которая определяет релевантность страницы (степень соответствия) поисковому запросу на основе семантического анализа документа, плотности и соответствия ключевых слов, ссылок с других Интернет-ресурсов и других параметров. От релевантности страницы зависит ее место при выводе результатов поиска.
Процесс обработки поискового запроса происходит следующим образом:
Поисковый запрос принимается и проверяется на наличие специфических команд и ошибок (в случае ошибок, как правило, предлагается правильный или наиболее подходящий вариант).
По поисковому запросу подбираются страницы из индекса и выводятся в порядке релевантности.
Запрашивается список текущих рекламных объявлений, удовлетворяющих поисковому запросу, и выводится в блоке рекламы.