- •Лекция 8 технологии построения поисковых систем и организация информационного поиска План лекции
- •1. Основные понятия поисковых систем
- •1.1. Определение и задача поисковых систем
- •1.2. Модели поисковых систем
- •1.3. Обзор функциональности
- •1.4. Поисковые системы и электронные библиотеки
- •2. Особенности поиска в Web
- •2.1. Особенности Web как набора данных
- •2.2. Особенности поведения пользователей поисковых систем в Web
- •3. Архитектура поисковых систем для Web
- •3.1. Сканирование
- •3.2. Хранение, индексирование и поиск
- •3.3. Ранжирование
- •4. Альтернативные архитектуры поисковых систем
- •4.1. Распределенные поисковые системы
- •4.2. Метапоисковые системы
4.2. Метапоисковые системы
Метапоисковая система - это система, которая предоставляет единый доступ к нескольким другим поисковым системам, т.е. обслуживает запросы пользователей за счет опрашивания других поисковых систем, которые полностью независимы и не предоставляют никакой специальной информации о содержимом своих индексов или используемых методах поиска.
Такие системы популярны в силу ряда причин.
Повышение полноты охвата. Ни одна поисковая система не имеет полного покрытия Web, и использование нескольких поисковых систем повышает вероятность обнаружения искомого документа. Хотя полнота ответа не является очень популярным критерием оценки эффективности поиска в Web, для некоторых задач, в частности, при составлении обзора, она очень важна.
Повышение качества поиска. Наиболее типичный способ - выбор тех поисковых систем, которые лучше всего соответствуют текущим потребностям пользователя. Например, это может быть использование специализированной поисковой системы вместо поисковой системы общего назначения.
Новые возможности поиска. Крупномасштабная поисковая система, такая как Яндекс или Google, не может тратить много ресурсов, прежде всего, времени, на обработку каждого отдельного запроса из-за их огромного количества, иначе системе не достичь массового использования. Метапоисковые системы не имеют такого ограничения и могут фокусироваться на решении специализированных задач поиска, ориентированных на узкую целевую аудиторию. Все это облегчает внедрение новых методов поиска, поскольку дает возможность проверить их эффективность без реализации полноценной поисковой системы. Например, весьма полезная и одновременно весьма дорогая для крупномасштабной ПС тематическая кластеризация результатов поиска реализована в метапоисковой системе Vivisimo (http://vivisimo.com).
При создании метапоисковой системы необходимо решать проблемы, похожие на возникающие при создании распределенных систем, но полная автономность составляющих ПС вносит свою специфику:
-
выбор ПС, которые будут обрабатывать запрос;
-
адаптация к разным языкам запросов, используемым в разных ПС;
-
слияние ответов от различных ПС.