Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб. работа № 1.docx.doc
Скачиваний:
55
Добавлен:
27.03.2015
Размер:
340.48 Кб
Скачать

Метапоисковые системы

Не является секретом тот факт, что Интернет представляет собой постоянно растущий огромными темпами массив информации. Для того, чтобы каким-то образом упорядочить этот непрерывный поток данных и, самое главное, иметь возможность находить в этом потоке необходимую информацию, были созданы знакомые нам поисковые машины. Каждый такой поисковик имеет свой индекс, который несет служебную информацию о содержимом проиндексированных страниц и документов.

Каждый обычный (назовем его "традиционным") поисковик имеет только свой собственный, ограниченный своими ресурсами перечень (индекс) документов, которые доступны для поиска. Ни одна из подобных систем не может охватить всех ресурсов, которые существуют в Интернет. Поэтому, может возникнуть ситуация, когда пользователя не удовлетворяют результаты поисковой выдачи. Обычно, в этом случае, пользователь переходит на другой поисковик и пытается найти то, что ему нужно, там.

Зачем нужны метапоисковые системы? Теперь представим себе ситуацию, когда количество проиндексированных сайтов различными поисковыми системами растет в геометрической прогрессии, но доля непроиндексированного, так называемого "невидимого" Интернета для каждой поисковой системы (даже для такой мощной, как Gooogle) возрастает с каждым месяцем.

Происходит это потому, что разные поисковые машины используют различные алгоритмы поиска и уделяют свое внимание разным участкам Сети, к которым они наиболее адаптированы. Логичным решением, в таком случае, является поиск не одним, а несколькими поисковиками, для получения более релевантногорезультата. Именно такую возможность и предлагают метапоисковые системы.

Как работают метапоисковые системы. Следует иметь в виду, что метапоисковые машины не имеют собственных поисковых баз данных (исключение - nigma.ru), не содержат никаких индексов и для поиска используютбазы данныхдругих поисковых систем. Принцип работы метапоисковика заключается в следующем: запрос пользователя преобразуется в запросы, отформатированные синтаксически и логически в конструкции, оптимальные для каждого отдельного, "традиционного" поисковика, т. е. из одного запроса метапоисковый механизм делает ряд запросов, которые адресуются нескольким "обычным" поискам.

Таким образом, метапоисковые системы объединяют для достижения результатов индексы поисковых серверов различных специализаций. В рамках одной метапоисковой системы можно осуществлять поиск информации различного типа. Метапоисковые системы не предназначены для индексирования и накопления данных, их назначение – чистый поиск и обработка результатов поиска. Все метапоисковые системы сортируют результаты поиска таким образом, чтобы избежать дублей и одинаковых страниц в выдаче, найденных различными поисковыми системами. Рассмотрим два метапоисковых механизма - один западный, другой "наш"

Vivisimo Vivisimo представляет собой метапоисковую систему, которая собирает данные, используя индексы нескольких поисковых машин одновременно. При более детальном рассмотрении можно говорить, что Vivisimoобладает набором уникальных, нигде больше не встречающихся функций.

Дело в том, что большинство метапоисковых систем отсылают запрос пользователя в несколько поисковиков одновременно, а затем результаты, попавшие в начало списков, выводят в качестве ответа на запрос. Vivisimo работает таким же образом, но кроме этого, система сортирует результаты поиска по группам со схожим смыслом. Особенно полезно это бывает, когда существуют разные варианты вводимых ключевых слов. Результаты поиска объединяются в список все более узких подразделов, что делает возможным обходиться без дополнительных поисковых запросов. Пример поискового запроса [abba] на скриншоте.

Еще одна интересная функция Vivisimo заключается в возможности предварительного просмотра содержания страницы по найденным ссылкам. При этом пользователь может открыть окно просмотра прямо посреди страницы с поисковой выдачей, что позволяет быстро просматривать результаты поиска.

Но это еще не все возможности Vivisimo, достойные внимания. Если зайти на страницу расширенного поиска advanced search, можно найти много полезных инструментов для нашего дела. К примеру, пользователь может задать поиск по новостным сайтам (CNN, USA Today, Reuters, BBC и др.) или воспользоваться специализированными поисковыми машинами, такими как поисковик официального сайта правительства СШАFirstGov,Business.com, ЭнциклопедииБританника, аукционаeBayили системойпоиска патентов Delphion. Поиск Vivisimo в расширенном режиме выдает 200 результатов. Если этого недостаточно, то можно настроить машину на вывод 300 или 500 результатов.

В своей работе Vivisimo использует результаты поиска следующих машин и каталогов: MSN,Lycos,Looksmart,Wisenut,Open Directory,Overture. Сервис может корректно работать и с контентом на русском – но, к сожалению, русскоязычных сайтов, проиндексированных приведенными выше системами, не так уж и много, поэтому результаты поиска для страниц на русском оставляют желать лучшего.NIGMA.RU

Поисковый сервис nigma.ru позиционирует себя как "интеллектуальная поисковая система". Чтобы составить начальное представление о поисковике, обратимся к его страницев Википедии. Из описания становится понятно, чтоnigma.ru- универсальная поисковая машина, одновременно использующая несколько популярных поисковых движков, которые можно включать/отключать по желанию (главная стр. вкладка "поисковики").

Принцип действия NIGMA аналогичен поиску Vivisimo: поисковая выдача группируется по различным критериям, что позволяет быстро произвести уточняющий поиск. Например, вбиваем в строку поиска запрос по нашей теме [поисковые системы].

Получаем привычные нам ссылки на сайты, но... с левой стороны страницы мы видим фильтр сервиса, благодаря которому можно исключить/добавить различные смысловые (контекстные) значения понятия "поисковые системы".

Поставив галочку на линке, например, "новости" и нажав кнопку "применить фильтр", мы получим в следующей выдаче только новости на тему поисковых систем (см. скриншот). Аналогично можно находить/отсеивать форумы, статьи, ресурсы и др. по любому поисковому запросу. По-моему, очень удобно и практично. Идем дальше...

Производит впечатление автозаполнение строки поиска и система подсказок сервиса. Мало того, что NIGMA предлагает разные варианты запросов по рейтингу их популярности на сервисе, она еще дает краткую справку (из Википедии) по теме возможного варианта. Да, такого пока нет даже в Google...

Можно и дальше перечислять и описывать различные "фишки" и способности системы (нет, это действительно интересно!), например, в области химии или математики. Думаю заинтересованный читатель сам с удовольствием разберется в тонкостях работы данного сервиса. Хочу сказать о том, что меня действительно приятно удивило в nigma.ru - поиск музыки. Совершенно потрясная вещь!

Над строкой поиска главной страницы можно видеть вкладки, определяющие результаты наших запросов. Жмем на вкладку "музыка" и вписываем в строку ключевые слова - название музыкального произведения, слова из песни, имя автора и т. п. Кроме того, что NIGMA выдает вполне достаточное количество ссылок, любую композицию можно прослушать здесь же, на странице поисковой выдачи!

Рядом может быть линк на скачивание и текст песни. Просто подарок для меломана! Ну и, судя по тому, откуда (с каких поисковиков) nigma.ru черпает информацию, смею предположить, что сервис так же хорошо обрабатывает запросы на латинице, как и на русском языке.

Конечно, приведенные выше два примера метапоисковых машин не единственные в своем роде. Существует много подобных систем и, возможно, они не хуже приведенных здесь. Ниже даны ссылки на некоторые из них. (http://www.vsepoisk.ru)