Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторная работа № 4 Поиск.doc
Скачиваний:
4
Добавлен:
11.07.2019
Размер:
113.66 Кб
Скачать

Infoseek не работает с общепринятыми логическими опера­торами and, or и not или оператором близости near, но и с его символами можно добиться очень хорошей точности запросов.

Пои работе с Infoseek можно не составлять запросы для поиска по ключевому слову, а просто вводить фразу на естественном языке с информацией о том, что необходимо получить. Такой подход зна­чительно облегчает пользование Infoseek, но не приводит к улучше­нию результатов по отношению к обычному последовательному вводу ключевых слов.

Таблица 2

Операторы поисковой службы Infoseek

Оператор

Описание

+

Указанное после оператора слово должно быть включено в критерий поиска

-

Указанное после оператора слово должно быть исключено из критерия поиска

""

Задает поиск фразы целиком

|

Сначала выполняется поиск слова до черты, а затем в полученных результатах выполняется поиск слова, указанного после черты

,

Служит для разделения имен и заголовков

Для успешного ведения поиска следует обратить внимание на каталог Web Directory, подразделяющийся на 12 категорий с сот­нями подкатегорий, для которых может быть выполнен поиск. Каждая страница каталога Web Directory содержит перечень ре­комендуемых узлов.

WebCrawler

http://www.webcrawler.com

WebCrawler предоставляет широкие возможности синтаксиса для конкретизации запросов, а также большой выбор аннотаций узлов при сравнительно несложном интерфейсе.

Следом за каждым полученным ответом WebCrawler помеша­ет небольшую пиктограмму с приблизительной оценкой соответ­ствия запросу. Функция Show Summaries выводит на экран стра­ницу с кратким резюме для каждого ответа, его полным URL, точной оценкой соответствия, а функция Similar Pages использует этот ответ в запросе по образцу в качестве его ключевых слов.

Графического интерфейса для настройки запросов в WebCrawler нет. Синтаксические конструкции достаточно просты: обычные логические операторы AND, OR и NOT, оператор близости NEAR (для него предусмотрен ключ, показывающий интервал между ключевыми словами), скобки для вложенных запросов; фразы, по которым выполняется поиск, заключаются в кавычки. В WebCrawler существует оператор ADJ. указы­вающий, что два слова должны следовать непосредственно одно за другим в порядке их ввода. Тот же эффект может быть достигнут при помощи кавычек. Однако не допускается ис­пользование универсальных символов, а также невозможно назначить весовые коэффициенты ключевым словам. Кроме того, не существует возможности ограничения поля поиска определенной областью.

WebCrawler предлагает 15 категорий содержания, и, щелк­нув мышью на одной из них, можно обнаружить несколько под­категорий с краткими аннотациями множества интересных уз­лов. Можно немедленно связаться с одним из таких узлов или продолжить поиск узлов, содержащих информацию по интере­сующей теме. К числу других полезных особенностей относятся список 25 наиболее популярных узлов, а также бегущая строка, дающая возможность прослеживать активные запросы, вводи­мые другими пользователями.

Yahoo!

http://www.yahoo.com

Yahoo! - первый и по-прежнему один из наиболее популярных поисковый узел Web. Он может служить хорошей от­правной точкой для любых обобщенных поисков в Web, поскольку с помощью его обширной системы классификации пользователь на­верняка найдет узел с хорошо организованной информацией, если в индексах Yahoo! она учтена.

Содержимое Web подразделяется на 14 общих категорий, пере­численных на домашней странице Yahoo!. В зависимости от специ­фики запроса пользователя существует возможность или работать с этими категориями, чтобы ознакомиться с подкатегориями и спи­сками узлов, или искать конкретные слова и термины по всей базе данных. Пользователь может также ограничить поиск в пределах любого раздела или подраздела Yahoo!. В этом случае запрос будет касаться только заданного подмножества базы данных.

Благодаря тому что классификация узлов выполняется людьми, а не компьютером, качество ссылок обычно очень высокое. Однако если заказанный пользователем поиск не увенчался успехом, то и уточнить его будет непросто, так как средств для этого у Yahoo! не­много. Эти средства представлены в графической форме, в которой можно задать базовые логические операторы AND и OR; можно задать поиск по точному совпадению текста или по основам слов. В состав Yahoo! входит поисковый механизм AltaVista, поэтому в слу­чае неудачи при поиске на Yahoo! автоматически происходит его повторение, но уже с использованием поискового механизма AltaVista. Затем полученные результаты передаются в Yahoo!. Если пользователь захочет выполнить свой запрос при помощи другого поискового механизма, ему следует щелкнуть мышью на необходи­мой связи с нужным поисковым механизмом в нижней части стра­ницы с ответами.

При выполнении поиска с помощью Yahoo! сначала будет вы­веден на экран список категорий, к которым отнесен запрос поль­зователя, а затем перечень узлов Yahoo! и категории, которым эти узлы соответствуют. Запрос будет загружен в текстовое окно и выполнен в AltaVista, если ни одна из попыток в Yahoo! не при­несла результатов.

Недостатком ограничения поиска категориями и заголовка­ми узлов является то, что число полученных результатов суще­ственно меньше, чем при использовании многих других поиско­вых узлов.

Yahoo! также обеспечивает широкий выбор дополнительных услуг. Пользователю предоставляется возможность отправлять запросы в DesaNews для поиска в Usenet и в Fourl 1, чтобы узнать адреса электронной почты. Yahoo! хорошо справляется с поиском в узлах, расположенных в определенном регионе, охватывая при этом как города, так и страны. Функция Yahooligans формирует подмножество указателя Yahoo!, отбирая только подходящие для детей узлы. Следует также отметить настраиваемую страницу новостей My Yahoo!. Значительные инвестиции в разработку Yahoo! были сделаны родительской компанией издательства PC Magazine - фирмой Softbank.

Хотя при помощи Yahoo! трудно добиться достаточной точ­ности ответов при поиске по конкретным терминам, поиск по категориям, составленным людьми, а не машиной позволяет по­лучать высококачественную информацию для обобщенных за­просов. Интеграция с AltaVista и связи со многими другими по­исковыми узлами Web также обусловливают твердые позиции данного поискового сервера.

Rambler

http: //www.rambler.ru

Эта русскоязычная поисковая служба обладает хорошими воз­можностями поиска.

Это одна из пока еще редких русскоязычных поисковых систем. Разделы, перечисленные на домашней странице Rambler, подробно освещают русскоязычные Web-ресурсы. В том случае, если пользователю необходимо работать в специфической области, ему следует воспользоваться предложенной классификаци­ей информации. Удобной возможностью работы на Rambler являет­ся предоставление списка наиболее посещаемых узлов по каждой предложенной тематике.

Стандартные средства поиска позволяют оперировать непо­средственно из строки "Поиск", расположенной в верхней части страницы Rambler.

Апорт

ht tp: //www.aport.ru

Апорт - одна из лучших русскоязычных поисковых систем. Имея те же основные черты, что и AltaVista, этот сервер содер­жит намного больше современных ресурсов российского Internet. Также Апорт входит в число ведущих поисковых систем, сертифицированных Microsoft как локальные поисковые системы для русской версии Microsoft Internet Explorer.

Одним из существенных преимуществ Апорта является англо-русский и русско-английский перевод в режиме online запросов и поисков результата, благодаря чему можно вести поиск в русских ресурсах Internet, даже не зная русского языка. Более того, благодаря ряду уникальных особенностей системы, можно искать информа­цию, используя выражения, даже для предложений.

Среди основных свойств поисковой системы Апорт можно вы­делить следующие:

• перевод запроса и результатов поиска с русского на англий­ский язык и наоборот;

• автоматическую проверку орфографических ошибок за­проса;

• информативный вывод результатов поиска для найден­ных сайтов. В результат поиска включается несколько предложений, а не одно, как в большинстве систем;

• возможность поиска в любой грамматической форме (что особенно важно для русского языка);