Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 11-глоб.doc
Скачиваний:
2
Добавлен:
17.08.2019
Размер:
204.29 Кб
Скачать

Поисковый сервер veronica

Система Veronica (Very Easy Rodent-Oriented Net-wide Indexof Computerized Archives) была разработана в качестве средства поиска информации по всему множеству архивов Gopher, которое в настоящее время принято называть Gopher-Space. Собственно, Veronica позволяет искать информацию не только в архивах Gopher, но и в World Wide Web, и в архивах Usenet, а также среди идентификаторов ссылок сессий telnet. В общей сложности Veronica поддерживает поисковый аппарат для 99% всех Gopher-серверов в мире. Ее индексные файлы содержат ссылки на все зарегистрированные Gopher-серверы, к которым открыт доступ из Internet. Для установки своего собственного сервера Veronica требуется около 2 GB свободного дискового пространства. К моменту написания этих строк в мире было известно 10 публичных серверов Veronica:

  • Nevada System Computing Services

  • University of Pisa

  • University of Koein

  • University of Bergen

  • University of Texas, Dallas

  • University of Manitiba

  • NYSERNET

  • PSI, Inc.

  • SUNET

  • Tachon Communication.

В терминологии серверов Gopher Veronica представляет из себя поисковый сервер. Отличие этого сервера от других поисковых машин заключается в том, что он позволяет проводить поиск информационного ресурса, который может не поддерживаться на данной вычислительной установке. Фактически Veronica состоит, как минимум, из двух частей: поискового аппарата (search engine) и системы опроса pecypcoв (veronica harvester).

Система опроса информационных ресурсов осуществляет поиск Gopher-серверов в Internet и проводит индексирование их баз данных. Поиск осуществляется на основе регистра Gopher-серверов, который поддерживает родина Gopher - университет Миннесоты, Если сервер зарегистрирован, то система опроса обращается к нему и начинает сканировать входы виртуальной файловой системы Gopher-сервера. На основе этого сканирования на сервере Veronica строится файл, содержащий термины и адреса документов в GopherSpace, которые эти термины содержат. Такой файл называется индексом (index). Для документов баз данных Gopher индексированию подлежат как сами документы, так и ссылки на эти документы, Точнее, заголовки документов и идентификаторы документов из меню Gopher, которые указываются перед строкой-селектором. Для других информационных ресурсов индексированию подлежат только идентификаторы из меню Gopher. Если база данных Gopher не зарегистрирована в Миннесоте, но на нее есть ссылка в на другом Gopher-сервере, то она также включается в индекс системы Veronica. Каждый из вышеперечисленных публичных серверов Veronica использует свою собственную базу данных, поэтому для размещения системы и требуется около 2 GB на жестком диске. В принципе индекс можно генерировать самостоятельно, но гораздо более предпочтительным является его копирование из архива Veronica - ftp://veronica.scs.unr.edu/. Это экономит и ресурсы вычислительной системы, и время получения индекса и снижает общий трафик по сети. Администратор Gopher-сервера может управлять процессом индексирования своего сервера. Для этого используется специальный файл конфигурации Veronica, который используется системой при сканировании Gopher-серверов.

Собственно индекс необходим для второй компоненты Veronica - поисковой машины. При рассмотрении ftp-архивов мы уже имели дело с поисковой системой Archie, которая позволяет искать программы и файлы по их названиям. Veronica осуществляет аналогичный сервис для Gopher. Только возможности Veronica гораздо богаче, чем у Archie. Пользователь взаимодействует с Veronica при помощи обычного Gopher-клиента. При выборе ссылки на Veronica он получает приглашение сформулировать запрос на поиск информации, используя ключевые слова. При этом пользователь может связывать эти слова логическими коннекторами AND, OR, NOT, использовать специальные атрибуты для уточнения запроса. Запрос выполняется системой Veronica на той машине, где она установлена, а затем передается пользователю в виде Gopher-меню. Особенностью этого меню является тот факт, что реально это меню ни на одном сервере не существует, а генерируется "на лету" системой Veronica. Здесь важно понять, что при поиске система не использует ресурсы сети. Она ищет информацию только в своем индексе. Обновляется индекс примерно один раз в месяц, поэтому результаты поиска не отражают текущего состояния GopherSpace. Вторым важным моментом является то, что Veronica не реализует поиска по полному тексту документа, а использует только так называемые инвертированные термины, т. е. те термины, которые хранится в ее индексе.

Доступ к серверу Veronica пользователь осуществляет из обычной страницы Gopher. Обращение выглядит в виде строки типа:

>Search GopherSpace by keywords in Titles.

или

> Search Gopher DIRECTORIES ONLY for keyword in Titles.

После выбора этой позиции пользователь обращается к серверу Veronica, который предлагает ввести слова для поиска информации. Самый простой запрос состоит из одного слова, например, "серверы". После ввода этого слова Veronica выдаст все ссылки на документы в GopherSpace, которые содержат слово "серверы" в своих поисковых образах, т.е. в заголовках или в идентификаторах документов из меню Gopher. Если пользователь захочет получить ссыпки только на графические файлы, которые указаны в различных Gopher-меню и в своих заголовках содержат слово "серверы", то тогда вместе со словом можно указать и атрибут "-t1":

"серверы -tl"

Можно ограничить число выдаваемых документов атрибутом "-m":

"серверы -m200"

В этом случае будут выданы только 200 найденных ссылок. Наибольшую мощь информационно-поисковый язык Veronica демонстрирует при использовании сложных запросов, составленных из нескольких слов:

"(veronica and harvester) not (veronica and search and engine)"

Такой запрос можно проинтерпретировать следующим образом: "Найти все документы, которые касаются программы сканирования GopherSpace, но не искать документы, которые касаются собственно программы поиска документов в GopnerSpace. При формулировании запросов можно применять усечения:

"сервер*"

Такой запрос будет искать все документы, в которых встречаются слова, начинающиеся с сочетания "сервер". Следует отметить, что Veronica имеет один из самых мощных информационно-поисковых языков в Internet. Многие средства аналогичного назначения не могут реализовать функционально полного набора операций, как, например, Wais. Это достигается за счет набора стандартных логических операций булевой алгебры: and, or, not. При этом операция not является одноместной, а не двухместной, как в Wais, которая использует операцию not_and.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]