Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
часть2 (21-51).doc
Скачиваний:
3
Добавлен:
19.08.2019
Размер:
1.13 Mб
Скачать

33. Поиск информации в Интернет. Поисковые машины и системы, языки запросов.

Сеть интернет работает с 3-мя основными системами поиска инф: www, wais, Gopher.

Gopher позволяет находить инф по ключевым словам Gopher явл сервисом прямого доступа и требует, чтобы серверы были подключены к интернет.

Система wais это инф система широкого профиля, представляет собой комплекс программ, предназначенных для индексирования больших объемов информации. В системе имеется более 200 wais бибилиотек.

Система www самое популярное и удобное средство работы с информацией. Это сервер прямого доступа, требующий полноценного подключения к интернет. www работает по принципу клиент-сервер.

В интернет реализуется 2 стороны поиска информации разные по методам, но единые по целям: поисковые серверы и каталоги.

Сервер – это компьютер, способный представлять клиентам сетевые услуги по их запросам.

Поисковые серверы – это выделенные компьютеры, которые автоматически просматривая все ресурсы интернет, могут найти запрашиваемые ресурсы и проиндексировать их содержание.

Каталоги – средства хранения тематических систематизированных коллекций, ссылок на различные документы. Каталоги обычно имеют древовидную структуру и обеспечивают разнообразны дополнительный сервис: поиск по ключевым словам, список последних поступлений и т.д..

Поисковые системы – это полностью автоматизированные интерактивные сервисные службы, осуществляющие поиск информации в интернете по введенному пользователем текстовому запросу.

Принцип действия поисковых машин (Индексация вэб-страниц):

1)Создание и размещение сайта в сети;

2)регистрация сайта в поисковых системах(информирование поисковой системы о параметрах сайта – URL, описание ресурса, ключевые слова, контактная информация);

3)Просмотр спайдером (специальной программой поисковой машины) ресурсов сайта;

4)Обнаружение спайдером гиперссылок;

5)внесение информации об обнаруженных страницах в БД поисковой системы (Индекс);

Индекс поисковой машины содержит только адрес вэб-страниц и краткую аннотацию, которая поясняет их содержимое.

Пользователь вводит в соответствующую форму свой запрос в виде ключевых слов. По данной команде поисковый сервер передает управление другой программе, поисковому механизму. Эта программа сравнивает введенные пользователем ключевые слова с содержимым индекса на соответствие.

Наиболее известные зарубежные поисковые машины: Google, HotBot, InfoSeek, Yahoo и др.

Наиболее известные российские поисковые машины: Rambler, Яндекс и др.

Поиск по ключевым словам. Язык запросов поисковой системы

Поисковая система обычно имеет поле для ввода ключевых слов, по которым она находит документы, содержащие эти ключевые слова. Чем лучше (качественнее) составлен запрос к поисковой машине, тем меньше общее количество найденных документов, и больше из них документов, соответствующих тому, что Вам требуется. Если запрос очень простой или составлен неграмотно, то поисковая машина может Вам выдать несколько миллионов документов, которые Вам не просмотреть за всю жизнь.

Используя язык запроса, содержащий логические операции (логические операторы AND, OR, NOT и др.), префиксы (например, префиксы обязательности присутствия ключевых слов в документе "+" и "-", расположения ключевых слов в документе рядом или на определенном расстоянии и др.) и другие элементы, и большее количество связанных ими ключевых слов, можно значительно сузить область поиска и более качественно составить запрос к поисковому серверу. Некоторые поисковые системы дополнительно имеют режим расширенного запроса, позволяющий пользователю более точно описать то, что ему конкретно нужно. Следует учитывать, что разные поисковые системы могут иметь как различающиеся языки запросов, так и очень похожие. На WWW-страницах поисковых систем обычно есть ссылки на справочную информацию по использованию собственных языков запросов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]