Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ShPOR_po_informatike.docx
Скачиваний:
35
Добавлен:
25.04.2019
Размер:
328.47 Кб
Скачать

59 Дать понятие поисковой системы. Привести примеры поисковых систем. Раскрыть основной принцип работы поисковых систем. Охарактеризовать основные приемы поиска

Для решения задачи поиска нужной информации среди огромного числа информационных ресурсов были созданы в Интернет поисковые системы (Search Tools), которые размещаются в Интернет на общедоступных серверах и представляют собой специализированные web-узлы. Пользователь сообщает системе данные о содержании искомой web-страницы, а система выдает ему список гиперссылок на страницы, соответствующие запросу. Сегодня в Интернет имеется около 10 тысяч поисковых систем. К наиболее известным зарубежным машинам относятся Yahoo!, Alta Vista, HotBot, Google и некоторые другие. В России в настоящее время действуют 3 примерно одинаковые по мощности системы Апорт (www.aport.ru), Рамблер (www.rambler.ru) и Яндекс (www.yandex.ru).

Основной принцип работы поисковой машины заключается в поиске web-ресурсов по ключевым словам. Пользователь описывает искомый документ с помощью ключевых слов, после чего дает задание на поиск. Поисковая система просматривают свою базу данных, и выдает список гиперссылок на web-страницы, соответствующие запросу. Вместе с гиперссылками выдаются краткие сведения о найденных ресурсах (заголовки, адреса и описания документа) и отрывки (цитаты) из документов, где встречаются искомые слова, на основании которых пользователь может выбрать нужные ему ресурсы.

Результирующий список подвергается фильтрации и ранжированию. Под фильтрацией понимают отсев ссылок, которые выдавать нецелесообразно (прежде всего, проверяется наличие дубликатов). Ранжирование заключается в создании специального порядка представления результирующего списка, при котором наиболее «полезные» (с точки зрения поисковой системы) ссылки приводятся в начале списка, а наименее «полезные» - в конце. При ранжировании учитывается количество появлений искомых слов в web-документе и их место в тексте, проверяется расстояние между искомыми словами, наличие сопутствующих (уточняющих) слов или количество ссылок на данный документ с других web-документов. Упорядочение результирующего списка по степени соответствия содержанию найденных документов поисковому запросу, называется сортировкой по ревалентности. Стандартную сортировку по ревалентности можно заменить сортировкой по дате обновления страницы.

Под простым поиском понимают поиск web-ресурсов по ключевым словам на основе естественного языка. Расширенный поиск (Advanced Search) применяется в тех случаях, когда приемы простого поиска дают слишком много ссылок. В этом случае можно задать дополнительные параметры поиска. При выполнении расширенного поиска ключевые слова, как правило, связываются операторами логических отношений. Кроме того, режим расширенного поиска позволяет, например, найти документы по точной фразе, ограничить поиск документов только определенными серверами (сайтами) или элементами документа (например, заголовком), разыскать web-страницы, содержащие ссылки на заданный URL.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]