Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мир_умк_самый последний.doc
Скачиваний:
175
Добавлен:
03.05.2019
Размер:
1.98 Mб
Скачать
  1. Правила поиска информационных ресурсов в мировых информационных сетях

Текстовая информация представляет собой описание объектов с помощью понятий естественного языка, в связи с чем, она не всегда имеет однозначное трактование, так как слова естественного языка имеют множество различных значений. Недостатки такой информации:

    • избыточность, проявляющаяся в том, что значения для формирования представления о каком-то объекте, имеют не все слова, а только некоторые, называемые ключевыми;

    • неоднозначность – возможность выражать одну мысль словами не являющимися синонимами;

    • неоднозначность, проявляющаяся в использовании синонимов, то есть слов одинаковых по звучанию, но разных по значению;

    • недостаточность выражения, проявляющаяся в многозначности слов (омонимии).

Основные методы поиска информации в Интернете:

  • Непосредственный поиск с использованием гипертекстовых ссылок – часто оказывается единственно возможным на заключительных этапах информационного поиска.

  • Использование поисковых машин – основной метод при проведении предварительного поиска (Yandex, Rambler, Aport, Google и пр.).

  • Поиск с применением специальных средств (спайдеров) – полностью автоматизированный метод – может оказаться весьма эффективным для проведения первичного поиска.

  • Анализ новых ресурсов - может оказаться необходимым при проведении повторных циклов поиска, поиска наиболее свежей информации или для анализа тенденций развития объекта исследования в динамике.

Технология проведения информационного поиска

  • Определение географических регионов поиска, т. к. практическая ценность информационного ресурса может зависеть и от географического расположения соответствующего источника.

  • Составление тезауруса. Для эффективного использования поисковых серверов необходим список ключевых слов, организованный с учетом семантических отношений между ними, т. е. тезаурус. При составлении тезауруса необходимо предусмотреть обработку синонимов, омонимов и морфологических вариаций ключевых слов.

  • Отбор поисковых машин. Устанавливается последовательность использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска с применением каждой машины.

  • Составление и выполнение запросов к поисковым машинам.

Это наиболее сложный и трудоемкий этап, связанный с обработкой большого количества информации (в основном шумовой).

На основе тезауруса формируются запросы к выбранным поисковым серверам, после чего возможно уточнение запроса с целью отсечения очевидно нерелевантной информации.

Затем производится отбор ресурсов, начиная с наиболее интересных, с точки зрения целей поиска.

Данные с ресурсов, признанных релевантными, собираются для последующего анализа.

Тема 16. Технология доступа к деловым ресурсам Интернета

План

  1. Поисковые машины

  2. Каталоги в Интернете

  3. Технология доступа к информации в электронных библиотеках

  4. Сравнительные характеристики эффективности поиска в различных системах и оценка достоверности

Интернет, являясь глобальной телекоммуникационной сетью, предоставляет возможность доступа к большому количеству информационных ресурсов. По некоторым оценкам, объем Интернет-ресурсов превышает 50 млн. веб-сайтов и 10 млрд. веб-страниц.

Под веб-страницей понимается электронный документ, который может содержать информацию в различном формате в виде текста, изображения, звука и т.д. Веб-сайт является совокупностью веб-страниц, связанных по смыслу или ссылками. В наиболее благоприятном случае пользователь знает адрес сайта. Адрес он может получить различными способами: из книг, справочников, периодических изданий, рекламных проспектов и других источников.

Основной проблемой, с которой сталкивается пользователь при работе в Интернете, является обнаружение необходимых ему информационных ресурсов.

Поиск необходимых сведений в Интернете осуществляется либо при помощи поисковых машин (search engine), либо каталогов (directory). Но и здесь пользователь сталкивается с проблемой выбора, так как уже в 2001 году количество поисковых машин в Интернете превысило 2000 и продолжает неуклонно расти.

Мы будем рассматривать поисковые машины и каталоги отдельно в виду принципиальных различий в организации их работы.