Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по информатике для заочников.docx
Скачиваний:
4
Добавлен:
27.04.2019
Размер:
590.1 Кб
Скачать

5.Информационно-поисковые системы для глобальной сети

Причиной постоянного возрастающего интереса к проблеме поиска информации в Internet является стремительное развитие информационной базы Сети и возникновение новых поисковых возможностей. Еще одной причиной обращения к данной теме явилось то, что руководители строительных коммерческих и государственных организаций ощутили полезность своевременного получения информации из Сети. Поиск и обработка информации современными интернет-технологиями не только способствует развитию бизнеса, но и повышает авторитет и стабильность организации.

Поиск информации в Internet предполагает выполнение следующих требований:

· контроля полноты охвата ресурсов;

· контроля достоверности полученной информации;

· высокой скорости проведения поиска.

Требование контроля полноты охвата ресурсов предусматривает сбор информации из Internet не только в пределах Web-пространства, но и telnet-доступных баз данных, региональных телеконференций и других ресурсов Сети.

Контроль достоверности информации может производиться различными способами: установлением частоты его использования другими источниками; выяснением статуса документа и рейтинга узла; получением информации о компетентности и статусе автора материала.

Скорость проведения поиска в Сети зависит от технических характеристик подключения пользователя, грамотного планирования поисковой процедуры и навыков работы с ресурсом выбранного типа. Под планированием поисковых работ понимается выбор поисковых сервисов и инструментов, отвечающих специфике задачи. После получения доступа к соответствующему ресурсу на передний край выдвигается умение быстро разобраться в его структуре и способах навигации.

В настоящее время в Internet может быть доступной информация из источников разного типа:

· электронной почты и почтовых роботов;

· глобальной системы телеконференций Usenet, региональных и специализированных телеконференции;

· списков рассылки;

· онлайновых средств коммуникации пользователей;

· системы поиска людей и организаций;

· базы данных Hytelnet;

· системы файловых архивов FTP, системы поиска в FTP-архивах глобального и регионального охвата;

· базы данных Gopher и поисковой системы Veronica;

· гипертекстовой информационной системы World Wide Web (WWW);

· каталогов ресурсов – глобальных, локальных, специализированных (в среде WWW);

· поисковых машин, или автоматических индексов – глобальных, локальных, специализированных (в среде WWW);

· баннерных систем (в среде WWW);

· активных информационных каналов (в среде WWW).

Рассмотрим подробнее каждый тип ресурса, используемый для поиска информации в Сети.

Адрес электронной почты широко используется в ИПС для идентификации владельца. При организации поиска информации в Сети используется URL-схема, которая позволяет вставлять в Web-страницу гиперссылку на е-mail, автоматически открывающую почтового клиента. Адрес электронной почты свободно индексируются поисковыми системами и доступен для поиска через поисковые машины общего назначения.

Почтовые роботы – программы, выполняющие действия по командам, поступающим по электронной почте. Используются для пересылки данных по запросу. В информационно-поисковых системах используются в качестве посредников при получении информации.

Глобальная система телеконференций Usenet, региональные и специализированные телеконференции построены по принципу электронных досок объявлений. Пользователь может разместить свою информацию в одной из тематических групп новостей и эта информация передается пользователям, которые подписаны на данную группу.

Списки рассылки представляют собой систематическую передачу информации по электронной почте. Пользователь сам может поместить информацию в список рассылки. По адресу http://www.relc.com/ tech/all/list.html.ru можно найти страницу, содержащую перечень наиболее известных российских списков рассылки. Поиск по спискам рассылки позволяет получить информацию о крупнейших проектах, реализуемых в Сети, а также более результативно строить поисковые запросы.

Онлайновые средства коммуникации используют специальные чат-серверы и позволяют обмениваться информацией между пользователями Сети в режиме реального времени. Обмен информацией может производиться в виде текстового диалога, передачи графики, голосовой и видео-связи, а также обмена файлами. Поиск в этой среде производится посредством службы ICQ, известной среди российских пользователей как "Аська" (http://www.icq.com). Разработчики ICQ предложили каждому пользователю регистрационный номер-идентификатор, который сохранялся бы за ним постоянно. При поиске людей и организаций используется поисковая служба ICQ, которая становится доступной сразу после установки ICQ-клиента на компьютер.

В системах поиска людей и организаций основным атрибутом является сетевой идентификатор пользователя, а именно адрес e-mail. Источником пополнения баз данных становятся материалы телеконференций, Web-сервера, а также самостоятельная регистрация пользователей. К ним добавляются системы, специализирующиеся на поиске, например, по номеру ICQ или домашних страниц пользователей.

Базы данных Hytelnet представляют собой информацию по библиотечным каталогам европейских и американских университетов, а также государственных учреждений. Каждая из них обладает оригинальной системой навигации и поиска, реализуемой через команды, которые вводятся с клавиатуры в алфавитно-цифровом режиме.

Система файловых архивов FTP отличается в простоте доступа, навигации и передачи файлов по ftp. Ftp-архивы являются источниками программного обеспечения, успешно конкурирующими с Web-узлами, которые специализируются на продаже и представлении коллекций программ. В отличие от Web-узлов на них гораздо чаще можно столкнуться с нарушением авторских прав в виде пиратских копий программ и отдельных материалов, продаваемых на других узлах за деньги. Ключевым словом при оформлении запроса является текст, входящий в название файла или каталога на ftp-сервере.

Базы данных Gopher и поисковая система Veronica, сканирующая ресурсы Gopher-пространства на текущий момент перестали играть сколько-нибудь существенную роль в информационном поле Internet. Однако сервер, на котором зарегистрировано большинство gopher-серверов Сети (gopher://gopher2.tc.umn.edu), остается в рабочем состоянии и по сей день.

Гипертекстовая информационная система World Wide Web (WWW) и ее технологии наиболее широко распространены в Сети и продолжают развиваться. Сервис Web построен на основе архитектуры «клиент-сервер» и включает в себя следующие составляющие:

· язык гипертекстовой разметки документов HTML (Hyper Text Markup Language);

· универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);

· протокол обмена данными HTTP (Hyper Text Transfer Protocol);

· средства просмотра Web-страниц (браузеры).

Язык НТМL дает простой формат для предоставления гипертекстовых, документов. Необходимо, чтобы все программы, совместимые с WWW, могли поддерживать язык НТМL. Он связывает Web-страницы в единое целое и предоставляет возможности для работы с гипертекстом и гипермедиа. Программы WWW используют протокол передачи гипертекста (НТТР), который позволяет передавать кодированную информацию между клиентом и сервером.

Гипертекст и гипермедиа являются для WWW фундаментальными технологиями. Гипертекст – это легкая в использовании, однако чрезвычайно мощная система связанных слов и фраз, позволяющая осуществлять навигацию между страницами. Эти слова представляют собой перекрестные ссылки на другие слова на других страницах и обычно выделяются на странице Web более ярким цветом.

Каталоги ресурсов представляют собой размещаемые в Сети базы данных с адресами ресурсов и различной информации о них. Каталоги бывают глобальные, локальные и специализированные. Имеют иерархическую структуру, перемещаясь по которой, можно легко найти нужный объект. Скорость накопления информации такими системами оказывается сравнительно низкой, поскольку в классификации ресурсов предполагается непосредственное участие человека.

Мощными информационно-поисковыми системами в среде WWW являются поисковые машины или автоматические индексы. Они размещаются на серверах и делятся на глобальные, локальные и специализированные поисковые машины. Поиск информации производится специальными программами-роботами в автоматическом режиме. Они непрерывно просматривают информацию, находящуюся в Сети и на основе заданных алгоритмов проводят индексацию документов. На основе созданных индексных баз поисковые машины предоставляют пользователю доступ к информации. Обращение к поисковым машинам производится с помощью поисковых запросов с использованием различных интерфейсов.

Баннерные информационные системы предназначены для перевода пользователя по гиперссылке на сервер рекламодателя. Баннеры состоят из специальных объектов, небольших графических изображений с рекламной целью на Web-узле.

Активные информационные каналы, предназначенные для поступления данных прямо на рабочее место пользователя и представляют собой специализированные Web-серверы. Активный Web-канал является информационным источником периодически обновляемых данных. Можно как подписаться на канал, так и остановить подписку.