Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Интернет технологии.doc
Скачиваний:
19
Добавлен:
10.05.2015
Размер:
1.28 Mб
Скачать

Содержание отчета

  1. Схема связи с удаленным ресурсом через сеть Интернет

  2. Инструкция по организации гиперссылок между страницами сайта.

  3. Выводы по условиям и возможностям использования макетов web-страниц при создании оригинального сайта.

Вопросы к защите

  1. Преимущества размещения информации в Интернет

  2. Общие принципы организации баз данных в Интернет

  3. Многозвенные архитектуры информационных систем

  4. Структура URL.

ЛАБОРАТОРНАЯ РАБОТА № 6

Поиск информациии в сети интернет

Цель работы: Ознакомиться с особенностями, методами и приемами поиска информации в сети Интернет, используя различные ресурсы Интернет

МЕТОДИЧЕСКИЕ МАТЕРИАЛЫ

Поиск в Интернете можно назвать эффективным, когда вы находите нужную информацию за минимальное возможное время или убеждаетесь, что такой информации нет (но на самом деле, возможно, что вы неправильно ее искали).

Способов поиска информации множество. Обычно под эти подразумевают поиск с помощью поисковых систем: информационно-поисковых машин (ИПС) и каталогов. Существует и более подробная классификация (в скобках указаны случаи, когда такой способ поиска наиболее применим):

  1. Поиск с помощью поисковых машин (конкретные вещи)

  2. Каталоги и коллекции ссылок (более общие понятия)

  3. Рейтинги (самые популярные ресурсы)

  4. Конференции, чаты и страницы ссылок ("Linkz") на тематических сайтах (редкие, специализированные вещи)

  5. Несетевые методы (советы друзей, знакомых; реклама в печатных изданиях)

Рис. 6.1. Типовая схема информационно-поисковой системы.

Client (клиент)на схеме (см. рис.6.1) - это программа просмотра конкретного информационного ресурса. Наиболее популярны сегодня мультипротокольные программы типаNetscape Navigator. Такая программа обеспечивает просмотр документовWWW, Gopher, Wais, FTP-архивов, почтовых списков рассылки и групп новостей Usenet. В свою очередь все эти информационные ресурсы являются объектом поиска информационно-поисковой системы.

User interface (пользовательский интерфейс) - это не просто программа просмотра, в случае информационно-поисковой системы под этим словосочетанием понимают также способ общения пользователя с поисковым аппаратом: системой формирования запросов и просмотров результатов поиска.

Search engine (поисковая машина) - служит для трансляции запроса на информационно-поисковом языке (ИПЯ), в формальный запрос системы, поиска ссылок на информационные ресурсы Сети и выдачи результатов этого поиска пользователю.

Index database (индекс базы данных) - индекс, который является основным массивом данных ИПС и служит для поиска адреса информационного ресурса. Архитектура индекса устроена таким образом, чтобы поиск происходил максимально быстро и при этом можно было бы оценить ценность каждого из найденных информационных ресурсов сети.

Queries (запросы пользователя) - сохраняются в его (пользователя) личной базе данных. На отладку каждого запроса уходит достаточно много времени, и поэтому чрезвычайно важно запоминать запросы, на которые система дает хорошие ответы.

Index robot (робот-индексировщик) - служит для сканирования Internet и поддержания базы данных индекса в актуальном состоянии. Эта программа является основным источником информации о состоянии информационных ресурсов сети.

WWW sites - это весь Internet или точнее - информационные ресурсы, просмотр которых обеспечивается программами просмотра

В классификационныхИПС используется иерархическая (древовидная) организация информации, которая называетсяклассификатором. Разделы классификатора называютсярубриками. Библиотечный аналог классификационной ИПС - систематический каталог. Классификатор разрабатывается и совершенствуется коллективом авторов. Затем его использует другой коллектив специалистов, называемыхсистематизаторами, которые, зная классификатор, читают документы и приписывают им классификационные индексы, указывающие, каким разделам классификатора эти документы соответствуют.

Проблемы, связанные с использованием классификационных ИПС, привели к созданию информационно-поисковых систем словарного типа, с обобщенным англоязычным названием search engines. Основная идея словарной ИПС - создать базу данных из слов, встречающихся в документах Интернета, в которой при каждом слове будет храниться список документов, из которых взято данное слово.

Поскольку все морфологические единицы в словаре упорядочены, большинство слов (и словоформ) в естественных языках упоминается не часто, а союзы, предлоги и артикли в поиске не участвуют, то поиск нужного слова может выполняться достаточно быстро - без последовательного просмотра. А наличие списков документов, в которых встречается искомое слово, позволяет ИПС выполнять операции с этими списками - их слияние, пересечение или вычитание.

В языке (составления) запросов словарных ИПС используются три логических оператора: ИЛИ, И и И-НЕ («но без»); как правило, эти операторы обозначаются одним из следующих способов:

Оператор

Полное обозначение

Сокращенное обозначение

Обозначение при простом поиске (кроме российской ИПС Rambler)

ИЛИ

OR

|

пробел

И

AND

&

+

И-НЕ

AND NOT

&!

-

Эти операторы имеют приоритет. Логические операторы в группе выполняются в порядке, соответствующем приоритету каждого из них (прежде всего выполняется И-НЕ, затем - И и лишь потом - ИЛИ), поэтому для составления сложных запросов могут использоваться. Как правило, словарные ИПС Интернета предоставляют пользователям два интерфейса - режим «сложного запроса» («advanced search»), в котором доступны все логические операторы, и режим простого поиска, в котором обычно невозможно использование скобок и, следовательно, допустимы не все сочетания операторов.

Некоторые информационно-поисковые системы Интернет

Название ИПС

URL

Местоположение

Классификационная

Словарная

Yahoo!

http://www.yahoo.com/

США

+

 

Infoseek

http://www.infoseek.com/

США

+

+

AltaVista

http://www.altavista.digilal.com/

США

+

+

AltaVista

http://www.altavista.telia.com/

Европа

 

+

Ay

http://www.au.ru/

Россия

+

 

Созвездие Интернет

http://www.stars.ru/

Россия

+

 

Rambler

http://www.rambler.ru/

Россия

+

+

Апорт

http://www.aport.ru/

Россия

 

+

Яndех

http://www.yandex.ru/

Россия

 

+

Две российские ИПС: Яndex и «Апорт» «знают» русскую грамматику и в словаре хранят только так называемую нормальную форму слова (для существительного - именительный падеж единственного числа). Эти системы допускают написание запроса на естественном языке, нормализуя термины запроса, тем самым существенно упрощая поиск в русскоязычном Интернете

Некоторые рекомендации по формированию запроса.

  1. Чтобы решить задачу поиска нужной информации, важно точно сформулировать запрос.

  2. Осуществляя поиск, уместно идти от общего к частному. То есть, начав поиск с более широкого понятия, двигаться вглубь, постепенно уточняя запрос.

  3. Не рекомендуется применять некоторые символы: &,%,$,/,#,_. Они могут быть восприняты программой поиска как специальные модификаторы запроса.

  4. Приступая к решению задачи поиска, не доверяйте всю работу системе. Отсутствие нужного документа в базе данных поисковой системы вовсе не означает, что его не существует в Интернет.

  5. Если возникнут проблемы - поищите подсказку, наверняка найдется страница, объясняющая, как правильно составить запрос.

  6. Нельзя забывать и о кодировках русских букв. Помните: в какой кодировке Вы введете запрос, в той и получите результат. Поскольку некоторые документы в российской части Интернет могут существовать лишь в одной кодировке, для более полного охвата придется повторить поиск дважды - один раз в кодировке Win-1251, а другой - в KOI8-R (вообще-то, хороший поисковый сервер учитывает эти особенности сам).

  7. Просматривая результаты поиска, не ограничивайтесь первыми 10-20 web-страницами, найденными поисковой машиной. Отнюдь не факт, что на первых страницах, результатов поиска, поисковая машина дает ссылки на те web-страницы, которые наиболее подходят под ваш запрос, так как в конце списка могут быть хорошие документы просто потому, что много web-страниц на эту тему или потому, что первые места в "хит параде" заняты страницами, которые созданы специально, чтобы попадать в "хит парад".

  8. Если вам понравились результаты вашего поиска, не поленитесь и скопируйте текст вашего запроса в простой текстовый файл. Авось еще пригодится. Чтобы повторить этот же поиск или можно использовать как образец.