Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 9(сети).doc
Скачиваний:
22
Добавлен:
11.06.2015
Размер:
197.12 Кб
Скачать

Что можно найти в Web

Все, что угодно: от простых текстовых документов до сложнейших мультимедийных приложений с применением технологий Java и ActiveX. Сказать, что Web расширил наши возможности легко и быстро получать доступ к информации, значит, не сказать ничего. Иметь доступ в Web — это все равно, что иметь на своем столе всю библиотеку Конгресса США, и даже больше того.

Со времени своих первых скромных шагов Web прошел длинный путь развития. Термин "гипертекст" впервые применил Тед Нельсон (Ted Nelson), включивший его в свой проект программного обеспечения Xanadu. Общепризнанный ясновидец Тим Бернерз-Ли (Tim Berners-Lee), которого называют отцом Internet, впервые применил при создании World Wide Web интерактивную технологию. В настоящее время Бернерз-Ли продолжает активно работать в консорциуме World Wide Web — международной организации, разрабатывающей и утверждающей стандарты Web.

Кто использует Web

Постепенно и неуклонно пользователем Web становится каждый житель Земли. В настоящее время доступ к Web почти обязателен для любого бизнеса. Личные и семейные Web-страницы теперь уже никого не удивляют. Даже те, у кого их нет, интенсивно роются по чужим страницам в поиске выгодных предложений.

Организация NSFNET (National Science Foundation Network) собирала и обрабатывала статистические данные о потоках информации по магистрали Internet до 1995 года, т.е. до того момента, когда NSF (National Science Foundation) перестал курировать магистраль и передал ее коммерческим организациям. Согласно данным NSFNET по состоянию на июнь 1993 года на Web приходилось только 0,5% потоков информации Internet. К марту 1995 года эта величина выросла до 23,9%. Согласно обзору NUA — общепризнанной консультационной компании Internet — в апреле 2000 года в США около 52% частных домов имели доступ к Web. По сведениям многих источников количество страниц, передаваемых серверами Web, удваивается приблизительно за год. На январь 2000 года серверы Web содержали 2 млрд страниц и около 450 млн изображений. Естественно, эти оценки не остаются постоянными — ежедневно добавляются сотни и тысячи новых страниц, а старые постоянно модифицируются или удаляются.

Цены на персональные компьютеры постоянно снижаются, и подключение к Internet сейчас может позволить себе почти каждый. Некоторые компании даже предлагают бесплатное подключение, для них оно окупается за счет рекламы. К Internet подключается все больше "простых" людей. Школы устанавливают подключенные к Internet компьютеры в классах, а в курс обучения вводят уроки компьютерной грамотности. Получают все большее распространение Internet-кафе, в которых пользователи могут получить доступ к Internet за определенную плату.

Те, кто имеет доступ к Internet, пользуются услугами Web в самых разных целях и часто даже ежедневно. Потребители с помощью Web знакомятся с предлагаемыми товарами и делают покупки. Научные работники и студенты ищут в Web нужные им публикации. Учителя с помощью Web распространяют списки рекомендуемой литературы и учебные материалы. Туристы заказывают билеты и бронируют места в гостиницах. Пациенты ищут сведения о своих болезнях и методах лечения. Представители бизнеса изучают с помощью Web конъюнктуру рынка, ищут сведения о конкурентах, рекламируют и продают свои товары и услуги.

Web неуклонно превращается в технологию, меняющую общество и жизнь каждого из нас не менее радикально, чем в свое время это сделали электричество или телефон. Теперь уже легче ответить на вопрос, кто не использует Web, чем на вопрос, кто использует Web.

Поиск информации в Web

Невероятное количество самой разнообразной информации стало не только главным достоинством Web, но и породило серьезные проблемы. Найти все данные по нужной тематике, причем только самые необходимые, совсем непросто. Для этого используются поисковые службы, метапоисковые службы и порталы.

Поисковые службы

В попытках облегчить поиск в Web нужной информации разработаны сотни различных поисковых служб. Поисковая служба представляет собой Web-узел с интерактивной индексированной базой данных, в которой Web-узлы классифицированы, как правило, с помощью метадескрипторов. Метадескрипторы — это ключевые слова, добавленные Web-дизайнером. Согласно www.wwwmwtric.com (на этом узле приводится статистическая информация по Web) к услугам поисковых служб прибегают 85% пользователей, однако индексированы поисковыми службами лишь 20% общедоступных Web-узлов.

Первой солидной поисковой службой была Yahoo (www.yahoo.com), которая и сейчас пользуется большой популярностью. Ниже приведен список наиболее часто посещаемых поисковых служб.

  • Lycos (www.lycos.com).

  • DirectHit (www.directhit.com).

  • Excite (www.excite.com).

  • AltaVista (www.altavista.com).

  • Northern Light (www.northern light.com)-

  • Google (www.google.com).

Принцип действия большинства поисковых служб основан на анализе ключевых слов, или метадескрипторов, добавленных к HTML-страницам их разработчиками. Эти ключевые слова представляют собой технические или научные термины, по которым пользователь вручную искал бы материалы с нужной ему тематикой в реферативных журналах. Допустим, что пользователь хочет найти что-нибудь о разведении сиамских котов. В этом случае его заинтересуют страницы HTML с ключевыми словами "кот", "сиамский", "разведение" или "сиамский кот".

В поисковых службах применяются приведенные ниже компоненты.

  • Паук (spider). Программа, "путешествующая" по различным Web-узлам и собирающая индексную информацию.

  • Индексная база данных. База данных, в которой хранится индексная информация, собранная пауком.

  • Механизм поиска и выдачи результатов. Программы интерфейса между пользователями и поисковой службой, с помощью которых пользователи задают свои вопросы и получают ответы.

Некоторые поисковые службы могут в поиске ключевых слов перебирать не только метадескрипторы HTML-страниц, но и весь текст страниц. Это значительно увеличивает количество найденных страниц, но среди них будет намного больше ненужных. Пусть, например, пользователь ищет рецепт торта и поисковая служба нашла ему все страницы HTML, в тексте которых встречается слово "торт". Очевидно, что подавляющее большинство страниц будут содержать не кулинарные рецепты, интересующие пользователя, а все, что угодно, включая детективы и последние новости. Такой поиск может оказаться бесполезным, потому что в предложенных пользователю страницах HTML найти интересующие его кулинарные рецепты будет практически невозможно.

Повысить эффективность поиска можно путем правильного использования алгоритмов поисковой службы. Чаще всего в алгоритмах поиска используются логические функции И, ИЛИ и НЕТ. Вернемся к нашему примеру с тортом. Круг поиска значительно сужается, если в строке запроса ввести "торт И рецепт". В этом случае поисковая служба отбросит страницы, в которых есть торты, но нет рецептов, и страницы, в которых есть рецепты, но нет тортов.

Большинство поисковых служб не могут индексировать содержимое Web-узлов, защищенных паролем. Еще нужно учитывать, что после загрузки документа на Web-cepeep пройдет некоторое время, прежде чем его индексирует какая-либо поисковая служба. Поэтому в базах данных поисковых служб обычно нет документов, загруженных недавно.

Мета поисковые службы

Эти службы обобщают информацию, собранную поисковыми службами. Перечислим наиболее популярные метапоисковые службы.

  • MetaCrawier (www.metacrawler.com).

  • SawySearch (www.savvysearch.com).

  • Ask Jeeves (www.askjeeves.com).

Метапоисковые службы не поддерживают собственные индексные базы данных. Они пользуются базами данных других поисковых служб, анализируют накопленную в них информацию и обобщают ее в одном всеобъемлющем списке. Изощренные программы метапоисковых служб способны обнаруживать и устранять повторяющиеся результаты.

Web-порталы

Многие поисковые службы работают как Web-порталы. Портал — это Web-узел, который может служить для пользователей "стартовой страницей", т.е. точкой, с которой пользователь часто начинает просмотр интересующих его материалов. Пользователи могут настраивать свои стартовые страницы соответственно своим интересам. Например, можно задать вывод в такой странице местных новостей или прогноза погоды в своем регионе. Можно выбрать также специфические темы, например спортивные новости, коммерческая информация или местные развлекательные мероприятия. Текущее состояние порталов постоянно обновляется, так что их пользователи всегда имеют самую свежую информацию.

Провайдеры услуг Internet предлагают своим пользователям собственные порталы.