Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Сетевой информационный поиск

..pdf
Скачиваний:
1
Добавлен:
12.11.2023
Размер:
15.52 Mб
Скачать

ГЛАВА 5

ВЫБОР ПОИСКОВЫХ МАШИН

/Русскоязычные и англоязычные поисковые машины

Регулярная работа по поиску информации в сетях требует выбо­ ра группы поисковых машин для постоянного пользования. Русско­ язычному пользователю важны, в первую очередь, русскоязычные машины. Кроме того, в силу передовых позиций СШ А на рынке ин­ формационных технологий и в связи с тем, что английский язык по­ всеместно используется и в информатике, и в науке, и в технике, и про­ сто при общении, ни один серьезный пользователь не может обойтись и без англоязычных машин. Ряд этих машин позволяют делать запро­ сы и получать ответы на русском языке, однако таких машин не очень много. В то же время знание англоязычных машин безусловно необхо­ димо практически всем пользователям, вне зависимости от степени владения ими английским языком. Естественно, в практической рабо­ те важны и те машины, которые используют также и другие рабочие языки, но без знакомства с ними обычно можно обойтись достаточно спокойно.

Любому пользователю, часто занимающемуся поиском и нацелен­ ному на определенные виды профессиональной деятельности, необхо­ димо ориентироваться на некоторую постоянную группу поисковых машин. Прежде всего, это несколько (две-три) русскоязычные маши­ ны самого широкого профиля с возможно большим охватом ресурсов. Аналогично нужно ориентироваться на примерно такое же количество англоязычных поисковых машин такого же универсального типа. Кро­ ме того, желательно выбрать для постоянного использования несколь­ ко машин, которым можно задавать вопросы на естественном языке, и несколько машин с четким отбором материала модераторами и нали­ чием рефератов, описывающих содержание ресурсов. Иногда полезно постоянно иметь в виду поисковые машины, ориентированные на спе­ циальные разделы: музыкальные записи, географические карты и т. д. Более активная и профессионально ориентированная работа требует знания адресов ряда специализированных машин и БД. Кроме того, полезны сведения о поисковых машинах, которые ориентированы на определенные регионы. Таким образом, набирается около двух десят­ ков машин, с которыми в той или иной форме пользователю постоянно приходится иметь дело. Это число близко к естественному пределу, оп­ ределяемому возможностью человеческой памяти. Если в двух, макси­ мум в трех десятках характеристик поисковых машин еще можно ори­ ентироваться, то большее их число становится запредельным и реально

Выбор поисковых машин

133

в работе без неких «восстановительных» мероприятий использовано быть не может.

В то же самое время количество различных поисковых машин ис­ числяется тысячами. Даже число чисто российских поисковых машин исчисляется десятками, если не сотнями. На этот кажущийся парадокс можно ответить очень просто: если существует огромное количество поисковых машин, значит, они кому-то нужны и кем-то используются. В самом деле, количество пользователей, которые постоянно обраща­ ются к поисковым машинам, исчисляется многими миллионами. Хотя каждый из пользователей замыкается на некоторый ограниченный по числу набор поисковых машин, эти наборы для разных пользователей разные. Поэтому задача каждого, кто часто занимается поиском инфор­ мации в электронных сетях, создать собственный лично ему удобный набор поисковых машин постоянного пользования, а это можно сде­ лать только на основании личного опыта. Мы можем только помочь несколькими достаточно очевидными практическими советами, кото­ рые опираются на наш собственный опыт. Особых законов и правил при этом не существует. Итак, какие же простейшие рекомендации можно предложить читателям пособия?

Набор русскоязычных поисковых машин должен включать в себя иерархию: общие машины, рецензируемые машины, профессио­ нально ориентированные машины и региональные машины.

Должен иметься набор адресов в иерархии аналогичных англо­ язычных поисковых машин. Необходимо иметь представление о том, какие англоязычные машины могут работать на русском язы­ ке.

Если вы владеете каким-либо иностранным языком помимо анг­ лийского, желательно подобрать группу машин, использующих этот язык.

Набор машин, отобранных для постоянной работы, желательно постоянно корректировать.

Не следует стремиться запомнить все адреса поисковых машин

иих характеристики. Можно создать небольшой личный ката­ лог характеристик и адресов поисковых машин, но самое важ­ ное — это иметь «каталог каталогов», то есть попросту список тех справочных файлов или каталогов, в которых можно быстро и легко отыскать адреса разных поисковых машин. Желательно, чтобы из такого каталога можно было бы непосредственно через гипертекстовую ссылку выйти на новую для вас поисковую ма­ шину

1 3 4

Глава 5

Эти советы довольно просты и очевидны, в связи с чем желательно придерживаться их в своей поисковой работе. При этом в первую оче­ редь следует уделять постоянное внимание обновлению репертуара ад­ ресов поисковых машин. Вся эта программа легко реализуется через Интернет. Отправной точкой при этом служат несколько «опорных» русско- и англоязычных поисковых машин. Выбор опорных поиско­ вых машин и определение отношения к ним — личное дело каждого пользователя. С накоплением опыта и сменой приоритетов оценка вами работы разных машин будет меняться. Практически почти все пользователи иногда по нескольку раз меняли свои приоритеты, и ни­ чего удивительного тут нет.

Если говорить о русскоязычных поисковых машинах, то все извест­ ные нам списки таких машин всегда начинаются с трех наиболее извест­ ных и популярных — Яндекс (http://www.yandex.ru), Рамблер (h ttp // www.rambler.ru) и Апорт (http://www.aport.ru). Ваша реальная оценка их возможностей сложится на основе опыта. Сравнительно недавно два известных российских ученых-медика обратились к авторам посо­ бия с просьбой собрать URL-адреса всех сайтов русскоязычного Ин­ тернета, в которых упоминаются их имена. Авторы провели поиск по всем трем упомянутым выше машинам. Результаты в основном совпа­ дали, но были и различия. Проведя аналогичные поиски по любым ключевым словам по нескольку раз, вы достаточно быстро сформируе­ те свое отношение ко всем машинам. Мы заранее можем сказать, что ваши приоритеты в пользовании машинами будет отличаться от при­ оритетов ваших коллег, что вполне естественно.

Три указанные выше поисковые машины можно использовать для отыскания других российских «поисковиков», для чего достаточно об­ ратиться к этим машинам с запросом типа российские поисковые маши­ ны или иным, похожим по смыслу. В ответ на такой запрос вы получите несколько адресов, в которых будут содержаться не только необходи­ мые вам URL-адреса, но и краткие характеристики большинства опи­ сываемых машин. Страницы, на которых приводятся адреса русско­ язычных машин, как это повсеместно бывает в Интернете, частично, а иногда и полностью, перекрываются по своему содержанию. Поэтому совсем не обязательно запоминать адреса всех каталогов. В большин­ стве из них одновременно с русскоязычными поисковыми машинами описываются и наиболее известные англоязычные машины, что вполне естественно.

Н аиболее простым и достаточно кратким каталогом адресов поис­ ковых машин является уж е упоминавшийся нами каталог, предназ­ наченный для студентов Ростовского педагогического университета

Выбор поисковых машин

135

http://edu.donpac.ru/search.html Он удобен тем, что русскоязычные и англоязычные поисковые машины в нем четко разделены, причем каж­ дой машине сопутствует краткая характеристика. В то же время неко­ торые материалы, размещенные на этой странице, уже устарели.

Вторым малообъемным каталогом русских и англоязычных поиско­ вых машин является страница Поисковые системы на сайте Российской национальной библиотеки (РН Б) (http://www.nlr.ru:8101/res/inv/ic/ search 1.htm). Непосредственно зайти на эту страницу не всегда просто, и поэтому лучше делать это, отправляясь от главной страницы РНБ.

Кроме трех упоминавшихся выше основных российских поисковых машин, с этой страницы можно выйти на не очень хорошо известные русскоязычные машины List, т (http:/www.list.ru) (старый адрес), (http:/ /win.mail.ru.8110/res/inv/ic/search1.htm) (новый адрес), Иван Сусанин (http://www.susanin.net), Улитка (http://ulitka.ru). Среди англоязыч­ ных машин, приводимых по этому адресу, отметим редко описывае­ мую в русскоязычном Интернете поисковую машину Google (http:// www.google.com). Эта машина работает и на русском языке, а все ресур­ сы, выдаваемые ею, просмотрены и прорецензированы высококвали­ фицированной группой модераторов. Полезно также запомнить адрес http://vampire.ami.nstu.ru/intemet_search/serarch.htm, где приводится много полезных данных о наиболее известных поисковых машинах. Русскоязычные и англоязычные поисковые машины на этом сайте опи­ саны вперемежку, а количество англоязычных поисковых машин су­ щественно преобладает над количеством русскоязычных. Информа­ ция о машинах достаточно краткая, но в целом полезная.

М ожет оказаться полезным заглянуть на http://www.rinet.ru:8080/ buki/slistsur.html, а также и на http://www.dtforum.ru/intemet/search/ our.shtml. Данные на последней из приводимых страниц не обновляют­ ся уже с января 1998 г. и изрядно устарели. Можно обратиться также к сайту Поиск (http://find.ru), однако особо ценных данных на нем мало. Упомянем также не так давно появившуюся поисковую машину Пунто (http://www.punto.ru).

Если вас интересуют региональные поисковые системы, можно обра­ титься к сайту Местные поисковые системы (http://www.rinet.ru:8080/ buki/slistloc.html), где имеются данные о поисковых машинах Москвы, Санкт-Петербурга, Воронежа, Дальнего Востока, Ижевска, Красноярска, Липецка, Нижнего Новгорода, Новосибирска, Перми, Татарстана и Уд­ муртии. В отличие от западных каталогов, перечень регионов России здесь далеко не полный. В этом, однако, нельзя упрекать авторов — пер­ вопроходцев в этой области. Пожалуй, одним из наиболее полных ката­ логов русскоязычных поисковых машин является http://www.catalog.

136 Глава 5

freeservers.com/catalog1Mm. Полезно знать также адрес http://www. rambler.de. Здесь представлены те русскоязычные сайты, которые име­ ются в поисковых машинах немецкого Интернета.

Число адресов подобного типа можно без труда увеличить, однако, по нашему мнению, делать это нецелесообразно — так же, как нецеле­ сообразно переписывать из всех каталогов адреса и характеристики по­ исковых машин. Все равно при этом никогда не будет уверенности ни в полноте данных, ни в их новизне и полезности.

Множество адресов в каталогах долж но быть структурировано. Описание различных машин в каталогах выполняется обычно квали­ фицированно, а на сбор и оформление информации затрачивается, ес­ тественно, много труда. Основным недостатком приводимых сведений о машинах является то, что подход к их описанию осуществляется с точки зрения программиста. Почти всегда указываются охватываемый машиной объем ресурсов, тип машины (каталог, индекс), указывается на то, какие операторы булевой алгебры можно использовать в конк­ ретной машине, сравниваются результаты поиска при постановке зап­ роса в разных кириллических кодировках. Ценность и полезность этих сведений очевидна, но рядового пользователя чаще интересует, какие запросы удобнее ставить, в каком случае к какой машине следует обра­ титься, на каких машинах производится квалифицированный анализ размещаемых ресурсов и тому подобные сведения. Отсутствие необ­ ходимых для этого данных — это некоторый этап формирования ин­ формационного пространства, которое русскоязычный Интернет еще не прошел. Для перехода к следующему этапу необходимо, чтобы ав­ торы каталогов «приняли позицию пользователя», что психологичес­ ки не так просто, как кажется на первый взгляд.

В англоязычном Интернете такая позиция развилась в связи с ши­ роким распространением учебных материалов по пользованию И нтер­ нетом, которые размещены на ряде американских университетских серверов. Они предназначены и для будущ их специалистов широкого профиля, и для специалистов в области применения вычислительной техники в библиотечном деле. Желающие более подробно ознакомить­ ся с учебными планами подготовки по таким специальностям могут посетить соответствующий сайт Мичиганского университета {h ttp :// www.si.umich.edu). Мы советуем также обратиться к материалам уже не раз упоминавшегося нами сайта колледжа Университета штата Нью-Йорк в г. Олбани (http://library.albany.edu/intemet). О сновной особенностью учебных материалов подобного плана является состав­ ление таблиц, в которых тип запроса сопоставляется с теми поисковы­ ми машинами, которые целесообразно использовать в соответствую ­

Выбор поисковых машин

137

щем случае. Одновременно приводятся и таблицы соответствия фор­ мального языка запроса с теми поисковыми машинами, где соответ­ ствующий запрос используется. Имеется и ряд других аналогичных таблиц, структура которых такова, что одна и та же поисковая машина может встречаться в ее пределах по нескольку раз. При желании эти таблицы с их гипертекстовыми ссылками на поисковые машины могут служить хорошим справочником для подбора подходящих англоязыч­ ных поисковых машин.

Естественно, что и среди англоязычных машин есть те, которые мо­ гут считаться основными, занимая лидирующее положение в этом сек­ торе. Две из них хорошо известны в России — каталог Yahoo (http:// www.yahoo.com) и AIta Vista (http://www.altavista.com). Эти машины, точ­ нее их создатели, известны еще и тем, что они обеспечивают работу своих систем и на некоторых других языках помимо английского. Так, например, во Франции хорошо известен адрес Yahoo France (h ttp // www.yahoo.fr) . Так же организована работа и многих других крупных поисковых систем, в частности Lycos и Excite. Примеры таких много­ язычных поисковых систем легко умножить. Среди англоязычных ма­ шин, допускающих запросы на естественном языке, отметим уже не раз упоминавшуюся нами AskJeeves (http://www.ask.com). Из машин, на ко­ торых рецензируются материалы, отметим многоязычную Google (h ttp // www.google.com). Эта машина характерна еще и тем, что в настоящее вре­ мя она охватывает, пожалуй, наибольшее количество ресурсов. Есте­ ственно, такие соотношения время от времени меняются. Кроме того, качество машины это не только количество ресурсов, но и характер их структурирования. Тем не менее, на нынешний момент времени Google

действительно одна из наиболее полезных поисковых англоязычных машин. Нельзя также не упомянуть машину с рецензируемыми матери­ алами Магеллан, которую часто рекомендуют в русскоязычных и англо­ язычных руководствах по поиску в Интернете. Машинадействительно очень хорошая, однако искать ее под этим названием уже бесполезно, так как сравнительно недавно она стала называться Overtureи обращать­ ся к ней теперь нужно по адресу http://www.overture.com.Известной ком­ панией, где списки тематических ресурсов составляются и обновляют­ ся большой группой экспертов, является The Mining Company (h ttp // www.miningco.com). Мы уже писали об этом сервере как о месте, где легко найти географические карты и сведения по некоторым мало известным широкому российскому пользователю системам библиотечно-библио­ графической классификациям. Без особых пояснений приведем адреса некоторых известнейших англоязычных поисковых машин, не приводя их характеристик (этот список ни в коей мере не претендует на полноту).

138

Глава 5

Hot Bot (http://hotbot.lycos.com)

Excite (http://www.excite.com)

Infoseek (http://infoseek.go.com)

Northern Light (http://www.northemlight.com)

All the Web, All theTime (http://www.altheweb.com) (многоязыч­ ная)

Librarian Index to the Internet (http://lii.com) (около 8600 анноти­ рованных ресурсов)

Meta Crawler (http://www.metacrawler.com).

Очень хороший список адресов англоязычных поисковых машин под названием WWW Indices and Search Engines — индексы и поисковые ма­ шины в WWW приводится на http://www.tiyp.com/public/indicies. Все приводимые данные разбиты на три группы: поисковые машины, маши­ ны для метапоиска и машины для нахождения персональных сведений (например, адресов электронной почты). Самые подробные данные о поисковых машинах 181 страны мира можно отыскать по адресу h ttp // www.searchnet.ginescolosus.com. Существуют и многие другие справоч­ ные каталоги, для нахождения которых в какую-либо из наиболее изве­ стных поисковых машин (лучше англоязычных) можно ввести запрос типа « German Searching Engines». Уверяем вас, что количество ответов может заметно превзойти ваши ожидания.

Очень часто при широком бытовом поиске интересуются биография­ ми тех или иных личностей. В этом случае мы рекомендуем обратиться к адресу h ttp //www.biography.com.Orporo говоря, это уж е не поисковая машина, а специализированная база данных, однако к поиску биографий обращаются столь часто, что мы решили привести этот адрес в данном разделе.

Поисковые машины стран СНГ и Балтии

В большинстве стран СНГ в поисковых машинах используется русский язык (по крайне мере, в качестве альтернативного). Более того, программы-спайдеры русскоязычных поисковых машин заходят во мно­ гие каталоги и индексы этих стран. В силу ряда объективных обстоя­ тельств авторы некоторых электронных ресурсов стран СНГ стремятся разместить их в российском Интернете. Каждый, кто неоднократно про­ водил поиск с помощью русскоязычных поисковых систем, не раз встре­ чался с материалами украинского или белорусского Интернета. В связи с этим возникает вопрос о том, насколько необходимо знание адресов поисковых машин стран СНГ. Действительно, очень много поисковых

Выбор поисковых машин

139

задач можно безболезненно решить, не обращаясь к этим поисковым каналам, которые иногда рассматривают просто в качестве некоторого дополнения к русскоязычным материалам. На самом деле это не совсем так. Даже в пределах России на региональных машинах можно найти много интересных сведений, не охватываемых даже самыми мощными поисковыми машинами. Если же речь идет о том, что мы назвали Deep Web, то количество оригинальных ресурсов, которые можно найти в рос­ сийских региональных поисковых системах, значительно возрастает.

Поисковые системы стран СНГ и особенно стран Балтии по сравне­ нию с российскими региональными поисковыми системами намного более богаты оригинальными ресурсами. Существуют группы проблем, которые в российском Интернете вообще не освещены или освещены слабо и которые прекрасно представлены в электронных хранилищах наших ближайших соседей. По этой причине знание адресов основных поисковых машин этих стран является желательнымдля многих пользо­ вателей.

По всей вероятности, одним из наиболее подробных каталогов адре­ сов поисковых систем стран СНГ и Прибалтики является сайт Поиско­ вые системы и каталоги стран СНГиПрибалтики {http://book.promo.ru/ book/article5_8). Он входит в состав Энциклопедии Интернет-Рекла­ мы под редакцией Тимофея Бокарева. Поскольку автор не разрешает перепечатку этого материала, мы даем только ссылку на его URL-ад­ рес. Н иже приводятся некоторые основные данные необходимых от­ правных адресов.

На Украине важнейшими поисковыми системами являются:

The List of Ukrainian W W W Servers (http://weblist.gu.net);

UAHOO (http://uahoo.gu.net);

Search the Ukrainian Net Resourses (http://win-el.visti.net);

Sesna {http://sesna.kharkiv.org).

На Украине имеются также региональные серверы районов Азовс­ кого моря и Крымской области. При желании можно обратиться так­ же к Системе рейтингов Index99 (http://www.idndex99.kiev.ua). В этой системе приводятся главным образом рейтинги для разных малоизве­ стных серверов России и Украины, основанные на подсчете числа по­ сещений. Тем не менее эти данные можно использовать в качестве ис­ точника UR L -адресов.

Интересующимися поисковыми системами Белоруссии рекоменду­ ем обратиться по адресам:

All By {http://www.all.by);

Home Links (http://search.home.by/links);

140

Глава 5

UNIBEL (http://search.unibel.by);

W W W -серверы (,http://www.bussinfo.ru/resources/resources_belorus.htm);

www.open.by (http://www.09.open.by);

Belorussian Internet Resources (http://www.belorus-online.com/ru);

Всеобщий регистр белорусских W W W ресурсов (,http://www.ecopress.org.by/search);

So Net Informative System (http://www.belsonet.net/sonet.htm);

Belarus Web Links

(http://www.ruf.rice.edu/~sergei/links/bellinks.html);

Belarusian Web Sites

(http://www.data.minsk.by/info/belsite_r.html);

W W W в Белоруси (http://wvm.belpak.vitebsk.by/webbel/_r.html).

Если при обращении к поисковым машинам Украины и Белорус­ сии особых языковых проблем не возникает (и украинский, и бело­ русский языки в объеме, необходимом для работы, будут вам всегда понятны), то для остальных стран СНГ языковые проблемы могут ока­ заться существенными. Многие поисковые машины остальных стран СНГ в качестве стартового языка используют английский, однако кноп­ ки перехода к русскому языку почти всегда присутствуют. В то же вре­ мя на поисковых машинах стран Прибалтики можно встретиться с си­ туацией, когда используется только национальный язык, а английского и русского языка нет вообще (именно по этой причине мы приводим весьма ограниченное число адресов машин этих стран). При их выборе мы прежде всего стремились дать адреса тех машин, где заведомо ис­ пользуется русский язык. Отметим также, что ряд машин работает не очень устойчиво. К какой стране относится каждая приводимая маши­ на, понять не сложно. Начнем со стран СНГ:

M oldova Internet Resources (http://www.oumet.md);

Moldova, net (http://www.moldova.net/maps/);

Georgia Net (http://www.georgia.net.ge);

Armenian Sites on the Web

(http://www.arminco.com/Armenia/Web);

Интернет в Узбекистане

(http://www.naytov.com/inks/intm_search.htmJ);

Kazakstan online (http://www.welcome.to/kazakstan);

Весь W W W -Казахстан (http://wxem.size.kz/KAZwww);

Казахстанские серверы и страницы (http://www.kz/rus/spisok);