Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Сетевой информационный поиск

..pdf
Скачиваний:
1
Добавлен:
12.11.2023
Размер:
15.52 Mб
Скачать

Российская академия естественных наук Северо-Западное отделение образования и развития науки

В. Н. Романенко, Г. В. Никитина

СЕТЕВОЙ ИНФОРМАЦИОННЫЙ ПОИСК

Практическое пособие

ЩШ1ШШ

Санкт-Петербург

2005

УДК 01 (075.8) ББК 73я 73 Р69

РоманенкоВ. Н., Никитина Г. В.

Р69 Сетевой информационный поиск: Практ. пособие / В. Н. Романен­ ко, Г. В. Никитина; Российская академия естественных наук. Севе­ ро-Западное отделение образования и развития науки. — СПб.: «Профессия», 2005. — 288 с.

ISBN 5-93913-044-5

Впредлагаемом пособии освещаются возможности поиска информации

идокументов в Интернете. Рассматриваются принципы и особенности хране­ ния документов в электронных сетях, наиболее рациональные приемы поиска различных видов документов, методика формулировки запросов и принципы выбора поисковых машин. Одна из глав посвящена характеристике электрон­ ных каталогов крупнейших библиотек мира, описаны их поисковые возмож­

ности.

Издание предназначено для студентов высших и средних учебных заведе­ ний, аспирантов и преподавателей школ, колледжей и вузов. Оно может быть также полезно библиотекарям и библиографам библиотек различных типов, осуществляющим информационно-библиотечное обслуживание с использо­ ванием электронных сетей.

ISBN 5-93913-044-5

УДК 01 (075.8) ББК 73я 73

© Издательство «Профессия», 2005

Содержание

 

К чи тател ю ................................................................................................................

5

ВВЕДЕНИЕ, ПОСВЯЩЕННОЕ ПОЛЕЗНЫМ СОВЕТАМ..................................

13

Как разумнее пользоваться данным учебным пособием.......................

13

Как правильно транслитерировать русский текст и где и как надо

 

учитывать различные кодировки русского алфавита...........................

16

Некоторые вопросы, связанные с терминологией, применяемой

 

в сетевых адресах...............................................................................

25

Несколько замечаний, полезных в практической работе......................

31

ГЛАВА 1. ИНФОРМАЦИЯ И ДОКУМЕНТЫ..................................................

35

Понятие «информация»......................................................................

36

Связь информации с ее носителем......................................................

39

ГЛАВА 2. ПРИНЦИПЫ ХРАНЕНИЯ И ОСОБЕННОСТИ ХРАНЕНИЯ

 

ДОКУМЕНТОВ В ЭЛЕКТРОННЫХ СЕТЯХ................................................

41

Условия правильного хранения документов........................................

42

Системы классификации документов и электронных ресурсов.............

45

Каталоги поисковых систем Интернета................................................

54

Некоторые особенности ресурсов Интернета......................................

61

ГЛАВА 3. ОРГАНИЗАЦИЯ ПОИСКА ДОКУМЕНТОВ И РЕСУРСОВ.................

67

Поисковый запрос и схема его исполнения.........................................

68

Типы поиска, которые используются в практической работе...............

70

Основные характеристики ресурса и документа, используемые

 

при поисковых запросах.....................................................................

73

Ответ на поисковый запрос.................................................................

78

Оценка эффективности поиска ресурса..............................................

82

Виды сетевой информации и некоторые способы ее получения........

90

ГЛАВА 4. ПОИСКОВЫЕ СИСТЕМЫ И ВЫПОЛНЕНИЕ БЫТОВОГО ПОИСКА ...

97

Работа поисковых систем...................................................................

98

Как правильно приступить к поиску и какую поисковую машину

 

лучше выбрать?.................................................................................

101

Поиск при запросах на естественном языке.................................

105

Проблемы, возникающие при ничем не ограниченном поиске

 

по ключевым словам....................................................................

112

Правильное составление поискового запроса на основе

 

ключевых слов............................................................................

115

Поиск данных в определенных зонах ресурса

 

и элементах его адреса................................................................

125

Вывод результатов поиска............................................................

128

Несколько кратких замечаний по поводу

 

Интернет-магазинов.........................................................................

130

ГЛАВА 5. ВЫБОР ПОИСКОВЫХ МАШИН.................................................

131

Русскоязычные и англоязычные поисковые машины.........................

132

Поисковые машины стран СНГ и Балтии.............................................

138

4

__________________Содержание

 

Поисковые машины, работающие на немецком, французском

 

 

и испанском языках...........................................................................

141

ГЛАВА 6. ПОИСК В ОНЛАЙНОВЫХ КАТАЛОГАХ УНИВЕРСАЛЬНЫХ

 

 

И СПЕЦИАЛЬНЫХ БИБЛИОТЕК..........................................................

147

 

Поисковые библиотечные системы....................................................

148

 

Как лучше всего освоить работу с каталогами различных библиотек ...

156

 

Работа с электронными каталогами Библиотеки конгресса СШ А.......

166

 

Работа с электронными каталогами национальных российских

 

 

и академических библиотек...............................................................

188

 

Поиск в каталогах ряда ведущих российских библиотек

 

 

и библиотек стран СНГ.......................................................................

200

 

Электронные каталоги ряда ведущих и национальных библиотек

 

 

некоторых западных стран.................................................................

209

 

Каталоги и другие материалы научных организаций и учебных

 

 

заведений, а также общедоступных библиотек...................................

218

 

Поиск URL-адресов библиотек мира...................................................

229

ГЛАВА 7. ПОИСК ЖУРНАЛЬНЫХ СТАТЕЙ И ОТЧЕТОВ О НИР.

 

 

РАБОТА С БАЗАМИ ДАННЫХ, ЭНЦИКЛОПЕДИЯМИ, ЭЛЕКТРОННЫМИ

 

 

ИЗДАНИЯМИ, ЭЛЕКТРОННЫМИ БИБЛИОТЕКАМИ И НОВОСТНЫМИ

 

 

САЙТАМИ...........................................................................................

233

 

Поиск журнальных статей..................................................................

234

 

Поиск информации в специализированных базах данных..................

239

 

Сетевой поиск отчетов о НИР и депонированных рукописей..............

245

 

Сетевой поиск патентов, стандартов и строительных норм.................

247

 

Поиск данных в электронных энциклопедиях, словарях

 

 

и справочниках..................................................................................

252

 

Поиск информации в электронных журналах, архивах

 

 

и электронных библиотеках...............................................................

260

 

Поиск новостей..................................................................................

270

ГЛАВА 8. ОСОБЕННОСТИ РАБОТЫ ЭЛЕКТРОННЫХ ПОИСКОВЫХ

 

 

СИСТЕМ И ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ......................................

273

 

Новые возможности сетевого поиска.................................................

274

 

Автоматическое цитирование, составление личных

 

 

библиографических каталогов и цитирование

 

 

электронных документов....................................................................

276

 

Некоторые психологические особенности работы

 

 

с поисковыми программами...............................................................

281

 

Самопроверка степени освоения приобретенных поисковых

 

 

навыков .............................................................................................

282

 

Рекомендуемая литература................................................................

284

 

Приложение.......................................................................................

285

 

Электронные адреса крупнейших национальных библиотек мира ....

285

 

Электронные адреса федеральных информационных центров

 

 

и федеральных библиотеки России...............................................

285

/К читателю

Тот фа1сг, что наше время характеризуется широким повсемест­

ным распространением информационных технологий, наверняка не вызывает ни у кого сомнений. Даже люди, достаточно далекие от И н­ тернета или различного рода расчетов и компьютерных эксперимен­ тов, не раз слышали об этих технологиях или видели компьютерную графику на экране телевизора. Тем не менее ясное представление о реальных возможностях информационных технологий оставляет ж е­ лать лучшего. Часто те, кто овладел компьютерной техникой, не умеют пользоваться всеми возможностями, которые представляют в их рас­ поряжение сетевые информационные технологии. Расширение воз­ можностей этих технологий как бы отодвинуло на второй план многие задачи по поиску информации, которые можно назвать классически­ ми. Большинство активных пользователей стремится использовать се­ тевые технологии для очень важных и многоплановых бытовых задач: таких как приобретение авиационных и железнодорожных билетов, покупок товаров в Интернет-магазинах, оперативного знакомства с те­ кущими новостями и многого другого. Появилось изрядное количество литературы, часто переводной, которая уделяет внимание именно этим вопросам, наиболее широко привлекающим внимание.

Нынешний период нередко воспринимают как информационную революцию, не очень задумываясь над тем, что это на самом деле озна­ чает. На самом деле, следуя представлениям известнейшего ученого нашего времени Олвина Тоффлера, следует говорить о более карди­ нальной перестройке жизни общества. Эту перестройку нередко назы­ вают «третьей волной». Третья волна изменяет ценности и приорите­ ты всего общества, выводя на первое место владение информацией и способами ее распространения. При этом существенно меняется и роль работников, которые связаны с этими процессами.

Почти повсеместно отмечается резко изменившаяся роль библиотек и библиотекарей. Во многих западных странах библиотекарь становит­ ся одним из активных участников учебного процесса. Изменяется и со­ держание знаний и умений библиотекаря. Во многих университетах (например, в университете штата Мичиган) ведется подготовка биб­ лиотечных специалистов, которые напрямую ориентированы на ис­ пользование компьютерных технологий. И у нас в России, и за рубе­ жом появляются и активно обсуждаются стандарты информационной грамотности специалистов разного уровня. Иными словами, подготов­ ка на любом уровне знаний связана с обязательным освоением основ­

6

К читателю

ных приемов работы в информационных сетях. Известно, что в этой об­ ласти Россия заметно отстала от ведущих западных стран. Тем не менее эти проблемы уже стали существенными и для нашей страны. Обнару­ жилось, что в этой области практически отсутствует необходимая лите­ ратура. Именно эти обстоятельства и побудили нас обратиться к напи­ санию предлагаемого пособия. При этом отсутствие традиций в отборе материала для пособия не является главной сложностью. Сведения по поиску информации в сетях обязательно должны включать множе­ ство конкретных сетевых адресов. Что отбирать для этого списка, как его связывать с текстом — это все решается нами, по существу, впер­ вые. В этом вопросе очень трудно апеллировать и к зарубежному опы­ ту. За рубежом количество изданий подобного плана велико, однако в силу целого ряда хорошо известных объективных причин такого рода издания полностью отсутствуют даже в самых крупных российских библиотеках*. Естественно, авторы частично смогли познакомиться с некоторыми из этих материалов путем использования международного межбиблиотечного книгообмена, но давать ссылки на такие книги и ре­ комендовать к ним обратиться просто бессмысленно. Поневоле прихо­ дится увеличивать количество ссылок на электронные публикации.

Методы сетевой технологии во всем мире еще окончательно не сло­ жились. Многие термины, хорошо известные, например, в библиотеч­ ном деле, стали применяться в этой области в расширительном, а иногда и в не вполне правильном смысле. Короче говоря, не только научная тер­ минология, но и предварительное состояние терминологической базы, так называемая ЕСТ — естественно сложившаяся терминология — ре­ ально отсутствуют. Все это заставило нас приводить множество поясне­ ний и определений, которые нельзя считать до конца установившимися. Конечно, авторы стремились свести терминологические нечеткости до минимума. Насколько нам это удалось, судить читателю.

Авторы любого пособия всегда должны ответить для себя на три ос­ новных вопроса: для кого писать, о чем писать и как писать. Поиском информации в сетях интересуется огромное количество людей с различ­ ными информационными потребностями. Они относятся к разным воз­ растным и образовательным группам населения и обладают различной предварительной подготовкой. Пытаться писать сразу для всех таких читателей — дело практически безнадежное. Поэтому мы ориентируем­ ся прежде всего на школьников старших классов, студентов и молодых специалистов. Естественно, это пособие может оказаться интересным и полезным и для более искушенного читателя.

* Правда, недавно в Российской национальной библиотеке вышел справочник «WWW-стратегии эффективного поиска», предназначенный как для библиотека­ рей, так и для пользователей (СПб., 2001).

К читателю

7

Современная российская молодежь имеет в своей массе большую тягу к компьютерной технике. Многие молодые люди обладают опы­ том работы в сети Интернет. Очень часто этот опыт чисто эмпириче­ ский. В таких случаях умея «нажимать кнопки», такой пользователь подчас не владеет терминологией, а его теоретические знания обры­ вочны. В то же время есть много студентов, которые еще вообще ни разу всерьез не работали на компьютере.

Многим возможным читателям старшего поколения свойственен страх перед компьютером, а новые приемы работы такие читатели час­ тенько осваивают с напряжением. В то же время они умеют оценить качество информации и понять ее реальную ценность. Чтобы не по­ вторять простейших вещей, мы исходим далее из предположения о том, что читатель уже овладел основными навыками работы с компьюте­ ром. Ему не надо объяснять такие простые вещи, как выбор алфавитов или смена шрифтов, сохранение файлов и прочее. Эти простейшие приемы могут быть при необходимости легко освоены самостоятель­ но. Казалось бы, что и объяснение основных приемов работы с Интер­ нетом тоже не нужно. Однако мы полагаем, что объяснение простей­ ших терминов все же полезно, так как далеко не везде производится систематическое обучение работе в Интернете. Кроме того, в ряде слу­ чаев мы будем давать пояснения достаточно простым, но не очень хо­ рошо известным, приемам работы.

Надо сказать, что освоение Интернета зачастую идет путем проб и ошибок. В то же время тем, кто овладел начальными навыками рабо­ ты в сетях и может пользоваться английским языком, мы укажем на возможность пополнить свои знания, используя группу учебных се­ тевых адресов, предлагаемых, в частности Британской библиотекой. Эту библиотеку можно легко найти по URL-адресу britishlibrary.net/ internet_intro_content.htm. Принято считать, что любой студент, доу­ чившийся до третьего курса, в той или иной мере владеет английским языком. Реальная ситуация, естественно, выглядит намного хуже, и по­ лагать, что все читатели этого пособия владеют английским языком, было бы в высшей степени наивным. В то же время серьезный поиск научно-технической информации в сетях невозможен без выхода на за­ рубежные адреса. Большинство важнейших серверов и за рубежом, и в России имеют англоязычные версии размещенных на них материалов. Именно поэтому некоторое знание английского языка необходимо для успешной сетевой работы. В то же время нам знакомы случаи, когда даже серьезные исследователи, не владея языком, пользовались для работы в сетях предварительными записями простейших английсйих выражений, необходимых в работе. Как ни странно, это позволяло им достаточно успешно справляться с практическими задачами.

8

К читателю

В нашем пособии мы будем стараться, по возможности, использо­ вать русскоязычные примеры. К сожалению, далеко не всегда можно идти таким естественным путем. Приведем простейший пример. Пусть кто-либо захочет освоить приемы составления маршрутов личного пу­ тешествия, пользуясь Интернетом. В российском Интернете найти рас­ писания поездов и самолетов не просто. Особенно большие трудности возникают при поиске расписаний местных линий. Иногда они есть, но сообразить, где они находятся, очень трудно. Так, расписание при­ городного сообщения Санкт-Петербург-Гатчина находится на сайте Санкт-Петербургского института ядерной физики (П И Я Ф ) РАН (оно предназначено для посетителей Института). Только летом 2003 г. эта информация появилась на сайте http://raspisanie.narod.ru. Для многих других важных маршрутов такой информации пока еще просто нет. Можно не сомневаться, что она появится, и достаточно скоро. Пока ж е лучше изучать приемы работы с расписаниями на основе зарубежных сайтов.

Эта и другие схожие причины заставляют нас заметно увеличить количество иноязычных примеров, хотя, естественно, любой пользова­ тель начинает свой поиск в русскоязычном Интернете (РУ Н ЕТ Е). Мы четко представляем себе, что это просто болезнь роста, но данная книга пишется в определенное время и не считаться с особенностями этого времени нельзя. Именно поэтому без описания широкого набора дан­ ных об англоязычных поисковых системах обойтись нельзя. Для облег­ чения чтения и понимания мы, конечно, будем давать необходимые пояснения соответствующим примерам и излагать такой материал с максимальной степенью простоты. Тем не менее мы все же ориентиру­ емся на читателя, который обладает некоторыми простейшими навыка­ ми владения английским языком. Мы также прекрасно понимаем, что хотя и библиотекарь, и программист, разрабатывающий соответствую­ щие программы, и пользователь в процессе поиска информации решают фактически одну и ту же задачу, их методы работы и практические ин­ тересы заметно различаются.

Библиотекарь стремится создать правильные описания информаци­ онных материалов, обеспечить условия для их нахождения пользовате­ лем и для облегчения работы последнего. Пользователь, не очень интере­ суясь тем, как обеспечивается его работа, заинтересован в быстром и эффективном поиске нужной ему информации. Это как бы две головы у тела одной проблемы. Только в отличие от двуглавого герба, эти голо­ вы глядят навстречу друг другу. В этом общем деле программисты ори­ ентированы на то, чтобы обеспечить работу поисковой системы, то есть на том «как все сделать». Библиотекари заняты организацией работы,

К читателю

9

а пользователь озабочен тем, как правильно и оптимально использовать программы поиска информации и достижения в области организации информации, ее хранения и выдачи.

Существует множество книг для программистов. Большинство книг, посвященных деятельности библиотек, ориентировано, в первую оче­ редь, на библиотечных работников. Мы же в этом пособии ориентиру­ емся на пользователя. Поэтому ряд теоретических и организационных вопросов (как библиотечного дела, так и программирования) мы остав­ ляем в стороне. Наше внимание будет сосредоточено на практических приемах поисковой работы и методах оценки ее реальной эффективно­ сти. Мы, по мере возможности, будем пользоваться проверенными опы­ том, приемами и методами. Вне всякого сомнения, предлагаемый мате­ риал будет полезен также и практикам библиотечного дела. Однако они не должны забывать о его принципиальной ориентированности на не- профессионала-пользователя.

Не следует забывать и о том, что переживающий бурный прогресс Интернет характеризуется достаточно частой сменой и даже исчезнове­ нием адресов, по которым расположена информация. Нередко происхо­ дят изменения настройки, а иногда и полные замены программ, которые применяются в библиотеках. Так, только в течение 2001 г. были изменены поисковые системы в электронных каталогах Российской государствен­ ной библиотеки (РГБ) и базы данных HELK (Хельсинский универси­ тет). В марте 2002 г. была серьезно изменена поисковая программа в ка­ талоге Библиотеки конгресса США. Соответствующий список легко продолжить. При написании пособия мы были вынуждены считаться с этим, и старались давать только надежные и стабильные, по нашему мне­ нию, адреса. Однако не следует удивляться и тому, что многие приводи­ мые далее данные, несмотря на все наши предосторожности, могут изме­ ниться за время издания этого пособия. Это печальная реальность и с ней надо считаться. Мы только стремились свести к минимуму возмож­ ные неточности и неудобства, проистекающие из указанных обстоя­ тельств.

Количество литературы и в традиционной, и в электронной форме огромно. Читатель должен с самого начала четко усвоить, что перед ним стоит задача не отыскать все, что только возможно, а быстро и эффективно найти то, что ему действительно необходимо. Соответ­ ственно и мы, авторы пособия, не стремились дать список всех воз­ можных адресов (это практически необозримый объем информации), а только привести важнейшие примеры и указать пути поиска нужных пользователю сведений.

10

К читателю

Уже на подготовительной стадии работы над этим пособием перед авторами встал один принципиальный вопрос. Дело в том, что многие информационные услуги и в России, и за рубежом, платные. Иногда взимание платы явно не оправдано, но чаще всего оно просто необхо­ димо, особенно если учесть, что работа различных информационных сетей, поддержание адресов, разработка программ и т. д. требуют не­ малых затрат. Цены на услуги, особенно за рубежом, по российским понятиям немалые. Поэтому, рекомендуя для работы те или иные практические приемы, мы не имеем права обойти молчанием тот факт, что некоторые из них труднодоступны в силу их дороговизны. В то же время при предварительном обсуждении планов этого пособия мы столкнулись с категоричной точкой зрения ряда библиотечных работ­ ников, считавших, что «неприлично затрагивать экономические про­ блемы в учебном пособии». Мы избрали здесь компромиссное реше­ ние: речь о платных услугах будет идти только кратко и без каких-либо высказываний о ценовой политике и возможностях среднего пользо­ вателя, которые, как мы знаем, весьма ограничены. Мы также будем кратко упоминать разные электронные программы и банки данных, которые распространяются на CD. Эти программы, особенно в облас­ ти научной информации, где количество изготовляемых копий не ве­ лико, могут быть очень дорогими. Чаще всего они доступны и у нас, и за рубежом, только организациям. В то же время мы все прекрасно знаем, как широко распространен «не лицензированный» программ­ ный продукт в России. Соответственно и многие CD также широко распространены в нашей стране в пиратских копиях. По счастью, ос­ новные программные продукты с базами данных о научной информа­ ции пиратских копий обычно не имеют из-за ограниченного спроса. По­ этому, говоря об этих продуктах, мы, если и будем говорить о заказах или ценах, то только на официальную, сертифицированную продукцию. Пользоваться ли ею, или же искать обходные пути, каждый читатель должен решать самостоятельно. Это вопросы этики и мы просто не имеем права входить в их детальное обсуждение.

Наконец, последний вопрос: как писать? Мы уж е говорили о том, что в области компьютерных и особенно сетевых технологий научная терминология еще окончательно не установилась. Как во всякой но­ вой сфере приложения интересов, в упомянутой области работает большое количество молодых людей, многие из которых получали свое образование в других областях науки и техники. Как следствие этих двух обстоятельств, в практике современной работы с сетевыми доку­ ментами получил чрезмерное развитие нарочито огрубленный жаргон, часто отнюдь ничем не обоснованный. Тем не менее считается даже