Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ИНТЕРНЕТ для медицинских работников

.pdf
Скачиваний:
7
Добавлен:
19.03.2015
Размер:
631.19 Кб
Скачать

ИНСТИТУТ «ОТКРЫТОЕ ОБЩЕСТВО» (ФОНД СОРОСА) Санкт-Петербургское отделение

ИНТЕРНЕТЦЕНТР

и

 

т

н

е

 

терн

 

CАНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ МЕДИЦИНСКИЙ УНИВЕРСИТЕТ имени академика И.П. Павлова

ЦЕНТР " ИНТЕРНЕТ ДЛЯ МЕДИЦИНЫ"

ИНТЕРНЕТ для медицинских работников

Пропедевтический курс для ИНТЕРНЕТконсультантов

Под редакцией А.В.Мартынихина

Часть 2.

Поиск медицинской информации в Интернет

Санкт-Петербург

2000

2

 

Пропедевтика

 

Под редакцией А.В. Мартынихина

 

Авторский коллектив:

 

Часть 1.

Теоретические основы работы в Интернет -

Джалиашвили Зураб Отарович,

 

 

 

Мартынихин Андрей Васильевич

Часть 2.

Поиск медицинской информации в Интернет -

Вечерская Марина Львовна

Сведения об авторах:

Вечерская Марина Львовна, главный библиограф, заведующая справочно-библиографическим отде-

лом СПбГМУ им. акад. И.П. Павлова (libspmu@spmu.rssi.ru)

Джалиашвили Зураб Отарович, кандидат технических наук, доктор философских наук, профессор, директор Межвузовского центра новых информационных технологий в гуманитарном образовании Госкомвуза России при Санкт-Петербургском государственном институте точной механики и оптики (Технический университет) - СПбГИТМО (ТУ), руководитель курса "Медицинская информатика" в СПбГМУ им. акад. И.П. Павлова (aoslab@mail.ru)

Мартынихин Андрей Васильевич, кандидат медицинских наук, старший научный сотрудник, начальник отдела Средств вычислительной техники СПбГМУ им. акад. И.П. Павлова (martyn@spmu.rssi.ru)

Отказ от ответственности

Несмотря на то, что были предприняты все усилия для того, чтобы данный документ был свободен от опечаток, ошибочных сведений и устаревших ссылок на ресурсы Интернет, Санкт-Петербургское отделение Института "Открытое общество" не несет никакой ответственности за убытки, как прямые, так и косвенные, которые могут быть вызваны использованием данного документа.

Авторские права

Данный документ может свободно распространяться для индивидуального использования в некоммерческих целях. Авторские права на данный документ принадлежат Санкт-Петербургскому государственному медицинскому университету им. акад. И.П. Павлова и Санкт-Петербургскому отделению Института "Открытое общество".

Все упомянутые торговые марки являются собственностью их владельцев.

©2000 СПбГМУ им. акад. И.П. Павлова

©2000 Институт "Открытое общество", С.-Петербургское отделение

Часть 2. Поиск медицинской информации в Интернет

3

Содержание

ВВЕДЕНИЕ.....................................................................................................................................................

4

ПОИСК БИБЛИОГРАФИЧЕСКОЙ МЕДИЦИНСКОЙ ИНФОРМАЦИИ.......................................

4

ПОИСКОВЫЕ МАШИНЫ .........................................................................................................................

5

ПОИСКОВЫЕ МАШИНЫ КЛАССИФИКАЦИОННОГО ТИПА.............................................................................

5

ПОИСКОВЫЕ МАШИНЫ СЛОВАРНОГО ТИПА ................................................................................................

8

ДРУГИЕ ПОИСКОВЫЕ МАШИНЫ..................................................................................................................

11

ПОИСК ДОКУМЕНТОВ НА РУССКОМ ЯЗЫКЕ................................................................................................

12

БИБЛИОГРАФИЧЕСКИЕ БАЗЫ ДАННЫХ........................................................................................

15

БИБЛИОГРАФИЧЕСКАЯ БАЗА ДАННЫХ MEDLINE.....................................................................................

15

ПРОГРАММА OVID .....................................................................................................................................

16

ПРОФЕССИОНАЛЬНЫЕ КЛУБЫ, БИБЛИОТЕКИ, ИЗДАТЕЛЬСТВА.......................................

19

МЕДИЦИНСКИЕ ПРОФЕССИОНАЛЬНЫЕ КЛУБЫ ..........................................................................................

19

КАТАЛОГИ БИБЛИОТЕК...............................................................................................................................

21

МЕДИЦИНСКИЕ ИЗДАТЕЛЬСТВА И ЖУРНАЛЫ.............................................................................................

23

ЧТО ЕЩЕ МОЖНО ПОСМОТРЕТЬ И ПОСЛУШАТЬ.........................................................................................

24

ЗАКЛЮЧЕНИЕ...........................................................................................................................................

24

ПРИЛОЖЕНИЕ 1. СПИСОК ПЕРЕЧИСЛЕННЫХ САЙТОВ.........................................................

25

ПРИЛОЖЕНИЕ 2. ПРАВИЛА БИБЛИОГРАФИЧЕСКОГО ОПИСАНИЯ ДОКУМЕНТОВ,

НАЙДЕННЫХ НА WEB-СТРАНИЦАХ В ИНТЕРНЕТ......................................................................

27

4

Пропедевтика

Введение

Проект "Интернет для медицины" возник в результате совместной инициативы администрации СПбГМУ им. акад. И.П. Павлова, медицинских научно-исследовательских институтов СанктПетербурга и руководства проекта "Интернет" Санкт-Петербургского отделения Института "Открытое общество" (Фонд Сороса).

Методическое пособие "Интернет для медицинских работников" разработано в качестве пропедевтического курса для слушателей лекционно-практических циклов, проводимых в рамках указанного проекта. Пропедевтика (от греческого propaideuo) – вводный курс, систематически изложенный в сжатой и элементарной форме.

Предполагается, что слушатели, прошедшие обучение на данных циклах, будут обучать работе в Интернет сотрудников своих подразделений и оказывать им консультационные услуги.

При написании пособия авторы предполагали в качестве обязательного условия наличие у слушателей навыков работы в среде операционной системы Windows 9xx и прикладных программ MS Office 9xx.

В пособии уделено внимание большинству "проблемных" вопросов, возникающих у начинающих пользователей.

Структура пособия и характер изложения материала не исключают также возможности его использования для самостоятельной подготовки.

Поиск библиографической медицинской информации

Дать полный обзор ресурсов Интернет в области медицины – задача чрезвычайно сложная и практически невыполнимая.

Во-первых, ресурсы эти огромны, многообразны и неисчерпаемы. В сети Интернет можно найти базы данных, мультимедийные учебные серверы, виртуальные атласы и учебники, демонстрации клинических случаев, медицинские библиотеки, электронные версии журналов, описания научноисследовательских проектов, программное обеспечение для обработки изображений и многое другое. Такое огромное количество материала имеет как достоинства, так и недостатки. Достоинства очевидны, а к недостаткам прежде всего относится невероятное количество «шума», который мы получаем при поиске информации. Кроме того, в Сети масса рекламных материалов (по медицине в том числе) и сведений, которые полезны для больных, но не слишком интересны для специалистов. Нашей задачей является именно поиск профессиональных материалов.

Во-вторых, ресурсы Интернет, в том числе и медицинские, очень быстро меняются и обновляются, поэтому нет возможности составить их сколько-нибудь полный систематизированный перечень.

Уже стало традиционным упоминать о том, что в Интернет можно найти все, главное - знать, где. Но это как раз и есть основная проблема – навигация по Сети.

ЦЕЛЬ ЗАНЯТИЙ – дать краткий обзор основных видов информационно-поисковых систем (ИПС), имеющихся в сети Интернет, в том числе в области медицины, и сформулировать основные принципы поиска информации в той части Сети, что относится к медицине.

Часть 2. Поиск медицинской информации в Интернет

5

Поисковые машины

Представим себе достаточно типичную ситуацию. У Вас есть подключение к Интернет. Вы знаете, как использовать Netscape Navigator (или Internet Explorer). Но адресами медицинских ресурсов Сети Вы не располагаете.

Самый очевидный путь поиска – обратиться к сетевым поисковым машинам (ИПС – информационнопоисковая система). Они, используя введенные Вами ключевые слова, дадут Вам перечень ссылок на документы, имеющие отношение к Вашей тематике. Существуют две большие группы таких ИПС: 1) классификационные (рубрикаторы, каталоги) и 2) словарные (полнотекстовые) машины поиска. Основные различия между ними заключаются в способах сбора, хранения и предоставления информации пользователю. Иначе говоря, разница в том, кто формирует базу данных – люди (в первом случае) или компьютеры (во втором).

Поисковыемашиныклассификационноготипа

Если проводить аналогии с обычными библиотечными каталогами, то классификационные ИПС (virtual libraries) похожи на систематический каталог библиотеки. Это совокупность рубрик, расположенных в определенном порядке – от общего к частному. Ссылки рассортированы по тематическим рубрикам и снабжены аннотациями. Вы переходите от одной рубрики к другой, читаете, ищете, выбираете – как в каталоге любой библиотеки.

Компании, владеющие такими каталогами, непрерывно проводят огромную работу, исследуя, описывая и каталогизируя содержимое WWW-серверов и других сетевых ресурсов по всему миру. Результатом таких усилий является огромный иерархический (древовидный) каталог, на верхнем уровне которого собраны самые общие понятия, а элементы самого низкого уровня представляют собой ссылки на отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого. Конечно, никто не даст гарантий, что такой каталог охватывает все содержимое Сети: ведь составляют его все-таки люди, а людям свойственно уставать и ошибаться. Но возможная неполнота и даже однобокость подбора материалов в таких каталогах с лихвой окупается тем, что не под силу никакому компьютеру - осмысленностью отбора. Информация, которой коснулась рука человека, становится во всех смыслах дороже – и практической пользы от нее больше, да и себестоимость ее выше.

Самая известная ИПС классификационного типа – Yahoo!

Классификационная информационно-поисковая система Yahoo!

www.yahoo.com

Поисковая система Yahoo! занимает первое место по количеству посещений: каждый месяц ее посещают примерно 30 миллионов человек. Это старейшая поисковая система Сети: она была запущена в 1994 году. Удивительно, но эта невероятно популярная система, обслуживающая миллионы запросов ежеденевно, зародилась как простая коллекция закладок, которую пополняли всего 2 человека - Дэвид Фило и Джерри Янг. На сегодняшний день Yahoo, это уже не просто каталог, это целая группа разнообразных сервисов, среди которых такие как каталог Yahooligans - Yahoo для детей, система персональных каналов My Yahoo, бесплатный E-mail сервис, система "Shop with Yahoo" (покупайте с Yahoo), система виртуальных клубов по интересам и многое другое. Полное имя системы - Yet Another Hierarchical Officious Oracle (Еще Один Иерархический Официозный Оракул), в сокращении Yahoo. Успех системы Yahoo! определяется обслуживающими ее людьми - сейчас в Yahoo! работают более 100 систематизаторов: именно они решают, в какую рубрику включить тот или иной документ.

В отличие от библиотечного каталога, цель организации системы Yahoo! (как и других ИПС классификационного типа) не в том, чтобы представить всю совокупность имеющихся тематических разделов и подразделов: рубрикатор Yahoo! скорее является попыткой отразить рубрики в соответствии с интересами предполагаемых пользователей. В системе примерно 25 тыс. категорий, в которых находится более 500 тыс. ссылок на Web-сайты.

Сильные стороны Yahoo! – в первую очередь его содержание и структура.

6

Пропедевтика

Поиск по рубрикатору Yahoo!

Общий принцип, которого следует придерживаться при работе с классификационными системами типа Yahoo! - движение хода рассуждений от общего к частному. Начинать следует с верхнего уровня рубрикатора. Если Вы уже находитесь где-то в Yahoo!, найдите на текущей странице ссылку Home для возврата на базовую страницу.

Верхний уровень в Yahoo содержит 14 рубрик: искусство и гуманитарные науки; бизнес и экономика; компьютеры и Интернет; образование; развлечения; управление; здоровье; новости и средства массовой информации; отдых и спорт; справочные источники; региональная информация; наука; социология; общество и культура. Все, что есть в Yahoo, сосредоточено в этих 14 рубриках.

Медицинскую информацию, естественно, следует искать в рубрике Здоровье (Health). Пример поиска по теме Тетрада Фалло (Tetralogy of Fallot).

Рубрика Здоровье (Health) на дату выпуска настоящего пособия включала следующие подрубрики:

Alternative Medicine, (563), Chats and Forums (40), Children's Health (153), Companies@, Conferences (19), Death and Dying@, Dentistry@, Disabilities@, Diseases and Conditions (7296), Education (41), Emergency Services (236), Employment (110), Environmental Health (194), First Aid (15), Fitness (163), General Health (78), Health Administration (65), Health Care (361), Health Sciences (26), Hospitals and Medical, Centers (39), Institutes (33), Law@, Long Term Care (115), Medicine (4897), Men's Health (27), Mental Health (652), Midwifery (58), News and Media (197), Nursing (430), Nutrition (205), Organizations (21), Pharmacy (1081), Procedures and Therapies (281), Public Health and Safety (730), Reference (93), Reproductive Health (656), Senior Health (79), Sexuality@, Traditional Medicine (179), Travel Health and Medicine (14), Web Directories (49), Weight Issues (75), Women's Health (154), Workplace (70).

Цифры в скобках рядом с названием рубрики указывают, сколько ссылок она включает. Значок @ означает, что это отсылка, то есть информация по этой тематике включена в одну или несколько других рубрик.

Нужная нам информация относится к клинической медицине. Очевидно, что ее следует искать либо в разделе Diseases and Conditions (Болезни и состояния), где материал располагается по названиям заболеваний, либо зайти в раздел Медицина, где все сведения расположены в порядке алфавита отраслей медицины.

Мы можем выбрать раздел Кардиология из рубрики Медицина или зайти в рубрику Болезни и состояния и выбрать раздел Болезни сердца (Heart diseases). Оба эти пути приведут нас к одинаковому списку рубрик. Находим в этом списке нужную рубрику – Tetralogy of Fallot – и просматриваем ее. Теперь нам нужно ознакомиться с содержанием полученных ссылок и выбрать нужные.

Пример наглядно демонстрирует, что нет формализованного алгоритма, который можно было бы положить в основу работы с рубрикатором и который годился бы на все случаи жизни. Все зависит от вас: насколько хорошо развита Ваша профессиональная интуиция и насколько Вы опытны как пользователь Интернет. Лучший способ приобрести опыт и практические навыки поиска информации – потратить некоторое время на обыкновенное “блуждание” (surfing) по уровням рубрикатора Yahoo!. Его разделы очень подробно структурированы. Время от времени стоит заглядывать в отдельные документы и просматривать их содержание.

Очень полезно также заходить в рубрику Web Directories. Там можно найти перечень специализированных страниц сети Интернет, имеющих отношение к медицине. Многие из адресов снабжены краткими аннотациями: что включают, для чего предназначены.

Поиск по ключевым словам

Если цель поиска точно известна, можно использовать поиск по ключевым словам. При вводе ключевых слов с основной страницы Yahoo, запрос обрабатывается по методу Intelligent default, то есть Yahoo ищет наиболее подходящие результаты в таких областях: в категориях Yahoo; в Web-сайтах, зарегистрированных на Yahoo; на Altavista (запрос передается при отсутствии результатов); в новостях. Такой интеллектуальный поиск занимает довольно много времени. При задании критериев поиска для Yahoo нужно помнить, что Yahoo ищет эти слова только в названии и описании страницы,

Часть 2. Поиск медицинской информации в Интернет

7

поскольку полнотекстового индекса на Yahoo нет. Поэтому не следует указывать при поиске слишком много терминов или синонимов - количество результатов снизится или даже будет нулевым. При вводе ключевых слов со страницы каталога, нужно выбрать область поиска - весь каталог Yahoo или только его текущий раздел. Это делается с помощью радиок-кнопок под полем ввода. На странице с результатами поиска выводятся сначала удовлетворяющие критерию поиска категории, а потом сайты. В случае если на Yahoo нет результатов, сразу выводятся результаты с Altavista. Вверху и внизу страницы выводится маленькая табличка, с помощью которой можно одним нажатием кнопки мыши произвести поиск в категориях Yahoo, на Altavista, в новостях и событиях. Количество результатов поиска на Yahoo, естественно, невелико, зато большинство из них являются релевантными.

Если слов несколько, они разделяются пробелами (как в рассмотренном выше примере: Tetralogy of Fallot). В системе Yahoo! пробелы между словами интерпретируются как логические операторы "И".

Пример. ЗАПРОС: Применение аспирина в лечении инфаркта миокарда. КЛЮЧЕВЫЕ СЛОВА. Myocardial infarction AND aspirin.

Механизм поиска Yahoo! будет искать все документы, в описании которых содержатся слова, заданные в качестве ключевых. При выдаче результатов подчеркиваются слова из запроса, которые встретились в документе. Ранжирование документов производится по количеству запрошенных терминов в документе (то есть в начале идут те документы, в которых ключевые слова встречаются чаще).

Хорошие результаты поиска в Yahoo! получаются, как правило, тогда, когда пользователь знает, что в базе данных информация присутствует наверняка.

Дополнительные возможности словарного поиска

Для расширенного поиска Yahoo предлагает не очень большой, но очень полезный набор инструметов. Среди средств расширенного поиска - ограничение результатов по дате, поиск в Yahoo, Usenet и среди E-mail адресов, использование логических операций над терминами и поиск конкретной фразы. Также присутствует возможность искать слова с произвольными окончаниями, указывать слова, которые должны или НЕ должны присутствовать в документе, и т.д. Чисто русские ресурсы в Yahoo не добавляются, потому что в Yahoo Inc. просто некому смотреть и оценивать их содержимое. Но те запросы, которые не дали результатов на Yahoo передаются на Altavista, а там есть хороший индекс русских ресурсов.

Можно использовать дополнительные операторы:

+ (между поисковыми терминами) – то же, что AND (в результат будут обязательно включены документы, содержащие данный термин).

(перед поисковым термином) – то же, что NOT (в результат НЕ будут ключены документы, содержащие данный термин).

t:(перед поисковым термином) - поиск ключевых слов только в заголовках (title) документов.

u:(перед поисковым термином) - поиск ключевых слов только в адресах URL.

Важно соблюдать синтаксис при написании операторов, например, правильно писать: +t:tuberculosis,

неправильно: t:+tuberculosis.

Чтобы попасть на страничку расширенного поиска, надо перейти по ссылке Options с основной страницы Yahoo. На этой странице можно выбрать способ поиска (Select a search method).

An exact phrase match – поиск точной фразы. В этом случае слова, веденные в окно поиска, должны трактоваться как единая фраза, как если бы эти слова были заключены в кавычки.

Matches on all words (AND) – поиск документов, содержащих все заданные слова. В этом случае отбираются документы, содержащие все ключевые слова без исключения.

Matches on any word (OR) – поиск документов, содержащих хотя бы одно из заданных слов. Отбираются документы, содержащие любое из ключевых слов, введенных в окно запроса.

A person's name - поиск человека по имени (учитываются заглавные буквы, а также нахождение имени рядом с фамилией и т.п.).

По умолчанию используется опция Intelligent default. Здесь действуют следующие принципы иерархии: наибольший вес имеют те документы, в которых содержатся все заданные слова и в которых слова находятся в заголовке документа.

8 Пропедевтика

Наряду со способом поиска можно выбрать область поиска (Select a search area):

Yahoo! (база данных Yahoo!);

Yahoo Categories (поиск в рубриках (Categories) базы данных Yahoo!);

Usenet (поиск в телеконференциях);

E-mail addresses (поиск среди адресов электронной почты);

Web Sites (поиск в заголовках сайтов, проиндексированных в базе данных Yahoo!).

Рекомендации по организации поиска в Yahoo!

Если точно известно, что искать (например, конкретное заболевание, препарат и т.п. ) – введите ключевое слово (или слова) в окно поиска Search. Затем ищите информацию, просматривая ссылки.

Если Вас интересует определенная отрасль (например, кардиология, фтизиатрия …) – найдите в рубрикаторе соответствующую рубрику и ищите информацию в ней.

Если неизвестно, что и где искать – введите в окно Search известные Вам слова из нужной предметной области, просмотрите найденные ссылки, определите, в каких рубриках находится нужная Вам информация, перейдите в эти рубрики и просматривайте содержащиеся в них документы.

Поисковыемашинысловарноготипа

Поисковые машины словарного, или индексного, типа (indexing engines) обеспечивают доступ к миллионам документов в Сети. Они автоматически «прочесывают» WWW-серверы, собирая все возможные источники. Их основное достоинство – широта и всесторонность, а основной недостаток заключается в том, что они никак не организовывают найденные документы («больше не всегда значит лучше»).

Наиболее известной ИПС словарного типа является AltaVista.

Словарная информационно-поисковая система AltaVista

www.altavista.com

Система открыта в декабре 1995 г. Первоначально она задумывалась как демонстрация мощи 64разрядного сервера Alpha APX корпорации Digital Equipment, однако быстро приобрела самостоятельное значение как эффективное и мощное средство поиска. По последним данным, на сегодняшний день в индексе Altavista зарегистрировано более 110 миллионов URL. Система поражает своим быстродействием - в сутки она обслуживает более 20 миллионов запросов, при этом она отвечает на запросы незамедлительно, без всякого "притормаживания". Благодаря таким характеристикам система используется не только конечными пользователями, но и другими службами поиска, в частности, каталогом Yahoo. Система обновления индекса - краулер - посещает WWW сервера во всем мире, не испытывая проблем с языковым многообразием, поскольку Altavista поддерживает поиск на 25 языках. Странички, обновляемые редко, посещаются краулером реже чем популярные и часто обновляющиеся страницы. К сожалению, автоматически из индекса никогда не удаляются "мертвые" ссылки, поэтому по некоторым запросам количество недействующих ссылок может быть довольно велико (до 12 %). На год издания настоящего пособия поисковая система принадлежит фирме CMGI.

Информационно-поисковая система AltaVista предназначена главным образом для поиска по ключевым словам или фразам. Точнее, все слова, содержащиеся в документах сети Интернет, являются для нее ключевыми. AltaVista как бы составляет словарь из всех слов, содержащихся во всех доступных ей документах сети Интернет; этот словарь она использует при поступлении запроса.

Характерной особенностью AltaVista является наличие двух разных режимов поиска: простого (Simple search) и сложного (Advanced search). Внешний вид полей поиска в разных режимах различен; для каждого из режимов предусмотрен свой язык составления запросов и различные обозначения логических операторов.

Часть 2. Поиск медицинской информации в Интернет

9

Простой поиск

Простой поиск осуществляется путем задания в поисковом окошке ключевых слов или фраз, сформулированных на естественном (любом) языке. Можно ввести и вопрос, но он должен быть сформулирован только по-английски. Пример вопроса приведен на базовой странице AltaVista: “Where can I find job listings for Florida?”.

Одним из существенных для российского пользователя факторов оценки поисковых систем является поддержка ими русских ресурсов. В этом смысле Altavista является лидером среди всех зарубежных систем - уже давно происходит активное индексирование документов на русском языке. Кроме того, относительно недавно стал доступен поиск в Altavista с учетом русской морфологии через интерфейс на сервере www.comptek.ru/alta.html, действующий на основе поискового механизма Яndex.

Для поиска информации на языке, отличном от английского, необходимо явным образом указать кодовую таблицу, в которой будет осуществляться поиск. Это делается через раздел Language Settings, вход в который расположен справа от строки для ввода контекста для поиска. При поиске на русском языке пользователь должен, зайдя в раздел Language Settings, зафиксировать кодовую таблицу: Windows-1251, KOI8-R или ISO-8859-5, выставив зависимый переключатель (радио-кнопку) напротив ее названия, и затем - в нижней части страницы – передать свой выбор поисковой системе, нажав на кнопку Set Settings. В результате в адресную строку броузера будет вписана информация о кодовой таблице для передачи поисковой машине.

Для удобства полезно страницу поисковой машины Altavista с выбранной кодовой таблицей запомнить в Закладках (Bookmarks) вашего броузера с тем, чтобы в дальнейшем сократить время на подготовительные операции для работы с системой при поиске на русском языке.

К важной подготовительной операции относится также согласование кодовой таблицы, указанной в разделе Language Settings, и таблицы, в которой броузер показывает получаемые страницы (Меню

Вид/Кодировка). Несогласованность этих параметров приводит к ошибочным результатам!

Точнее сказать, автомат Altavista в точности в соответствии в Вашим указанием при настройке на одну кодовую таблицу выполнит поиск по контексту, заданному с использованием другой таблицы, и результаты такого поиска, скорее всего окажутся для Вас неинтересными.

Существует также возможность уточнения поиска по языку – фильтр Multi-Lingual Search. Для этого в поле Search the WEB for documents in… в строке поиска следует выбрать нужный язык. То же, но с возможностью указания фильтра по нескольким языкам доступно через страницу Language Settings – можно независимыми переключателями (галочки в квадратных окошках) зафиксировать свой выбор

– НЕ ПУТАТЬ с выбором кодовой таблицы, устанавливаемом на этой же странице. В ответ на запрос

сустановленным фильтром по языкам Вы получите перечень документов только на избранных языках. Но следует учесть, что многие авторы документов Сети вообще не помечают язык документа и AltaVista вынуждена сама распознавать язык документа. Это приводит к потерям информации: так, если запросить у AltaVista только документы на русском языке, около 70% таких документов могут оказаться не найденными. Поэтому возможностью фильтрации находимых документов по языку следует пользоваться осторожно.

Ключевые слова при вводе разделяются пробелом. В системе AltaVista пробелы между словами интерпретируются как логические операторы "И" (AND). При вводе фразы, которая не должна быть разделена на составные части, ee заключают в кавычки. Устойчивые словосочетания (типа Myocardial infarction или Rheumatoid arthritis) в кавычки можно не заключать.

Если слова запроса вводятся маленькими (строчными) буквами, то будут найдены документы, содержащие как исходное написание, так и слова с прописной буквы. Если слова вводятся прописными буквами, то результаты поиска будут содержать только документы, где есть прописные. То есть, если Вы напишете paris, то в результаты поиска будут включены слова Paris, paris, PARIS, но написав Paris, в результатах поиска Вы получите только одно написание - Paris.

Впростом поиске используются дополнительные операторы:

(+)– то же, что AND (в результат будут обязательно включены документы, содержащие данный термин). Внимание! Знак + (плюс) нужно ставить перед ключевым словом всегда, если Вы

10

Пропедевтика

хотите, чтобы это слово присутствовало в каждом документе, предложенном системой в ответ на ваш запрос.

(-) – то же, что NOT. В результат не будут включены документы, содержащие данный термин. Знак – (минус) нужно ставить перед ключевым словом, если Вы хотите, чтобы все документы, содержащие это слово, были исключены из ответа на ваш запрос.

Знаки “плюс” и “минус” вплотную (без пробела) примыкают к следующим за ними терминам и отделяются пробелом от терминов, им предшествующих.

(*) заменяет любые символы в конце слова. Нет необходимости использовать все грамматические формы ключевого слова, например, все падежные окончания единственного или множественного числа существительного. Достаточно указать, например, термин +гастрит* – и поисковая система обнаружит все документы, содержащие это слово в любой грамматической форме. При этом следует помнить три вещи. Во-первых, звездочка заменяет не более 5 символов. Во-вторых, начальная часть слова, предшествующая звездочке, должна содержать не менее 3 символов. В-третьих, звездочка должна вплотную (без пробела) примыкать к слову: написание + гастрит * - неправильно.

П р и м е р. ЗАПРОС: Пороки сердца (не врожденные). ПОИСКОВЫЕ ПРЕДПИСАНИЯ ДЛЯ AltaVista :

+‘heart defect*’ –congenital (+‘порок* сердца’ –врожденн*)

Сложный поиск

Сильные стороны поисковой системы Altavista проявляются, когда пользователю необходимо осуществить сложный поиск с указанием многих критериев отбора или поиск редких терминов, например, если Вы ищете документы, принадлежащие к определенному временному интервалу, или если ключевые слова связаны сложными логическими отношениями, которые невозможно выразить на языке запроса простого поиска. Для таких случаев Altavista предоставляет наиболее мощные и изощренные средства поиска среди всех рассматриваемых систем, среди которых такие уникальные средства как поиск документов на конкретном языке, поиск по названию страницы, поиск среди гиперссылок (можно узнать, например, есть ли в WWW ссылки на вашу страницу и если есть, то где), поиск объектов Java/ActiveX, поиск в "якорях" и т.д. Кроме того, Altavista обеспечивает набор более стандартных, но очень ценных критериев отбора, таких как логические операции над ключевыми словами, поиск с учетом вариантов написания слов, поиск целых фраз, поиск документов только на определенных серверах (или доменах), ограничения по дате создания документа, и т.д. Многие из этих возможностей доступны, как отмечено выше, с основной страницы Altavista, но для задания большой группы условий нужно перейти на страницу расширенного поиска, где пользователю предоставляется большое поле для ввода условий.

Чтобы составить запрос для осуществления сложного поиска, необходимо выполнить следующие действия:

Ввести ключевые слова, связанные логическими операторами, в окно Boolean query (о логических операторах сложного поиска см. таблицу 1).

Ввести ключевые слова, связанные логическими операторами, в строку сортировки Sort By.

В полях From – To указать хронологические рамки поиска.

Таблица 1. Логические операторы режима сложного поиска системы AltaVista

Оператор

Синонимы

Действие

AND

&

Поиск документов, содержащих ВСЕ ключевые слова.

 

 

П р и м е р: aspirin AND pneumonia. Будут найдены документы, содер-

 

 

жащие оба ключевых слова.

OR

символ

Поиск документов, содержащих ЛЮБОЕ ИЗ ключевых слов. П р и м е р:

 

"пробела"

гастрит OR дуоденит. Будут найдены документы, содержащие либо сло-

 

 

во «гастрит», либо слово «дуоденит», либо оба этих слова вместе.