Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Зиновьева Докментовед-е ВОРД.doc
Скачиваний:
46
Добавлен:
12.02.2016
Размер:
948.22 Кб
Скачать

5.8.Поиск документов

Хранящиеся документы составляют документный массив, в котором место каждого документа должно быть четко опре­делено и закреплено. Документы должны быть заклассифици-рованы, должны быть выделены поисковые признаки каждого из них, что необходимо для поиска документов и является базой для создания информационно-поисковой системы (ИПС).

137

Автоматизированные и ручные ИПС дают возможность най­ти необходимый документ в любом структурированном мас­сиве.

Под поиском понимается совокупность логических и техни­ческих операций, имеющих конечной целью нахождение до­кументов, сведений о них, фактов, данных и т.п. в информа­ционно-поисковом массиве. Информационно-поисковый мас­сив представляет собой упорядоченную совокупность поиско­вых образов документов вместе с адресами их хранения. При­мерами информационно-поискового массива могут служить каталоги библиотек, компьютерные базы данных.

В зависимости от применяемой технологии различают руч­ные и автоматизированные ИПС. В ручных (карточных) ИПС поиск происходит по краткому формализованному описанию документов на карточках. В зависимости от принятого принци­па организации карточек в ИПС на первый план выходят раз­ные признаки документа — классификационный шифр, ин­вентарный номер, предметная рубрика, Ф.И.О. автора и т.д. Карточки в картотеке отделены друг от друга разделителями, на которых проставлены либо шифры в цифровой последова­тельности, либо буквы алфавита. За разделителями и собира­ются карточки, содержащие идентификационные признаки документов, имеющие указанные признаки.

Ручные ИПС построены по линейному принципу. Это озна­чает, что поиск можно проводить лишь по одному признаку, главенствующему в данной поисковой системе, например, по содержанию. Чтобы произвести многоаспектный поиск, нуж­ны вспомогательные средства, представляющие информаци­онно-поисковый массив, перестроенный по ряду других при­знаков, например, алфавитно-предметному, хронологическо­му, нумерационному и т.д. Таким образом, для эффективного поиска ведением одной картотеки не ограничиться. Необходи­мо дополнение в виде еще нескольких картотек, в которых карточки на одни и те же документы будут расположены в другой последовательности и за другими разделителями.

Совместить несколько вариантов поиска возможно толь­ко в автоматизированных ИПС. Автоматизированный доку­ментный поиск может быть организован на основе различ­ных технологий: по ПОД, по полному тексту документа, по

138

гипертекстовым ссылкам и др. Поиск по ПОД осуществляет­ся аналогично в ручных и автоматизированных ИПС, только идентификацию документа по поисковым признакам произ­водит компьютер. Поиск по полному тексту документа осно­ван на формализации текста, переводе его в машиночитае­мую форму. Обработка текста предполагает выделение деск­рипторов и составлении тезауруса — перечня дескрипторов, проранжированных по частоте употребления. Тексты документа хранятся в памяти компьютера. А их поиск и вывод осуществ­ляется в соответствии с поисковым предписанием. Предпи­сание имеет вид логического произведения некоторого мно­жества ключевых слов — дескрипторов. Документ считается отвечающим на информационный запрос и подлежит выда­че, если в нем одновременно содержатся все ключевые слова поискового предписания.

И наиболее сложная технология — гипертекстовая. Основ­ная идея гипертекстовых технологий состоит в том, что поиск документной информации происходит с учетом множества взаимосвязей, имеющихся между документами, как логичес­ких, так и ассоциативных. Доступ к информации осуществля­ется не путем последовательного просмотра текстов, а путем движения от фрагмента одного текста к фрагменту другого. Движение осуществляет сам пользователь и оно называется «навигация».

В зависимости от того, какую форму имеет информация в процессах хранения и поиска, ИПС подразделяются на доку­ментные и фактографические. Документные ИПС выдают в ре­зультате поиска сами документы, их копии или же адреса хра­нения. Фактографические ИПС помогают отыскать отдельные сведения, факты из текста документов. Между документным и фактографическим поиском нет принципиальной разницы. По способам поиска оба вида идентичны. Отличия имеются в со­держательной стороне объекта поиска: в первом случае ищут документ или сведения о нем, а во втором — факт, отражен­ный в документе. Характерной особенностью всех документ­ных ИПС является то, что извлечение нужной информации из найденного документа осуществляет сам потребитель. Фактог­рафические ИПС предназначены для поиска конкретных фак­тов, сведений, данных в ответ на фактографические запросы

139

без обращения потребителя к документам, в которых они со­держатся. Промежуточное место занимают документно-фак­тографические ИПС, результатом поиска в которых являют­ся запрашиваемые факты, сведения, данные со ссылкой на документ, в котором они зафиксированы.

Сам поиск представляет собой творческий процесс, несмот­ря на то, что многие его стороны жестко формализованы. Эта­пы поиска следующие:

• формулировка запроса;

• анализ запроса и составление поискового предписания — перевода запроса с естественного языка на язык фор­мальных признаков документа (библиографического опи­сания, классификационного индекса, предметной руб­рики, перечня дескрипторов и т.д.);

• реализации поискового предписания в информацион­но-поисковом массиве и выборка релевантных доку­ментов, т.е. соответствующих данным формальным при­знакам;

• выбор из релевантных документов пертинентных, т.е. со­ответствующих реальным потребностям пользователя.

Для быстрого поиска нужных документов необходимо со­здание единой системы классификации документов с об­щими для всей системы правилами индексирования по этой системе, едиными правилами расстановки и хранения пер­вичных документов, взаимосвязь со справочным аппаратом. Всякий раз, когда возникает потребность произвести по­иск, пользователю необходимо решить следующие пробле­мы: определить цель поиска, отводимое время на поиск, ма­териальные ресурсы, используемые при поиске, необходи­мые точность и полноту поиска. Перечисленные факторы ока­зывают значительное влияние на результаты поиска.

Любой поиск - довольно трудоемкое и дорогое меропри­ятие. Чем выше точность и полнота поиска, т.е. чем больше документов найдено и чем более они релевантны, тем доро­же и дольше сам поиск. Поэтому цель поиска должна опре­делить оптимальную полноту и точность (большую или меньшую), соответственно и задействованные материальные ресурсы и затрачиваемое время.

140

Под стратегией поиска понимается организация, подго-1ка и использование имеющихся материальных ресурсов для остижения поставленной цели в отводимое на поиск время. В 'Зависимости от этого осуществляется решение тех или иных задач и устанавливается последовательность выполняемых ме­роприятий. Стратегия поиска конкретного документа зависит От наличия исходных данных о нем. Если известен автор доку-' мента, то проще всего документ разыскать в алфавитном ката­логе или авторском вспомогательном указателе к библиографическим пособиям. Если же автор не установлен, а известно Лишь общее содержание, то поиск следует начинать с уста­новления соответствующего шифра систематической класси­фикации, а затем просмотра всех документов, зашифрован­ных аналогично в ИПС. Всевозможные варианты поиска доку­ментов разрабатывает такое научно-практическое направление, Как библиографическая эвристика. Принципы, закономернос­ти, технологии автоматизированного поиска документов и Содержащейся в них информации — основная задача такой научной дисциплины, как информатика.