Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответы13-16.doc
Скачиваний:
0
Добавлен:
17.09.2019
Размер:
79.87 Кб
Скачать

16. Ипя. Дескрипторные языки. Вербальные языки.

ДЯ – специальный ИПЯ, словарный состав которого состоит из дескрипторов, а использование основано на принципе координатного индексирования.

Языки дескрипторного типа поддерживают процесс индексирования, который заключается в формировании описания содержания документа как совокупности дескрипторов, выбираемых из заранее созданных словарей понятий либо из текста документа и обозначающих основные понятия этого документа. Дескрипторный язык дает возможность отбирать документы по существенным для потребителя признакам. ДЯ основан на методе координатного индексирования (КИ).

КИ: Основное смысловое содержание документа и информационной потребности может быть выражено соответствующим списком ключевых слов, содержащимся в тексте. Представители назывных (ключевых) слов – имена собственные, хронологические данные, диапазоны температур и т.д. Список ключевых слов образует поисковый образ.

Координатное индексирование – способ выражения основного смыслового содержания документа или информационной потребности в виде определенной совокупности ключевых слов.

Дескрипторы – предназначенные для координатного индексирования документов и информационных запросов ключевые слова, которые по определенным правилам отобраны из основного словарного состава того или иного естественного языка и у которых искусственно (с помощью соответствующих отсылок и помет) устранены синонимия, полисемия и омонимия.

Использование дескрипторных языков предполагает процедуру индексирования – перевода содержания документов с естественного языка на дескрипторный. В целях упрощения процедур автоматического индексирования вместо дескрипторных языков часто используются языки, в которых нет лексического контроля. Такие ИПЯ называют бестезаурусными или вербальными. Часто даже говорят, что в качестве ИПЯ в этом случае используется ЕЯ. На самом деле имеется в виду, что для координатного индексирования в таких ИПС используются слова и словосочетания ЕЯ, содержащиеся в документах и запросах. Фактически мы имеем дело с дескрипторными ИПЯ без фиксированного словаря и без фиксированной парадигматики.

ИПС может рассматриваться как совокупность механизмов смыслоразличения (описание содержания документов и запросов) и смыслоотождествления (сравнение ПОД и ПОЗ). Отказ от индексирования документов и лексического контроля затрудняет выполнение функции смыслоотождествления и, как следствие, ведет к снижению полноты. Поэтому требуется включение компенсационных механизмов в каком-либо другом месте системы. В бестезаурусных ИПС эта проблема решается на стадии составления поисковых предписаний (ПП) путем избыточного индексирования. Там каждому термину из ПП приписываются синонимичные или близкие ему по смыслу термины, в том числе термины, находящиеся с данными в родовидовых и других парадигматических отношениях, т.е. происходит как бы "развертывание" словарной статьи дескрипторного словаря или тезауруса. В ИПС бестезаурусного типа тезаурус не исключается, но он начинает использоваться, как и тезаурус в лингвистике, в качестве средства для моделирования информационной потребности и смыслового варьирования запросов.

i

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]