- •19. Назначение и состав лск. Характеристика основных составляющих лск.
- •20. Предкоординированные и посткоординированные ипя
- •21.Метод координатного индексирования и поиска.
- •22.Дескрипторные ипя, их состав и структура.
- •23.Словари дескрипторных ипя, их состав и структура.
- •24.Системы индексирования, понятие качества индексирования, типология. Примеры ис основанных на индексировании.
- •25. Морфологический анализ и нормализация понятий при индексировании.
- •26.Сущность процесса кодирования и системы кодирования.
19. Назначение и состав лск. Характеристика основных составляющих лск.
Информационно-поисковая система (ИПС) представляет собой совокупность методов и средств, предназначенных для хранения и поиска документов, сведений о документах или отдельных фактов данных.
Одним из компонентов в составе ИПС является логико-семантический комплекс (аппарат) (ЛСК/ЛСА), состоящий из информационно-поискового языка (одного или нескольких), правил его использования в процессе индексирования документов и запросов и критерия выдачи. ЛСА определяет качество информационного поиска. Основной элемент - это ИПЯ. Процесс выражения содержания документа или запроса на ИПЯ - индексирование. При индексации создаются поисковые образы документов(ПОД)(текст, выражающий на ИПЯ основное смысловое содержание документа и используемый для информационного писка) и поисковые образы запросов(ПОЗ)(текст, выражающий на ИПЯ смысловое содержание информационного запроса).
ПОД включены в информационно-поисковый массив (ИПМ). ИПМ - упорядоченная совокупность поисковых образов документов вместе с адресами их хранения в документальном массиве ИПС. Документальный массив ИПС - совокупность документов, выдаваемых потребителю информации в ответ на запрос.
ПОЗ дополняются специальными указаниями о последовательности выполнения логических операций и образуют поисковые предписания.
Информацио́нный по́иск (англ. Information retrieval) — представляет собой процесс выявления в некотором множестве документов (текстов) всех тех, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные. Коротко – процесс поиска неструктурированной документальной информации. Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление необходимой информации заинтересованным лицам. Термин «информационный поиск» был впервые введён Кельвином Муром в 1948 в его докторской диссертации, опубликован и употребляется в литературе с 1950.
Релева́нтность (англ. relevant) —степень соответствия запроса и найденного, то есть уместность результата.
Пертине́нтность (англ. pertinence) — соотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).
Критерий смыслового соответствия - мера соответствия между содержанием запроса и документа, достаточная для признания данного документа релевантным данному запросу. Вводится совокупность признаков, на основании которых устанавливается степень необходимого и достаточного соответствия между поисковым предписанием и поисковым образом документа, выраженными на одном и том же ИПЯ.
Критерий выдачи - совокупность признаков, по которым: определяется степень соответствия поискового образа документа поисковому предписанию; и принимается решение о выдаче или невыдаче того или иного документа в ответ на информационный запрос.