- •Определения понятия «информации». Прагматические и атрибутивные свойства информации.
- •Свойства концентрации и рассеяния информации. Характер закономерностей.
- •Понятия «информационный объект», «информационное взаимодействие».
- •Определение понятия информации с точки зрения информационного взаимодействия.
- •Свойства информации с точки зрения модели информационного взаимодействия.
- •Модель процесса генерации знания в рамках общей теории систем.
- •Соотношение понятий «данные», «информация», «знания».
- •Модель процесса информирования. Типовые схемы информирования.
- •Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
- •Определение ис. Организационно-функциональная структура аис
- •Назначение и классификация информационных систем. Конкретная и абстрактная ипс.
- •Структурная схема процессов в абстрактной аипс. Режимы ретроспективного поиска и ири.
- •Состав, назначение, требования к ипя. Классификация дескрипторных ипя.
- •Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
- •Предкоординированные и посткоординированные информационно-поисковые языки.
- •Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис.
- •Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
- •Типология информационных потребностей (когнитивная модель)
- •Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
- •Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •Понятие стратегии и технологии поиска. Связь стратегии и типа поисковой задачи.
- •Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
- •Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
- •Уровневая модель информационного взаимодействия "Пользователь - аипс". Основные этапы (общая схема) поиска информации.
- •Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа.
- •Типы обратной связи в технологии информационного поиска.
- •Линейная модель механизма поиска по совпадению терминов.
- •Линейная модель механизма поиска по логическому выражению.
- •Линейная модель механизма поиска документов-аналогов.
- •Линейная модель механизма эвристического поиска.
- •Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •Матрицы ассоциации документов, терминов и их свойства.
- •Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ипс.
- •Основные частные и интегральные критерии оценки аипс.
- •Понятие рабочей характеристики аипс.
- •Матрицы "термин-документ", "термин-термин" и их свойства.
- •Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •Назначение, состав и структура лингвистического обеспечения ис.
- •Основные методы идентификации объектов.
- •Классификация. Определение и формально–логические правила построения.
- •Типы классификаций. Иерархические классификации. Примеры.
- •Типы классификаций. Фасетные классификации. Примеры.
- •Сравнительная характеристика иерархических и фасетных классификаций.
- •Кодирование объектов. Системы кодирования. Примеры.
- •Назначение, структура и использование информационно-поисковых тезаурусов.
- •Обобщенная технологическая схема и компоненты информационного поиска.
- •Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
Основные частные и интегральные критерии оценки аипс.
На основе первичных координат построены частные показатели оценки технической эффективности:
Полнота- доля выданных релевантных документов по сравнению с их общим количеством в информационном массиве: r=a/(a+c)= x/x0=|LИ ∩LC|/|LИ|
Точность – доля релевантных документов во множестве выданных: p=a/(a+b)=x/n=|LИ ∩LC|/|LC|
Специфичность- доля невыданных документов по сравнению с невыданными и выданными нерелевантными: σ=d/(b+d)=1- (n-x)/(n0 – x0)=|L0\ (LИ ULC)| / |L0\LИ|
Общность- характеризует качество комплектования поискового массива ( доля релевантных документов в информационном массиве): p0=(a+c)/(a+b+c+d)=n/n0=|LИ|/|L0|
Относительный объем выдачи: v=(a+b)/(a+b+c+d)=n/n0=|LC|/|L0|
Отдельно взятое значение одного из частных показателей не отражает качество выдачи, поэтому обычно их используют парами <r,p>, <v,r> и тд. Пары показателей могут быть интерпретированы как прямоугольные координаты, тогда выдача системы отображается точкой на соответствующей плоскости.
Координаты <v,r> получаются путем нормирования к единице координат <n,x>, при этом заштрихованные области диаграммы соответственно сжимаются до треугольника с меньшей стороной, равной р0. Т.к. р0 очень мало, этими областями можно пренебречь и в дальнейшем координаты <v,r> могут изображаться в форме квадрата без указания областей.
Интегральные показатели оценки технической эффективности.
Использование частных показателей неудобно, т.к. невозможно определить какая из выдач будет предпочтительнее- с координатами <r1,p1> или <r2,p2>, если p1<p2 и r1>r2. Это вызывает необходимость построения интегральных показателей. Если частные показатели p,r, σ включают только часть переменных <a,b,c,d> (как правило 3), то интегральные охватывают все переменные и вполне однозначны.
Интегральные показатели: коэффициент линейной корреляции и показатель полезной работы.
Показатель полезной работы базируется на предположении о том, что качество поиска АИПС тем выше, чем в большей степени потребитель освобождается от необходимости полного просмотра массива документов.
Понятие рабочей характеристики аипс.
Вывод показателя полезной работы АИПС базируется на предположении о том, что качество поиска АИПС тем выше, чем в большей степени потребитель освобождается от необходимости полного просмотра массива документов. Пусть потребителю требуются релевантные документы в количестве х. При непосредственном просмотре L0 трудозатраты (количество просмотренных документов) в среднем составляет:
В то время как при просмотре массива Lc, имеющего точность р, затраты
Работа АИПС равна разности данных величин или высвобожденной информационной деятельности потребителя:
(1)
С учётом других координат и переменных выражение примет вид:
Пусть прямые параллельны 0р0 и проходят через различные точки прямой 0И. Общее уравнение прямой, проходящей черези имеющей наклон р0, есть:
Подставим в формулу (1), имеем:
Тем самым, на прямых вида величина Сис остаётся постоянной. По мере приближения точки пересечения прямой с 0И к точке И данная константа увеличивается. Она приобретает значение, если линия проходит ниже прямой 0р0.
Таким образом, Сис удовлетворяет условиям:
Или в координатах <n,x>:
Установление пределов измерения Сис позволяет нормировать эту величину:
Мера полезной работы ИС изменяется от +1 до -1, причём:
в точке И ή=+1 (идеальная система, выдающая все релевантные и только релевантные сообщения)
в точке Д ή=-1 (система, выдающая все нерелевантные и только нерелевантные сообщения - дизинформирующая)