Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kharina_ElizavetaLab1.docx
Скачиваний:
2
Добавлен:
09.11.2018
Размер:
103.89 Кб
Скачать

Национальный исследовательский ядерный университет (МИФИ)

_____________________________________________________________________________

Факультет управления

Кафедра системного анализа

Отчет По лабораторной работе №1 «Изучение средств и технологий информационного поиска»

Выполнила студентка группы У7-07

Харина Елизавета

Москва, 2011 г.

Цель работы: Освоение средств подготовки поискового предписания и оценка стратегий поиска информации в БД реферативно-библиографической информации.

Метод выполнения:

В работе используются три следующих поисковых технологии:

1). “Вербальная” технология - поиск по поисковому предписанию (ПП) в режиме “запрос-ответ", в том числе:

  • поиск по структурированному ПП с использованием только нормализованной лексики поля ключевых слов;

  • поиск по комбинированному ПП со свободной лексикой и несколькими поисковыми полями в т.ч. с использованием общего поискового словаря;

  • поиск по ПП с использованием критерия частичного вхождения.

2). Технология накопления результата.

3). Технология реформулировки запроса по обратной связи.

Оценка качества поиска проводится пользователем, для чего каждый найденный документ должен быть оценен на соответствие теме (информационной потребности) по следующей шкале:

- "релевантен", если соответствует теме и удовлетворяет информационной потребности (полезен для решения поставленной задачи);

- "нерелевантен", если не соответствует теме или не содержит сведений, полезных для решения поставленной задачи.

Порядок выполнения работы

Работа выполняется в среде АИПС WinIRBIS на материале БД «Информатика(1986-2000)» и включает в себя три этапа:

1. Структурирование запроса и формирование исходного поискового предписания;

2. Изучение технологии формирования ПП и выполнения поиска по запросу;

3. Поиск в режиме динамического реформулирования запроса.

Этап 1. Структурирование запроса и формирование исходного ПП

Тема: Разработка модуля расписания приема и регистрации граждан для информационной системы, эксплуатируемой в органах социальной защиты населения

Цель: Повышение эффективности взаимодействия внутри и между органами управления и организациями, задействованными в системе адресной социальной поддержки населения

Модуль расписания для информационной системы, эксплуатируемой в органах социальной защиты населения

Редактор расписания

Сетка расписания

состав объекта

Редактирование распорядков дня

Редактирование дополнений

Редактирование параметров повторения

функции

функции

Управление занятостью ресурсов

Формирование первичной регистрации

граждан

параллельная обработка данных

Формирование отчетов

Осуществление предварительной записи граждан на прием к специалистам

Предметная область:

1.ИС «социальная помощь»— комплексная автоматизированная информационная система, в которой объединены персональный учет сведений о гражданах, обратившихся за социальной поддержкой в органы социальной защиты населения, средства общения между сотрудниками, финансовая и административная информация.

Ключевые слова: Информационная система «Социальная помощь»

2. Ресурс – единица, которая может оказывать услуги гражданам, которые обращаются в органы социальной защиты населения за любыми видами социальной поддержки (например, осуществлять приём граждан, осуществлять социальные выплаты, доплаты к государственным пенсиям, государственную помощь малоимущим семьям и т.д.). Ресурсами могут являться сотрудники, специалисты ,кабинеты

Ключевые слова: сотрудники, кабинеты, специалисты, сотрудники

3. Расписание – совокупность распорядков дня ресурсов.

Ключевые слова: расписание, сетка, планирование и SCHEDULING

4. Распорядок дня - совокупность временных интервалов. К распорядку дня может быть привязано несколько параметров повторения и дополнений.

Ключевые слова: распорядок, режим

5. Временные интервалы – единицы, на которые разделяется рабочее время ресурса. Для временного интервала задаются следующие параметры:

Ключевые слова: рабочее время

Исходное поисковое предписание:

KW: 'SCHEDUL'* или ('СОЦИАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕ'*) или (('СОТРУДНИК'*или ‘СПЕЦИАЛИСТ’* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАН'* и 'РАБОТ'*) или 'РАСПОРЯД'*) ) или ('РАБОЧЕЕ ВРЕМЯ') и ('ОРГАНИЗАЦИЯ ТРУДА')

Поиск по полю «Ключевые слова» выдал 30 документов, из них 10 релевантных, нерелевантных – 20.

Таблица частотных характеристик:

Частота термина

Термин

В Выдаче

В Базе

SCHEDULING*

2

2

СОЦИАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕ*

1

1

СОТРУДНИК*

1

1

СПЕЦИАЛИСТ*

1

1

КАБИНЕТ*

1

1

РАСПИСАНИЕ*

2

2

ПЛАН*

4

332

РАБОТ*

2

24

РАСПОРЯДОК*

1

1

РАБОЧЕЕ ВРЕМ*

1

1

ОРГАНИЗАЦИЯ ТРУДА

21

21

Этап 2. Изучение “вербальной” технологии поиска по запросу

Модифицированное поисковое предписание:

KW:('SCHEDUL'* или ('СОЦИАЛЬН’* или ‘ИНФОРМАЦИОННЫЕ СИСТЕ'*) или (('СОТРУДНИК'* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАН'* sent 'РАБОТ'*) или 'РАСПОРЯД'*) ) или ('РАБОЧ'*'ВРЕМ'*) ИЛИ 'ОРГАНИЗ'*'ТРУД'*)

Поиск по полю ключевым словам дал 31 документов, из них 10 релевантных, нерелевантных -25.

Таблица частотных характеристик:

Частота термина

Термин

В Выдаче

В Базе

SCHEDULING*

2

2

СОЦИАЛЬН'*

1

1

СОТРУДНИК*

1

1

КАБИНЕТ*

1

1

РАСПИСАН*

1

2

ПЛАН*

3

332

РАБОТ*

1

24

РАСПОРЯД*

1

1

'РАБОЧ'*'ВРЕМ'*

1

1

'ОРГАНИЗ'*'ТРУД'*

21

21

Точность

Полнота

0,33

0,56

По полю «Реферат»

AB:('SCHEDUL'* или ('СОЦИАЛЬН'* или 'ИНФОРМАЦ'*'СИСТЕ'*) или (('СОТРУДНИК'* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАН'* sent 'РАБОТ'*) или 'РАСПОРЯД'*) ) или ('РАБОЧ'*'ВРЕМ'*) ИЛИ 'ОРГАНИЗ'*'ТРУД'*)

По полю «Реферат» найдено 2888 документов.

Модифицированное поисковое предписание:

AB:(('SCHEDUL'* или ('СИСТЕМ'*(2) и ( ('СОЦИАЛЬН'*'ИНФОРМАЦИОН'*) или (('СОТР'* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАНИРОВ'* + 'РАБОТ'*(1)) или 'РАСПОРЯД'*(2)) ) или ('РАБОЧ'*'ВРЕМ'*) ИЛИ 'ОРГАНИЗ'*'ТРУД'*)) NOT 'БЗ' NOT 'БИБЛИОТ'* NOT 'ЭКСПЕР'* NOT 'ПОРЯД'*))

Были исключены слова 'БЗ', 'БИБЛИОТ'*, 'ЭКСПЕР'*, 'ПОРЯД'* для уменьшения шума.

По полю «Реферат» найдено 64 документа ,11 из них релевантные.

Точность

Полнота

0,16

0,44


Результат объединения результатов поиска по полю «Реферат» и «Ключевые слова»:

(AB:(('SCHEDUL'* или ('СИСТЕМ'*(2) и ( ('СОЦИАЛЬН'* или ГОРОДСК’* или 'ИНФОРМАЦИОН'*) или (('СОТР'* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАНИРОВ'* + 'РАБОТ'*(1)) или 'РАСПОРЯД'*(2)) ) или ('РАБОЧ'*'ВРЕМ'*) ИЛИ 'ОРГАНИЗ'*'ТРУД'*)) NOT 'ОЦЕН'* NOT 'БЗ' NOT 'БИБЛИОТ'* NOT 'ЭКСПЕР'* NOT 'ПОРЯД'*))) или (KW:('SCHEDUL'* или ('СОЦИАЛЬН'*'ИНФОРМАЦ'*'СИСТЕ'*) или (('СОТРУДНИК'* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАН'* sent 'РАБОТ'*) или 'РАСПОРЯД'*) ) или ('РАБОЧ'*'ВРЕМ'*) ИЛИ 'ОРГАНИЗ'*'ТРУД'*))

78 документов, из них 6 релевантных.

Точность

Полнота

0,12

0,4


Результат объединения результатов поиска по полю «Реферат», «Ключевые слова» и «Заголовок»:

(AB:(('SCHEDUL'* или ('СИСТЕМ'*(2) и ( ('СОЦИАЛЬН'* или 'ИНФОРМАЦИОН'*) или (('СОТР'* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАНИРОВ'* + 'РАБОТ'*(1)) или 'РАСПОРЯД'*(2)) ) или ('РАБОЧ'*'ВРЕМ'*) ИЛИ 'ОРГАНИЗ'*'ТРУД'*)) NOT 'ОЦЕН'* NOT 'БЗ' NOT 'БИБЛИОТ'* NOT 'ЭКСПЕР'* NOT 'ПОРЯД'*))) или (KW:('SCHEDUL'* или ('СОЦИАЛЬН'*'ИНФОРМАЦ'*'СИСТЕ'*) или (('СОТРУДНИК'* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАН'* sent 'РАБОТ'*) или 'РАСПОРЯД'*) ) или ('РАБОЧ'*'ВРЕМ'*) ИЛИ 'ОРГАНИЗ'*'ТРУД'*)) или (TI:('SCHEDUL'* или ('СОЦИАЛЬН'*'ИНФОРМАЦ'*'СИСТЕ'*) или (('СОТРУДНИК'* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАН'* sent 'РАБОТ'*) или 'РАСПОРЯД'*) ) или ('РАБОЧ'*'ВРЕМ'*) ИЛИ 'ОРГАНИЗ'*'ТРУД'*))

114 документов, из них 15 релевантных

Точность

Полнота

0,17

0,76


Поиски с “автомаскированием”.

По полю реферат:

AB:((SCH$D$L* или (СИСТ$М*(2) и ( (СОЦ$$ЛЬН*$НФ$РМ$Ц$$Н*) или ((СОТР* или КАБ$Н$Т*) или (РАСП$С$Н* или (ПЛАН$Р$В* + РАБ$Т*(1)) или РАСП$Р$Д*(2)) ) или (РАБ$Ч*ВР$М*) ИЛИ ОРГ$Н$З*ТР$Д*)) NOT БЗ NOT БИБЛ$$Т* NOT ЭКСП$Р* NOT ПОР$Д* ))

В выдаче – 1896 документов.

Было исключено слово РАСПР$СТР$Н* из за появления шума.

AB:((SCH$D$L* или (СИСТ$М*(2) и ( (СОЦ$$ЛЬН *$НФ$РМ$Ц$$Н*) или ((СОТР* или КАБ$Н$Т*) или (РАСП$С$Н* или (ПЛАН$Р$В* + РАБ$Т*(1)) или РАСП$Р$Д*(2)) ) или (РАБ$Ч*ВР$М*) ИЛИ ОРГ$Н$З*ТР$Д*)) NOT БЗ NOT БИБЛ$$Т* NOT ЭКСП$Р* NOT ПОР$Д* NOT РАСПР$СТР$Н*))

79 документов, из них 10 релевантных

Точность

Полнота

0,25

0,72


По полю «Ключевые слова»

KW:(SCH$D$L* или (СОЦ$$ЛЬН *$НФ$РМ$Ц*С$СТ$*) или ((СОТР$ДН$К* или КАБ$Н$Т*) или (РАСП$С$Н* или (ПЛАН* sent РАБ$Т*) или РАСП$Р$Д*) ) или (РАБ$Ч*ВР$М*) ИЛИ ОРГ$Н$З*ТР$Д*)

В выдаче - 1123 документов.

Было исключено слово РАСПР$СТР$Н* из за появления шума.

KW:((SCH$D$L* или (СОЦ$$ЛЬН *$НФ$РМ$Ц*С$СТ$*) или ((СОТР$ДН$К* или КАБ$Н$Т*) или (РАСП$С$Н* или (ПЛАН* sent РАБ$Т*) или РАСП$Р$Д*) ) или (РАБ$Ч*ВР$М*) ИЛИ ОРГ$Н$З*ТР$Д*) NOT РАСПР$СТР$Н* )

В выдаче - 587документов.

Было исключено слово РАСПР$Д$Л * из за появления шума.

KW:((SCH$D$L* или (СОЦ$$ЛЬН *$НФ$РМ$Ц*С$СТ$*) или ((СОТР$ДН$К* или КАБ$Н$Т*) или (РАСП$С$Н* или (ПЛАН* sent РАБ$Т*) или РАСП$Р$Д*) ) или (РАБ$Ч*ВР$М*) ИЛИ ОРГ$Н$З*ТР$Д*) NOT РАСПР$СТР$Н* NOT РАСПР$Д$Л*)

В выдаче- 62 документа, из них 11 релевантных.

Точность

Полнота

0,24

0,72


Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]