Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры к экзамену.doc
Скачиваний:
69
Добавлен:
16.03.2015
Размер:
1.59 Mб
Скачать

Общая структура обработки вопроса

Все вопросы делятся на простые и сложные. Конструкция вопроса начинается чаще всего с вопросительного слова (в частности оно может отсутствовать), также содержит объект запроса и условие запроса. Семантические группы, в которых участвуют как объекты и условия, являются входными семантическими и группами для запроса. Подразумевается, что в сети имеется результат – ответ на этот запрос. В качестве вопр. Слов используются:

  1. Какой(какие, какое)

  2. Правда ли, что..

  3. Что – какие предметы (какие сведения, формы, бланки и т.д.)

  4. Кто – какие люди (какие сотрудники, служащие и т.д.)

  5. Где – какие места (какие города, населенные пункты и т.д.)

  6. Сколько – какое количество

  7. Когда – какое время (какой период и т.д.)

  8. Почему – какие причины

  9. Как – какие методы (какие процессы и т.д.)

Пример:

    1. {Какие}(ВС- слово){сотрудники} (ВО-область){работают в отделе}(ВУ- условие)?

    2. {Правда ли, что}(ВС) {выключатель}(ВО) {17 выключен}(ВУ)?

    3. Какие сотрудники получают зарплату больше 20 тыс. рублей?

Для простых вопросов можно использовать следующую грамматику:

<простой вопрос>::=<текст простого вопроса>?

<текст простого вопроса>::=<ВО><УВ>|<УВ><ВС><ВО>|<УВ><ВС><ВО><УВ>|<ВО> |<ВС><ВО>

<УВ>::=<слово>|<слово><число>

<ВО>::=<слово>|<слово><число>

<ВС>::=Кто|Правда ли, что…

Структура сложных вопросов

Сложные вопросы содержат вложенные конструкции – 1 или несколько.

<Вложенная конструкция>::=<вопросное слово><вопросная область>|<вопросная область>|<вопросное слово><вопросная область><условие вопроса>.

Пример: Подразделения (ВО), в которых(ВС) работают сотрудники(ВО), которые(ВС) получают зарплату(ВО) > 20 000 рублей(УВ).

На ЯСГ можно перевести как:

Se, k b1, k x1 Otn2 Znx5

Se – структурная единица

K – вопросное слово

b1 – экземпляр СГ <сотрудник>

x1 – экземпляр СГ <зарплата>

Otn – отношение (>)

Znx5 – значение характеристик

Тезаурус. Принцип построения словаря.

<словарь>:: = <статья> | <статья><словарь>

<статья>::=<левая часть><правая часть>

<левая часть>::=<имя СГ>|<сочетание имен>

<правая часть>::=<код>

Словарь – это упорядоченный по алфавиту список статей. В методе СГ при использовании вопросно-ответных систем наличие таких словарей обязательно.

Пример: Диспетчерская управления энергосистемами.

актив мощность * ак_м //знак подстановки

ак_м w1 //идентификатор СГ

вл e

вид_об v

вид_пар w

вид_форм x

ГЭС v2

СамараЭнерго r3

как k (какой, какие, какая)

который k (которые)

мощно w7

напряжение w2

норма s0

объект o

параметр p (значение)

реактив мощность * ре_м

ре_м w4

регион r

станция v1

схема kfx1

сос_пар s

таблица kfx2

форм f

частота w3

1) Активная мощность станции СамараЭнерго? w1 v1 r3 ?

2) Регионы, у которых частота нормальна? r k w3 s0?

3) Нормальные параметры у каких ГЭС? s0 w k v2?

4) Какие ГЭС имеют нормальные параметры? k v2 s0 w?

5) Выдать таблицу частоты? kfx2 w3?

Проблема формального представления смыслового содержания вопроса

Основной проблемой являются недостатки естественного языка c точки зрения формализации.

1. Многозначность средств передачи смысла (лексика, контекст, отношения между словами, ссылки на слова и словосочетания, ранее упоминавшиеся в тексте). Контекст – это связь со смыслом объемной области.

2. Семантическая (смысловая) неоднозначность – синонимия.

3. Многозначность.

Слово обладает разными смыслами:

  • Полисемия – совпадение названий различных предметов, «команда»

  • Омонимия – совершенно разные понятия, которые не имеют общих смыслов

  • Омография – пишутся одинаково, означают разное (замОк, зАмок)

  • Эллипсность - пропуск подразумеваемых слов

В общем случае для анализа запроса нужно выполнить лингвистический анализ. Он включает:

  1. Морфологический анализ – род, падеж, часть речи, число.. – выполняется на базе словоформ

  2. Синтаксический – грамматический, разбор с построением дерева зависимости