- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
3.1. Общие принципы построения словаря
3.1.1. Понятийное пространство и его наполнение
Во второй главе были описаны общие принципы построения классификации различных единиц, в частности, слов языка на основе вектора признаков, набор значений элементов которого необходимо определить. В настоящей главе предлагается вектор понятийной классификации, которая может быть нагружена словами естественного языка: русского, английского и любого другого. Электронная реализация словаря на 10 000 слов, описываемая в главе четвертой, является практической реализацией предлагаемой классификации. Предлагаемый словарь сопоставляет ряду понятий понятийного пространства (узлам классификации) наиболее часто употребляемые слова из различных областей математики, биологии, парикмахерского искусства, информатики и т. д., а также из области «бытовой английский». При этом разделы представляют собой не отдельные классификации, а выборки из общей универсальной классификации. Далее описаны общие принципы построения классификации, позволяющей создавать на ее основе различные словари и базы данных для построения естественно-языковых интерфейсов.
3.1.2. Классификация p1.D3 в целом
Рассмотрим классификацию понятий P1.D3.
P1.D3.G – вектор признаков классификации P1.D3 понятий. Рассмотрим значения этих признаков.
1) Первый уровень классификации понятий соответствуют признаку G1 вектора G.
Пусть G1 = {НЕЧТО, ОТНОШЕНИЕ, СОЗНАНИЕ, ИДЕЯ, ИНФОРМАЦИЯ, МЕСТО, ПРЕДМЕТ, СУЩЕСТВО}. Перечисленные значения признака G1 будем называть основными семами. Здесь и далее семы записываются прописными буквами. Смысловые значения сем определяются в классификации P1.D2.
2) Второй уровень классификации понятий представлен признаком G2.
Множество G2 значений этого признака задается множеством правил порождающей грамматики:
{SàFd, SàFx, dàЖИВОГО, dàНЕЖИВОГО, x КОТОРОГО ЖИВОЕ, x à КОТОРОГО НЕЖИВОЕ, FàЧАСТЬ (OF), FàВНУТРИ (IN), FàНА ПОВЕРХНОСТИ (ON), FàОКОЛО (AT)},
где понятие ОКОЛО обозначает любое ненулевое расстояние между объектами.
3) Третий уровень классификации понятий определяется признаком G3,
G3={Xy (сущность), XXy (сущность чего-то), ОТНОШЕНИЕXy (свойство), ОТНОШЕНИЕXXy (связь), ОТНОШЕНИЕСУЩЕСТВОXy (действие), ОТНОШЕНИЕСУЩЕСТВОXXy (соединение), ОТНОШЕНИЕСУЩЕСТВОСУЩЕСТВОXy (презентация), ОТНОШЕНИЕСУЩЕСТВОСУЩЕСТВОXXy (обмен)},
где X – любая из основных сем, определенных на первом уровне классификации, а y – любая последовательность таких сем. Х выделяется как главная по смыслу сема. Знак «» используется в данном случае для обозначения конкатенации. В круглых скобках приведены смысловые пояснения.
4) Множество G4 значений признака G задается множеством правил порождающей грамматики:
{SàP1P2P3P4P5P6P7P8, P1àgКОЛИЧЕСТВО, P1à, P2à gУСТОЙЧИВОСТЬ, P2à, P3à gПОЗИТИВНОСТЬ, P3à , P4à gСПЕКТР, P4à, P5à gИНФОРМАТИВНОСТЬ, P5à, P6à gМЕСТОПОЛОЖЕНИЕ, P6à, P7à gРАЗМЕР, P7à, P8à gИСКУССТВЕННОСТЬ, P8à}, где g – лингвистическое значение шкалы вида: {минимальный, …, малый, …, средний, …, большой, …, максимальный, }. Здесь – пустой символ.
5) Пятый уровень классификации понятий
Множество G5 значений рассматриваемого признака задается множеством правил порождающей грамматики:
{Sàx, xà(xFx), xàxFx, xà1 (существующее), xà0 (несуществующее), xà (возможное), xà (необходимое), FàВКЛЮЧАЕТ, F à ВКЛЮЧАЕТСЯ В, F à ВКЛЮЧАЕТ И ВКЛЮЧАЕТСЯ В, F à ЧАСТИЧНО ВКЛЮЧАЕТ, F à БОЛЬШЕ ЧЕМ, F à МЕНЬШЕ ЧЕМ, F à РАВНО, F à ПОДОБНО, F à СТАНОВИТСЯ, F à ПРОИСХОДИТ ИЗ, F à ОДНОВРЕМЕННО С, F à НЕОДНОВРЕМЕННО С, F à ИМПЛИЦИРУЕТ, F à СЛЕДУЕТ ИЗ, F à СООТВЕТСТВУЕТ, F à СВЯЗАНО С}.
Все последующие уровни классификации получаются путем рекурсивного повторения предложенных пяти уровней классификации. Индекс уровня вычисляется по формуле: Gi=Gmod(i,5), где s Î N (множество натуральных чисел) [53-57].