- •Морфологический анализ
- •Синтаксический анализ текста
- •Предикатная структура – локальное семантическое представление предложения текста
- •Семантическая сеть – глобальное представление текста
- •Прагматика текста
- •3.5.1. Цепочка предикатных структур предложений текста как сценарий, описанный в тексте
- •3.5.2. Шаблоны ситуаций
- •3.5.3. Понимание текста как его интерпретация в терминах цепочек предикатных структур
- •Построение дерева зависимостей
- •1. Правило модиф_прил
- •2. Правило нар_прил
- •3. Правила для наречий сравнительной степени сравн_степень
- •3.3.3. Выявление предикатной структуры предложения
Прагматика текста
Описанным в разделе 3.4 способом строятся семантические сети целых предметных областей. В этом случае сети формируются на основе корпусов текстов, описывающих предметные области.
Последующий прагматический анализ входного текста заключается в выделении цепочки наиболее весомых ключевых предикатных структур, характерных для предметной области, к которой относится текст. Объем этой цепочки зависит от порога, примененного к смысловому весу предикатных структур (выделение главных предикатных структур), а порядок этих предикатных структур – от порядка их следования в предложениях текста. Такая цепочка полностью характеризует смысловое содержание текста в терминах выбранной предметной области.
Отнесение текста к одной из предметных областей осуществляется сравнением ассоциативной сети текста и ассоциативных сетей предметных областей (классификация) [29]. Степень пересечения ассоциативных сетей текста и предметной области характеризует смысловое пересечение текста и предметной области.
Последовательность главных предикатных структур, выбранных из текста, с использованием порогового преобразования, описывает основное содержание текста.
Текст по своей структуре делится на две части: тему и рему. Тема обычно находится в первой части текста. Рема – во второй. Состав ключевых предикатных структур текста можно сравнить с составом ключевых предикатных структур предметной области. Ключевые предикатные структуры текста, совпадающие с ключевыми предикатными структурами предметной области, обычно входят в тематическую часть текста. Ключевые предикатные структуры текста, отличающиеся от ключевых предикатных структур предметной области, входят, возможно, в рематическую часть текста. Выделив из цепочки ключевых понятий рематической части текста ключевые понятия, не относящиеся к предметной области, можно сформулировать основное новое содержание текста.
3.5.1. Цепочка предикатных структур предложений текста как сценарий, описанный в тексте
Рассмотрим формализм взаимодействия семантической сети с последовательностью предикатных структур текста. В тех же терминах, что и описанная в разделе 2 семантическая сеть , предикат можно представить себе как звездочку. Субъект соответствует главному понятию звездочки , он связан с актантами предиката, которые являются его (субъекта) ближайшими ассоциантами – . В отличие от подобного представления в разделе 2, звездочки являются не парами, а тройками.
Определение 10. Под предикатом будем понимать тройку , где - субъект, а – актанты предиката, - предикатное отношение:
. |
(3.1) |
Последовательность субъект-объектных пар предикатов , соответствующих последовательности их содержащих предложений текста в порядке их появления в тексте, спроецированная на семантическую сеть, высекает на семантической сети непрерывный или разрывный путь , где I – множество текстов, описывающих предметную область. Они формируют ассоциативную сеть предметной области , где - множество предметных областей, а объединение ассоциативных сетей разных предметных областей формирует модель мира в текстовой модальности (см. Раздел 2). Удалением слабых связей ассоциативную сеть предметной области можно разбить на подсетей , где соответствует множеству различных понятий – подтем предметной области, вокруг которых группируются подсети предметной области.