Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lecture 4.doc
Скачиваний:
10
Добавлен:
14.09.2019
Размер:
541.7 Кб
Скачать
    1. Прагматика текста

Описанным в разделе 3.4 способом строятся семантические сети целых предметных областей. В этом случае сети формируются на основе корпусов текстов, описывающих предметные области.

Последующий прагматический анализ входного текста заключается в выделении цепочки наиболее весомых ключевых предикатных структур, характерных для предметной области, к которой относится текст. Объем этой цепочки зависит от порога, примененного к смысловому весу предикатных структур (выделение главных предикатных структур), а порядок этих предикатных структур – от порядка их следования в предложениях текста. Такая цепочка полностью характеризует смысловое содержание текста в терминах выбранной предметной области.

Отнесение текста к одной из предметных областей осуществляется сравнением ассоциативной сети текста и ассоциативных сетей предметных областей (классификация) [29]. Степень пересечения ассоциативных сетей текста и предметной области характеризует смысловое пересечение текста и предметной области.

Последовательность главных предикатных структур, выбранных из текста, с использованием порогового преобразования, описывает основное содержание текста.

Текст по своей структуре делится на две части: тему и рему. Тема обычно находится в первой части текста. Рема – во второй. Состав ключевых предикатных структур текста можно сравнить с составом ключевых предикатных структур предметной области. Ключевые предикатные структуры текста, совпадающие с ключевыми предикатными структурами предметной области, обычно входят в тематическую часть текста. Ключевые предикатные структуры текста, отличающиеся от ключевых предикатных структур предметной области, входят, возможно, в рематическую часть текста. Выделив из цепочки ключевых понятий рематической части текста ключевые понятия, не относящиеся к предметной области, можно сформулировать основное новое содержание текста.

3.5.1. Цепочка предикатных структур предложений текста как сценарий, описанный в тексте

Рассмотрим формализм взаимодействия семантической сети с последовательностью предикатных структур текста. В тех же терминах, что и описанная в разделе 2 семантическая сеть , предикат можно представить себе как звездочку. Субъект соответствует главному понятию звездочки , он связан с актантами предиката, которые являются его (субъекта) ближайшими ассоциантами – . В отличие от подобного представления в разделе 2, звездочки являются не парами, а тройками.

Определение 10. Под предикатом будем понимать тройку , где - субъект, а – актанты предиката, - предикатное отношение:

.

(3.1)

Последовательность субъект-объектных пар предикатов , соответствующих последовательности их содержащих предложений текста в порядке их появления в тексте, спроецированная на семантическую сеть, высекает на семантической сети непрерывный или разрывный путь , где I – множество текстов, описывающих предметную область. Они формируют ассоциативную сеть предметной области , где - множество предметных областей, а объединение ассоциативных сетей разных предметных областей формирует модель мира в текстовой модальности (см. Раздел 2). Удалением слабых связей ассоциативную сеть предметной области можно разбить на подсетей , где соответствует множеству различных понятий – подтем предметной области, вокруг которых группируются подсети предметной области.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]