Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
bilety.doc
Скачиваний:
11
Добавлен:
25.09.2019
Размер:
492.54 Кб
Скачать

4Компьютерная лингвистика: моделирование общения и структуры сюжета

КЛ – обычно - широкая область исп-ния компьют-х инструментов - программ, комп-ных технологий орг-ции и обработки данных - для модел-ния f-ния яз в тех/иных усл-ях, сит-циях, проблемных областях, а также сфера применения комп-ных моделей яз не т-ко в лингв-ке, но и в смежных с ней дисциплинах. Комп-ное модел-ние яз м-т рассм-ся и как сфера приложения теории программ-ния в области лингв-ки. Термин КЛ задает общую ориентацию на исп-ние комп-ров для решения разн научных и практ-ких задач, связ-х с яз.

Как особое научное напр-ление КЛ оформилась в 60-е гг.

Комп-ные пр-мы, модел-щие те/иные аспекты f-ния языка, м-т исп-ть самые разные ср-ва программ-ния => об общем метаязыке гов-ть не приходится. Но! это не совсем так. Сущ-ют общие принципы комп-го модел-ния мышления, кот-е так/иначе реализ-ся в любой комп-й модели. В основе этого языка лежит теория знаний, разраб-ная в AI.

Основной тезис теории знаний - мышление = процесс обработки и порождения знаний. Знание счит-ся неопределяемой категорией. В качестве "процессора", обраб-щего знания, выступает когнитивная система ч-ка.

2 основных вида знаний - Декларативные знания представляются обычно в виде сов-ти пропозиций (утверждений о чем-либо) (ex: толкования слов в обычных толковых словарях). Деклар-ные знания поддаются процедуре верификации в терминах И/Л. Процедурные знания представляются как послед-ть (список) операций, действий, кот-е следует выполнить. Это некот-я общая инструкция о действиях в некот-й сит-ции (ex: инструкции по пользованию бытовыми приборами). Процедурные знания невоз-но верифицировать как И/Л, их м-но оценивать т-о по успешности/неуспешности алгоритма.

Эл-ты метаязыка имеют онтологический и инструментальный аспект = они одновр-но обозначают нек-рые реальные сущности когн-ной с-мы ч-ка и СП-бы представления этих сущностей на нек-рых метаязыках. Онтологически разделение деклар-ных и процед-ных знаний соотв-ет различным типам знаний когн-ной с-мы ч-ка. Инструм-но знание (как онтологически процед-ное, так и деклар-ное) м-но представить как совок-ть дескрипций, описаний и как алгоритм, инструкцию. =>онтологически декла-ное знание об объекте действ-ти м-но представить процедурно как совок-ть инструкций, алгоритмов по его созданию, сборке или как алгоритм его типичного использ-ния. Верно и обратное: онтологически процедурное знание можно представить декларативно.

Иссл-ли сходятся в том, что всякое деклар-ное знание м-но представить процедурно, хотя это м-т оказ-ся для когнит-й с-мы очень неэкономным. Деклар-ное знание сущест-но > эксплицитно, оно легче осознается ч-ком, чем процедурное. => возникает ? о возм-ти деклар-ного представления  процедурного знания. Но! экспликация имплицитного процед-го знания часто приводит к его разрушению.

В теории знаний для изучения и представления знания используются различные структуры знаний - фреймы, сценарии, планы.

Фрейм: концептуальная структура для деклар-ного представления знаний о типизир-ной тематически единой сит-ции, содержащая слоты, связ-ные м/у собой опред-ми семант-ми отн-ями. Фрейм часто представляют в виде таблицы, строки которой образуют слоты. Каждый слот имеет свое имя и содержание. Фрейм м-т включать вложенные подфреймы и отсылки к другим фреймам.

Вместо таблицы часто исп-тся предикатная форма представления: фрейм имеет форму предиката или f-ции с аргументами. Сущ-ют и др СП-бы предст-ния фрейма. Например, он м-т предст-ся в виде кортежа следующего вида: {<имя фрейма> <имя слота1> <значение слота1>}, {<СОТРУДНИК> <ФАМИЛИЯ> <Петров>, <ДОЛЖНОСТЬ> <истопник>, <ВОЗРАСТ> <32>...}. Обычно такой вид имеют фреймы в языка представлениях знаний. Как и др когн-ные категории КЛ, понятие фрейма омонимично: это часть когн-ной с-мы ч-ка, т.е. м-но сопоставить с такими понятиями как гештальт, прототип, стереотип, схема. Инструм-ная сторона фрейма – стр-ра для деклар-ного предст-ния знаний.

Тесно связано с категорией фрейма понятие сцены. В грамматиках сюжетов сцена предстает как часть эпизода или повествования. В AI сцены используются в с-мах распознавания образов, а также в программах, ориент-ных на иссл-ние (анализ, описание) проблемных ситуаций.

Сценарий предс-ет собой концептуальную стр-ру для процед-го представления знаний о стереотипной сит-ции или стереотипном поведении. Эл-ми сценария являются шаги алгоритма или инструкции. Сценарий м-но представить не т-ко в виде алгоритма, но и в виде сети, вершинам кот-й соотв-ют некот-е ситуации, а дугам - связи между сит-ми. +нек-рые иссл-тели привлекают для комп-го моделир-ния интеллекта категорию скрипта. Скрипт - это некот-я общепринятая послед-ть причинных связей.

В рез-те применения сценария к конкр-й проблемной ситуации форм-тся план. План исп-тся для процед-го представления знаний о возм-х действиях, ведущих к достижению опред-ной цели. План соотносит цель с послед-тью действий. В с-мах AI план возникает в рез-те планирующей деят-ти соотв-щего модуля - модуля планирования. В отличие от сценария, план связан с конкр-й ситуацией, конкр-м исполнителем и преследует достижение опред-ной цели.

Еще одно важное понятие - модель мира = совок-сть опред-ным образом организ-ных знаний о мире, свойственных когнитивной с-еме или ее комп-ной модели. В несколько более общем виде - часть когн-ной с-мы, хранящая знания об устройстве мира, его закономерностях и пр. В с-мах AI модель мира явл-ся особым блоком, в кот-й в завис-ти от выбранной архитектуры м-т входить общие знания о мире (в виде простых пропозиций), некоторые специф-е факты (cамая высок вершина в мире – Эверест), а также ценности и их иерархии. В различных формализмах модель мира может иметь различную стр-ру: предикатную, сетевую, фреймовую и др.

Некоторые направления КЛ - области, кот-е непоср-но связаны с оптимизацией когнитивной функции языка. Рассм-т 2 сферы компьютерного моделир-ния, в кот-х исп-ся знания о f-нии яз-й с-мы: моделирование общения, моделирование стр-ры сюжета.

Моделирование общения.

Проблематика КЛ часто связ-ся с моделир-нием общения, в частности, с обеспечением общения человека с ЭВМ на ест-ном или огранич-м ест-ном яз-е. + комп-ные модели общения часто исп-тся для изучения самого процесса общения.

Изучение накопившегося опыта эксплуатации комп-ных с-тем позволило иссл-лям по-новому взглянуть на f-ции и стр-ру ком-ции. Рассм-ся ??: что обесп-т естеств-ть общения? Каковы условия связности беседы? Когда общение оказ-ся успешным? В каких случаях возникают ком-ные неудачи и м-но ли их избежать? Какие стратегии общения используют участники ком-ного <->действия при достижении своих ком-ных целей?

Одной из наи> интересных комп-ных моделей диалога, вызвавшей оживленные теоретич-е дискуссии, была прогр-ма Джозефа Вейценбаума "Элиза" (1й вариант в 1966), программа-имитатор, целью кот-й явл-ся не моделир-ние мышления в точном смысле, а моделир-ние реч-го поведения – огранич-ные прогр-кие ресурсы, лингв-й анализ и синтез были сведены к min-му.

Пр-ма "Элиза" была исп-на гр-пой иссл-лей во главе с М. Макгайром для изучения стр-ры диалога и особ-тей е.-я. ком-ции. В эксперименте с "Элизой" беседовали в течение часа 24 испытуемых. 15 участников (62 %) были уверены, что им отвечал ч-к, 5 испытуемых (21 %) обнаружили опред-е колебания и лишь четверо участников (17%) были абс-но уверены, что общались с ЭВМ. С лингв-кой т-ки зрения алгоритмы пр-мы "Элиза" включают минимум лингв-кой инфо. Во-1х, это комплекс ключевых слов, кот-е актуализуют некот-е устойчивые коммун-ные формулы (шаблоны), во-2х, спос-ть относ-но несложно трансформ-ть предшествующее выск-ние (ex: пр-ма в состоянии переделать предшеств-е утверждение в общий ?).

Выводы: 1)проявление важнейшей особенности ком-ции на е.я.: е.-я. дискурс очень терпим по отношению к сбоям и ошибкам - он избыточен и помехоустойчив. =>ч-к склонен наделять смыслом то, что часто смысла не имеет (испытуемые сами порождают смысл диалога, сами обеспеч-т его связность, сами припис-т партнеру ком-ные интенции).

2) испытуемые старались установить кто перед ними – комп-р или ч-к (т.е. ролевые характеристики партнера) как можно раньше: 22 участника из 24 уяснили для себя ситуацию не >, чем за 5 реплик. Определение ролей в ком-ции относится к метауровню общения, т.к. это составляет 1у из предпосылок успешной ком-ции, предохран-щей общение от многочисл-х ком-ных неудач. Это свойство е.-я. ком-ции м-но назвать принципом приоритета метакоммуникативных параметров ситуации общения.

3)связано с сущ-нием разл-х типов коммун-го <->действия м/у людьми. Успешное <->действие м/у ч-ком и пр-мой типа "Элиза" возм-но т-ко в ситуации, когда происходит так называемое "ассоциативное общение", при кот-м реплики диалога связаны не столько логич-ми отн-ми типа "причина - следствие", "посылка - заключение", а ассоц-ми. Элиза не обладала ассоциативной базой =>1а из типичных стратегий "ухода от непонимания", реализ-ная в пр-ме - смена темы беседы.

4)неуниверсальность правил коммуникативного взаимодействия. Каждый тип коммун-и обслуживается своим набором относ-но простых правил, обеспеч-щих связность дискурса, его осмысленность для участников. Из экспериментов М. Макгайра с пр-мой "Элиза" следует, что кроме ассоциативного способа общения, выделяется еще "решение задач", "задавание вопросов" и "уточнение понимания".

Моделирование структуры сюжета.

Комп-ное моделир-ние стр-ры сюжета – перспективное напр-ние КЛ. Изучение стр-ры сюжета относится к проблематике стр-ного литературоведения (в широком смысле), семиотики и культурологии. Имеющиеся комп-ные программы моделир-ния сюжета основ-тся на 3х базовых формализмах представления сюжета – морфол-ком и синт-ком напр-ниях представления сюжета, а также на когнитивном подходе.

Идеи о морф-ком устройстве стр-ры сюжета восходят к известным работам В.Я.Проппа о русской волшебной сказке. Пропп заметил, что при обилии персонажей и событий волшебной сказки кол-во f-ций персонажей ограничено, и предложил аппарат для описания этих f-ций. Идеи Проппа легли в основу комп-ной пр-мы TALE, моделир-щей порождение сюжета сказки. В основу алгоритма программы TALE положена послед-ть f-ций персонажей сказки. Фактически f-ции Проппа задавали мн-во типизир-ных ситуаций, упоряд-ных на основе анализа эмпирического материала. Возм-сти сцепления разл-х ситуаций в правилах порождения определялись типичной послед-тью f-ций – в том виде, в котором это удается установить из т-тов сказок. В пр-ме типичные послед-ти f-ций опис-сь как типовые сценарии встреч персонажей.

В дальнейшем с-ма была усложнена за счет введения модели мира сказки, география кот-го состоит из обычного мира, промежуточного (среднего) мира и иного мира.  мир состоит из локусов, связ-х м/у собой опред-ми отн-ми. Отн-ния связ-т не т-ко локусы внутри  мира, но и локусы различных миров. Обычный мир состоит из след-х локусов: место проживания героя, место получения задания, место дарения волшебных предметов, помогающих выполнить задание. Средний мир отделяет мир героев от мира антигероев. Иной мир включает место обитания антигероя, место битвы м/у героем и антигероем и локус-место награды или цели, кот-й добивается герой. Локусы связаны отн-ми перехода, кот-е представляют возм-е послед-ти развертывания сюжета.

Чисто "морф-го" подхода к стр-ре сюжета сказки явно недостаточно. "Морфемы" сказочного сюжета д-ны не т-ко опред-ным образом сочетаться м/у собой, но и иметь специф-кие ограничения на сочетаемость. Фиксация одного типичного порядка следования f-ций персонажей волшебной сказки сущ-но огранич-ет имеющиеся возм-ти сочетаемости. > адекватное решение этой проблемы дает синт-й подход к стр-ре сюжета

Теоретич-ю основу синт-кого подхода к сюжету т-та составили «сюжетные грам-ки», или «грам-ки повествования» (story grammars). Они появ-сь в сер-не 70-х годов в рез-те переноса идей порождающей грам-ки Хомского на описание макростр-ры т-та. Если важнейшими составляющими синт-кой стр-ры в порождающей грам-ике были глаг-е и именные гр-пы, то в >ве сюжетных грам-к в качестве базовых выделялись экспозиция, событие и эпизод. В теории сюжетных грам-к широко обсужд-сь условия min-сти, т.е. ограничения, опред-шие статус послед-ти из Эл-тов сюжета как норм-й сюжет. НО! оказалось, что чисто лингв-кими мет-ми это сделать невозможно. Многие ограничения носят социокультурный хар-р. Сюжетные грам-ки, сущ-но различаясь набором категорий в дереве порождения, допускали весьма огранич-й набор правил модификации повествовательной стр-ры: в подавляющем >ве случаев эти правила заимствованы из той же порождающей грам-ки. Потенциал варьирования структуры сюжета обеспечивается в первую очередь трансформациями передвижения и опущения.

Исп-ние сюжетных грам-к в комп-ном моделир-нии оказалось неудачным. Синт-кий компонент сюжета, опис-мый грам-ми, отражает чисто внешние особ-ти т-та. Попытка исп-ть грам-ки сюжетов для порождения сюжета приводит к тому, что порождаются т-ты, кот-е не отвечают интуит-му предст-нию о рассказе. Основной вывод дискуссии о недостатках сюжетных грам-к свелся к необх-ти описания сюжета с привлечением категорий "цель", "проблема", "план" и т.д. =>метаязыка, учит-щего т-ко внешние особ-ти сюжета, явно недост-но. Необх-мо обращение к когн-ным состояниям персонажей.

Когнитивный подход к сюжету. В начале 80-х гг В.Ленерт в рамках работ по созданию комп-ного генератора сюжетов предложила оригинальный формализм эмоц-ных сюжетных 1ц, оказавшийся мощным ср-вом представления стр-ры сюжета. При том, что он был изначально разработан для с-мы AI, этот формализм исп-лся в чисто теоретич-х иссл-ниях. Сущность подхода Ленерт заключалась в том, что сюжет описывался как послед-ная смена когнитивно-эмоц-ных состояний персонажей. Тем самым в центре внимания формализма Ленерт стоят не внешние компоненты сюжета – экспозиция, событие, эпизод, мораль, – а его содержательные хар-ки. В этом отн-нии формализм Ленерт отчасти оказывается возвращением к идеям Проппа.

аффективная сюжетная 1ца представляет собой бинарное отношение м/у некоторыми событиями, оцениваемые персонажами +/-, и когнитивно-эмоц-ми состояния персонажей (в разл-х комбинациях - событие & состояние; событие & событие и т.д.). Всего выдел-ся 5 типов бинарных отн-ий: мотивация, актуализация, прекращение 1го действия другим, эквивалентность, а также каузальная связь м/у персонажами. сюжетная 1ца получает название, напр-р, УСПЕХ, НЕУДАЧА, УПОРСТВО, ПРОБЛЕМА и т.д.

+ Ленерт участвовала в проекте, в котором формализм, предназн-ный для машинной реализации, исп-тся для выявления сюжетных сверток евангельского т-та, объяс-щих, почему т-ты Евангелия оказали огромное влияние на мил-ны людей и на их культуру. Удалось выявить неск-ко таких сюжетных мотивов, повтор-хся в фольклоре и мифах, и занимающих центральное положение в сюжетной стр-ре Евангелий (ex: "восстания против неправедной власти и успех восстания, интерпретируемый как тайное блаженство, достигаемое ценой собст-ной смерти".

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]