Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lecture 2.doc
Скачиваний:
6
Добавлен:
14.09.2019
Размер:
2.72 Mб
Скачать
          1. Системы контекстного перевода

В отличие от систем фразового перевода, системы контекстного перевода позволяют увязывать смысл отдельных предложений. Для этого в структуру системы вводится блок семантического анализа, формирующий и использующий модель предметной области, описываемой в переводимом тексте. Модель предметной области включает основные понятия, представленные в тексте, и связи между ними. Модель предметной области может быть представлена семантической сетью. При использовании семантической сети в качестве контекста на выбор лексических единиц на языке перевода влияет их вхождение в модель предметной области.

1.1.2.5.3. Системы понимания речи (текстов)

Системы по распознаванию речи основаны на поиске наиболее точного соответствия между определенными произнесенными словами и словарем акустических образцов слов. Однако такой подход, работающий в случае распознавания изолированных слов, неприемлем для непрерывной речи, так как входной акустической сигнал в этом случае не может быть эффективно смоделирован как простое сочетание произнесенных частей лексических единиц. Тем не менее, необходимо начинать с основных лингвистических единиц, таких как фонемы, и сохранять информацию о ритме и длительности речевого высказывания.

Если следовать таким путем, то подход к обработке речи, основанный скорее на знаниях, чем на сопоставлении с образцами, становится неизбежным, так как, чтобы извлекать преимущества из распознавания конкретных лингвистических единиц в сигнале, необходимо знать, как данная единица связана с остальными частями языка.

СПР имеют дело со слитно произнесенной речью, фразами, предложениями и даже параграфами, так как «понимание» изолированных слов может означать только тривиальный процесс сопоставления некоторого значения каждому слову словаря системы. Понимание связанной речи - сложная задача, и на проектирование СПР повлияли исследования в таких разных областях, как акустическая обработка сигнала, нейрофизиология, психолингвистика, психология, а также математика.

Посредником при преобразовании речи в ее значение должны служить определенные языковые и неязыковые компоненты различных уровней, которые используют разнообразные источники знания (ИЗ), т.к. речевой сигнал кодирует много различной информации, необходимой для восстановления значения. Единственной возможной архитектурой СПР и основных ИЗ является следующая:

РЕЧЬ — ОБРАБОТКА АКУСТИЧЕСКОГО СИГНАЛА — ФОНЕТИЧЕСКИЙ АНАЛИЗ — ФОНОЛОГИЧЕСКИЙ АНАЛИЗ — МОРФОЛОГИЧЕСКИЙ АНАЛИЗ — ЛЕКСИЧЕСКИЙ АНАЛИЗ — СИНТАКСИЧЕСКИЙ АНАЛИЗ — СЕМАНТИЧЕСКИЙ АНАЛИЗ —ПРАГМАТИЧЕСКИЙ АНАЛИЗ — ЗНАЧЕНИЕ.

При такой организации СПР информация течет вверх по мере того, как каждый элемент создает промежуточные представления, кодируя (частичные) гипотезы относительно ввода на основе ему доступного знания.

В процессе акустической обработки речевой сигнал оцифровывается, трансформируется так, чтобы его можно было представить в той форме, которая поддается фонетическому декодированию. Параметризованный сигнал может затем быть размечен как дискретная последовательность фонем.

Фонологический анализ выполняется на фонетическом представлении, которое определяет лингвистически важные различия, имеющиеся в фонетическом представлении произнесения, например, уровни и расположение ударения, интонационный контур, структуры слога, последовательности фонем, лежащих в основе произнесения. Фонологический анализ необходим для лексического анализа, т.е. процесса, который сопоставляет фонетическую форму произнесения с каноническими фонемными представлениями слов в словаре, чтобы восстановить информацию, хранящуюся там относительно их морфологических, синтаксических, и семантических свойств. Фонологическое знание относительно допустимых последовательностей фонем в слогах может использоваться, чтобы распознать слог, и, следовательно, границы слова.

Как только фонологический анализ завершен, дальнейшая обработка будет подобна пониманию текста. Дальнейшие этапы морфологического, синтаксического, семантического и прагматического анализа способствуют распознаванию, эксплуатируя избыточность речи, в информационно-теоретическом смысле.

Прежде, чем слова, выделенные в речевом сигнале, будут сопоставлены с лексическими входами в словаре системы, необходимо провести морфологический анализ, который приведет слова к их основной форме.

После морфологического анализа возникшее морфофонологическое представление речевого ввода может быть найдено в словаре системы, чтобы получить синтаксическую, семантическую и прагматическую информацию относительно гипотезы последовательности слов. Задача синтаксического анализа - исключить гипотезы лексической комбинаторики на основе правил извлечения синтаксически недопустимых последовательностей.

На этапе семантического анализа гипотезы подвергаются дальнейшей обработке с учетом смыслового фактора с применением системы семантических отношений.

Учет прагматики приводит к выявлению некорректных комбинаций уже на этом уровне.

При создании систем, обрабатывающих текст, к числу которых относятся СМП, и систем, обрабатывающих и понимающих речь, активно используются знания об уровнях языка, тесно связанные с этапами анализа в этих системах.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]