Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Bilet_6-10.docx
Скачиваний:
8
Добавлен:
24.09.2019
Размер:
34.09 Кб
Скачать

Билет 6 Другие задачи прикладной фонетики (фонокриминалистика, опознавание говорящего по голосу, системы "речь-текст")

Фонокриминалистика – часть криминалистики, при которой имея образцы человеческой речи, можно безошибочно установить его обладателя

Основная задача экспертизы распознавания голоса– идентификация и диагностика лиц по голосу и речи. Мы занимаемся также исследованием акустической среды, в которой происходит запись фонограммы. Выстрел, звон упавшего стакана, шелест купюр – все эти обстоятельства могут дать много информации о месте преступления, свидетелях.

Сейчас технические возможности невероятно выросли, появились принципиально новые объекты исследования – цифровые диктофоны, сотовые телефоны. Нынче достаточно миниатюрного микрофона, который будет передавать речевую информацию из нужной комнаты без всякого источника питания.

Распознавание говорящего по голосу - процесс преобразования речевого сигнала в текстовый поток. Обратной задачей является синтез речи.

Задача распознавания речи включает в себя ряд подзадач: шумоочистка, первичная обработка, акустико-фонетическое преобразование, обеспечение независимости от диктора. Шумоочистка позволяет повысить отношение сигнал/шум. Первичная обработка формирует из исходного речевого сигнала последовательность векторов параметров. Акустико-фонетическое преобразование ставит в соответствие текущему вектору параметров гипотезу о его фонетической природе. Языковые модели верхних уровней позволяют из множества гипотез, порождённых на акустико-фонетическом уровне, выделить корректные. В статье рассматривается решение следующих трех задач: увеличение помехоустойчивости, распознавание траекторий в многомерном пространстве, подстройка системы распознавания на диктора, а также затронуты вопросы организации языковых моделей верхнеуровнего анализа.

Системы "речь-текст" - первый синтезатор «текст-в-речь» был создан в 1968 году. Синтезаторы речи Text to Speech (TTS) — специальные программы, позволяющие формировать речевой сигнал (речь, голос) по печатному тексту. Первое упоминание о синтезе речи относится к X веку. В конце XVIII века ученый Христиан Кратценштейн, создал модель речевого тракта человека, способную произносить пять гласных звуков (а, э, и, о, у).  Первые синтезаторы речи на базе вычислительной техники появились в конце 1950-х годов. Они звучали довольно примитивно, и разобрать такую речь можно было с большим трудом. Работы над улучшением качества синтезированной речи продолжаются. Уже сегодня речь, генерируемую современными системами синтеза реча, порой не отличить от реальной человеческой речи.

Билет 7 Перевод: основные понятия. Машинный перевод. История машинного перевода (до 1990-х гг.).

Перево́д — деятельность по интерпретации смысла текста на одном языке (исходном языке [ИЯ]) и созданию нового, эквивалентного текста на другом языке (переводящем языке [ПЯ]).

В процессе перевода, вне зависимости от его формы (устной или письменной), можно выделить следующие базовые этапы:

  1. Декодирование или понимание (чтение, слушание) текста на исходном языке (ИЯ),

  2. Непосредственно перевод,

  3. Кодирование (запись, произнесение) полученного текста на переводящем языке (ПЯ)

История машинного перевода

+ http://www.gigatran.ru/machine-translation (доп. информация)

Машинный перевод

– это автоматический перевод текста с одного языка на другой при помощи электронных машин на основе заданной программы. Положительные результаты достигнуты в настоящее время только при переводе текстов с чисто логическим содержанием. Попытки перевода текстов художественной литературы успехом пока не увенчались.

— процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.

— выполняемое на ЭВМ действие по преобразованию текста на одном есте­ствен­ном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. В современных системах А. п. участвует человек (редактор). Для осуществления А. п. в ЭВМ вводятся программа (алгоритм), словари входного и выходного языков, содержащие разно­образ­ную информацию. Наиболее распространённая после­до­ва­тель­ность формальных операций, составляющих анализ и синтез в системе А. п.: ввод текста и поиск входных словоформ в словаре с сопутствующим морфологическим анализом; перевод идиом; определение основных грамматических (морфологических, синтаксических, а также семантических, лексических) признаков, необходимых для перевода в рамках данной пары языков, по входному тексту; разбор омографии; лексический анализ и перевод (в т. ч. многозначных слов с учётом контекста); окончательный грамматический анализ с целью доопределения информации, необходимой для синтеза; синтез выходных словоформ, предложений и текста в целом. Анализ может произво­дить­ся как пофразно, так и для всего текста, с определением в последнем случае анафорических связей.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]