Билет 6 Другие задачи прикладной фонетики (фонокриминалистика, опознавание говорящего по голосу, системы "речь-текст")

Фонокриминалистика – часть криминалистики, при которой имея образцы человеческой речи, можно безошибочно установить его обладателя

Основная задача экспертизы распознавания голоса– идентификация и диагностика лиц по голосу и речи. Мы занимаемся также исследованием акустической среды, в которой происходит запись фонограммы. Выстрел, звон упавшего стакана, шелест купюр – все эти обстоятельства могут дать много информации о месте преступления, свидетелях.

Сейчас технические возможности невероятно выросли, появились принципиально новые объекты исследования – цифровые диктофоны, сотовые телефоны. Нынче достаточно миниатюрного микрофона, который будет передавать речевую информацию из нужной комнаты без всякого источника питания.

Распознавание говорящего по голосу - процесс преобразования речевого сигнала в текстовый поток. Обратной задачей является синтез речи.

Задача распознавания речи включает в себя ряд подзадач: шумоочистка, первичная обработка, акустико-фонетическое преобразование, обеспечение независимости от диктора. Шумоочистка позволяет повысить отношение сигнал/шум. Первичная обработка формирует из исходного речевого сигнала последовательность векторов параметров. Акустико-фонетическое преобразование ставит в соответствие текущему вектору параметров гипотезу о его фонетической природе. Языковые модели верхних уровней позволяют из множества гипотез, порождённых на акустико-фонетическом уровне, выделить корректные. В статье рассматривается решение следующих трех задач: увеличение помехоустойчивости, распознавание траекторий в многомерном пространстве, подстройка системы распознавания на диктора, а также затронуты вопросы организации языковых моделей верхнеуровнего анализа.

Системы "речь-текст" - первый синтезатор «текст-в-речь» был создан в 1968 году. Синтезаторы речи Text to Speech (TTS) — специальные программы, позволяющие формировать речевой сигнал (речь, голос) по печатному тексту. Первое упоминание о синтезе речи относится к X веку. В конце XVIII века ученый Христиан Кратценштейн, создал модель речевого тракта человека, способную произносить пять гласных звуков (а, э, и, о, у). Первые синтезаторы речи на базе вычислительной техники появились в конце 1950-х годов. Они звучали довольно примитивно, и разобрать такую речь можно было с большим трудом. Работы над улучшением качества синтезированной речи продолжаются. Уже сегодня речь, генерируемую современными системами синтеза реча, порой не отличить от реальной человеческой речи.

Билет 7 Перевод: основные понятия. Машинный перевод. История машинного перевода (до 1990-х гг.).

Перево́д — деятельность по интерпретации смысла текста на одном языке (исходном языке [ИЯ]) и созданию нового, эквивалентного текста на другом языке (переводящем языке [ПЯ]).

В процессе перевода, вне зависимости от его формы (устной или письменной), можно выделить следующие базовые этапы:

Декодирование или понимание (чтение, слушание) текста на исходном языке (ИЯ),
Непосредственно перевод,
Кодирование (запись, произнесение) полученного текста на переводящем языке (ПЯ)

История машинного перевода

+ http://www.gigatran.ru/machine-translation (доп. информация)

Машинный перевод

– это автоматический перевод текста с одного языка на другой при помощи электронных машин на основе заданной программы. Положительные результаты достигнуты в настоящее время только при переводе текстов с чисто логическим содержанием. Попытки перевода текстов художественной литературы успехом пока не увенчались.

— процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.

— выполняемое на ЭВМ действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. В современных системах А. п. участвует человек (редактор). Для осуществления А. п. в ЭВМ вводятся программа (алгоритм), словари входного и выходного языков, содержащие разнообразную информацию. Наиболее распространённая последовательность формальных операций, составляющих анализ и синтез в системе А. п.: ввод текста и поиск входных словоформ в словаре с сопутствующим морфологическим анализом; перевод идиом; определение основных грамматических (морфологических, синтаксических, а также семантических, лексических) признаков, необходимых для перевода в рамках данной пары языков, по входному тексту; разбор омографии; лексический анализ и перевод (в т. ч. многозначных слов с учётом контекста); окончательный грамматический анализ с целью доопределения информации, необходимой для синтеза; синтез выходных словоформ, предложений и текста в целом. Анализ может производиться как пофразно, так и для всего текста, с определением в последнем случае анафорических связей.

1 / 31 2 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
08.03.20163.02 Mб52A_History_of_England_from_Ancient_times_to_Restoration.pdf
#
18.08.201968.1 Кб3baby.doc
#
04.09.2019183.3 Кб6bilety_okonchatelnyy_variant.doc
#
25.09.2019150.05 Кб12Bilety_po_DK.docx
#
08.08.2019141.82 Кб6bilety_po_sovremennoy_zarubezhnoy_literature.doc
#
24.09.201934.09 Кб8Bilet_6-10.docx
#
08.03.2016637.44 Кб10Biznes_plan_veb-studia1.doc
#
08.03.20162.38 Mб25blok_monografiya.pdf
#
16.09.2019137.61 Кб24bzh.rtf
#
24.12.201876.8 Кб6CюР.doc
#
12.11.2019287.23 Кб6Daphne du Maurier .doc