- •Билет 6 Другие задачи прикладной фонетики (фонокриминалистика, опознавание говорящего по голосу, системы "речь-текст")
- •Билет 7 Перевод: основные понятия. Машинный перевод. История машинного перевода (до 1990-х гг.).
- •Билет 8. Типология систем машинного перевода. Общие понятия и проблемы машинного перевода. Современный этап развития машинного перевода.
- •9. Компьютерная лексикография. Автоматический словарь системы машинного перевода, его отличия от других компьютерных словарей.
- •Билет10 Практическое построение систем машинного перевода. Алгоритм задачи машинного перевода текста.
Билет 6 Другие задачи прикладной фонетики (фонокриминалистика, опознавание говорящего по голосу, системы "речь-текст")
Фонокриминалистика – часть криминалистики, при которой имея образцы человеческой речи, можно безошибочно установить его обладателя
Основная задача экспертизы распознавания голоса– идентификация и диагностика лиц по голосу и речи. Мы занимаемся также исследованием акустической среды, в которой происходит запись фонограммы. Выстрел, звон упавшего стакана, шелест купюр – все эти обстоятельства могут дать много информации о месте преступления, свидетелях.
Сейчас технические возможности невероятно выросли, появились принципиально новые объекты исследования – цифровые диктофоны, сотовые телефоны. Нынче достаточно миниатюрного микрофона, который будет передавать речевую информацию из нужной комнаты без всякого источника питания.
Распознавание говорящего по голосу - процесс преобразования речевого сигнала в текстовый поток. Обратной задачей является синтез речи.
Задача распознавания речи включает в себя ряд подзадач: шумоочистка, первичная обработка, акустико-фонетическое преобразование, обеспечение независимости от диктора. Шумоочистка позволяет повысить отношение сигнал/шум. Первичная обработка формирует из исходного речевого сигнала последовательность векторов параметров. Акустико-фонетическое преобразование ставит в соответствие текущему вектору параметров гипотезу о его фонетической природе. Языковые модели верхних уровней позволяют из множества гипотез, порождённых на акустико-фонетическом уровне, выделить корректные. В статье рассматривается решение следующих трех задач: увеличение помехоустойчивости, распознавание траекторий в многомерном пространстве, подстройка системы распознавания на диктора, а также затронуты вопросы организации языковых моделей верхнеуровнего анализа.
Системы "речь-текст" - первый синтезатор «текст-в-речь» был создан в 1968 году. Синтезаторы речи Text to Speech (TTS) — специальные программы, позволяющие формировать речевой сигнал (речь, голос) по печатному тексту. Первое упоминание о синтезе речи относится к X веку. В конце XVIII века ученый Христиан Кратценштейн, создал модель речевого тракта человека, способную произносить пять гласных звуков (а, э, и, о, у). Первые синтезаторы речи на базе вычислительной техники появились в конце 1950-х годов. Они звучали довольно примитивно, и разобрать такую речь можно было с большим трудом. Работы над улучшением качества синтезированной речи продолжаются. Уже сегодня речь, генерируемую современными системами синтеза реча, порой не отличить от реальной человеческой речи.
Билет 7 Перевод: основные понятия. Машинный перевод. История машинного перевода (до 1990-х гг.).
Перево́д — деятельность по интерпретации смысла текста на одном языке (исходном языке [ИЯ]) и созданию нового, эквивалентного текста на другом языке (переводящем языке [ПЯ]).
В процессе перевода, вне зависимости от его формы (устной или письменной), можно выделить следующие базовые этапы:
Декодирование или понимание (чтение, слушание) текста на исходном языке (ИЯ),
Непосредственно перевод,
Кодирование (запись, произнесение) полученного текста на переводящем языке (ПЯ)
История машинного перевода
+ http://www.gigatran.ru/machine-translation (доп. информация)
Машинный перевод
– это автоматический перевод текста с одного языка на другой при помощи электронных машин на основе заданной программы. Положительные результаты достигнуты в настоящее время только при переводе текстов с чисто логическим содержанием. Попытки перевода текстов художественной литературы успехом пока не увенчались.
— процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.
— выполняемое на ЭВМ действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. В современных системах А. п. участвует человек (редактор). Для осуществления А. п. в ЭВМ вводятся программа (алгоритм), словари входного и выходного языков, содержащие разнообразную информацию. Наиболее распространённая последовательность формальных операций, составляющих анализ и синтез в системе А. п.: ввод текста и поиск входных словоформ в словаре с сопутствующим морфологическим анализом; перевод идиом; определение основных грамматических (морфологических, синтаксических, а также семантических, лексических) признаков, необходимых для перевода в рамках данной пары языков, по входному тексту; разбор омографии; лексический анализ и перевод (в т. ч. многозначных слов с учётом контекста); окончательный грамматический анализ с целью доопределения информации, необходимой для синтеза; синтез выходных словоформ, предложений и текста в целом. Анализ может производиться как пофразно, так и для всего текста, с определением в последнем случае анафорических связей.