Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Oit_Otvety_K_Ekzamenu.doc
Скачиваний:
102
Добавлен:
08.06.2015
Размер:
151.04 Кб
Скачать

24.Автоматическое распознавание устной речи

Если компьютер сможет распознавать и понимать речевое сообщение, звучащее на каком-то естественном языке, если он сможет говорить на том или ином языке так, как это делает человек, его возможности значительно расширятся. Он сможет: 1 - поддерживать голосовой ввод информации в различные приложения; 2 - обучать иностранным языкам; 3 - определять по голосу личность человека 4 -определять объективно эмоциональное состояние человека (летчика, диспетчера и т. д.); 5 - переводить устную речь; 6 - поддерживать обращение голосом к различным информационно-справочным системам , базам данных по телефону или через интернет; 7 - поддерживать голосовое управление различными компьютерными системами; 8 - вести в электронном виде протоколы различных заседаний, результаты медицинских обследований и т. д.

Распознавание речи компьютером- распознавание, которое подобно восприятию речи человеком в любых условиях и при общении с любым коммуникантом. Общение при помощи устной речи является самым надежным и универсальным средством коммуникации. Автоматическое распознавание речи является самым надежным и универсальным средством коммуникации. Его следует считать одной из наиболее сложных проблем технической кибернетики и искусственного интеллекта, и она в полном объеме вряд ли может быть решена в ближайшие 50 лет.

Решению этой проблемы мешают следующие факторы: 1) не существует ни теоретических представлений, ни экспериментальных данных, которые описывали бы весь комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов; слитно произнесенная речь обладает следующими свойствами: границы в слитной речи четко не определены; в слитной речи соседние звуки влияют друг на друга и изменяют звуковые характеристики; знаменательные слова (существительные, прилагательные, глаголы и т. д.) в основном произносятся отчетливо, в то время как функциональные слова (предлоги, союзы, частицы и т. д.) могут выговариваться не четко и даже исчезать; в голосе говорящего человека всегда присутствует экстралингвистическая информация, свидетельствующая о его особом эмоциональном, психофизиологическом состоянии, указывающая на его возраст, пол, национальность, состояние здоровья (простуженный голос) и т. д. Иногда экстралингвистическая информация может даже отрицать смысл произнесенных слов. В процессе речевого общения кроме используемых слов большое значение имеют паралингвистические средства коммуникации: фонация (характеристики голоса человека), кинесика (мимика, жесты, позы коммуникантов), проксемика (расстояние между ними), коммуникативно значимое молчание (молчание не как физиологическое состояние человека).

Исходя из вышеизложенного, сегодня автоматическое распознавание речи может осуществляться только при наложении определенных ограничений на процесс распознавания: например распознавание изолированно произносимых слов, распознавание речи с предварительной настройкой на голос конкретного пользователя, распознавание речи с опорой на небольшой заранее определенный словарь и т. д.

Промышленно реализованные системы распознавания устной речи условно можно разделить на четыре следующие группы. 1-Средства речевого управления (компьютером, его периферийными устройствами, работой различных приложений; работой бытовых приборов и т. д.); 2- Средства диктовки, позволяющие голосом вводить текстовую информацию в любые приложения (при этом введенная информация отображается на экране дисплея ); 3- Информационно-справочные системы, работающие в диалоговом режиме в качестве автоответчика (отвечают на вопросы пользователей о движении железнодорожного, морского, автотранспорта и т. д.); 4- Средства идентификации человека по образцу речи (голосовые пароли и т. д.)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]