Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lecture 2.doc
Скачиваний:
6
Добавлен:
14.09.2019
Размер:
2.72 Mб
Скачать

1. Синтез текста. Отчеты о матчах.

Новые информационные технологии

Лекция № 2. Основные классы естественно-языковых систем

  1. Новые информационные технологии (3)

1.1. Основные классы естественно-языковых систем

      1. Функциональные компоненты естественно-языковых систем

      2. Сравнительная характеристика основных классов ЕЯ-систем

        1. Интеллектуальные вопросно-ответные системы

          1. Информационно-поисковые системы

          2. Системы общения с базами данных

          3. Экспертные системы

          4. Диалоговые системы решения задач

          5. Интеллектуальные хранилища и цифровые библиотеки

        2. Системы распознавания речи

          1. Системы распознавания изолированно произносимых команд

          2. Системы распознавания ключевых слов в потоке слитной речи

          3. Системы распознавания слитной речи

          4. Подход «анализ-через-синтез»

          5. Системы чтения по губам

        3. Системы обработки связных текстов

          1. Системы реферирования текстов

          2. Системы сравнения и классификации текстов

          3. Системы кластеризации текстов

        4. Системы синтеза

          1. Системы синтеза речи

          2. Системы клонирования голоса

          3. Системы синтеза видеоряда по тексту

        5. Системы машинного перевода. Системы понимания речи (текстов)

          1. Системы фразового перевода

          2. Системы контекстного перевода

          3. Системы понимания речи (текстов)

        6. Онтологии и тезаурусы

        7. Речевые и текстовые базы

        8. Компоненты интеллектуальных систем

      3. Сравнительная характеристика естественно-языковых систем

3.6.1. Промышленные системы распознавания речи

Ibm Voice Type Dictation – фонетическая пишущая машинка фирмы ibm

  1. 32000 слов + 2000 слов личного словаря (английский язык).

  2. 70 – 100 слов/мин.

  3. Статистические языковые модели.

  4. Стандартные фразы.

  5. В любую среду: OS/2, Windows, DOS.

  6. Спец. словарь: радиология и модели языков.

  7. PCMCIA для мобильных работ.

  • изолированно произносимые команды;

  • с подстройкой под диктора;

  • плата ввода;

  • синтез введенного текста;

  • 95%;

  • подстраивается к языковой модели;

  • речь – текст в звуковом окне – текст в речевом редакторе;

  • управление оборудованием и меню;

  • 45 – 60 минут – обучение системы; 150 предложений;

  • английский UK и USA, французский, немецкий, итальянский, испанский, арабские языки.

Система распознавания речи фирмы Speereo Software United Kingdom Limited

  1. До 150000 слов английского языка.

  2. В темпе с процессом.

  3. Статистические языковые модели.

  4. 600 командных фраз.

  5. В любую среду: MS Windows 95, 98, Millenium, NT4.0, 2000, XP.

  6. Спец. словарь: радиология и модели языков.

  7. PCMCIA для мобильных работ.

  • изолированно произносимые команды;

  • без подстройки под диктора;

  • 99,9% в офисном помещении;

  • 97% в автомобиле, идущем со скоростью 120 км/час;

  • подстраивается к языковой модели;

  • управление оборудованием и меню;

  • английский UK.

Рис. 7.12. Архитектура Speech Engine фирмы Speereo.

1.1.2.2.4. Подход «анализ-через-синтез»

1.1.2.2.5. Системы чтения по губам

        1. Системы синтеза

1.1.2.4.1. Системы синтеза речи

Системы синтеза речи реализуют следующие технологии.

  1. Компилятивный синтез. В этом случае заранее подготавливаются фразы, которые необходимо озвучивать пользователю. Они же и воспроизводятся в подходящем случае.

  2. Фонемный синтез. В этом случае самыми мелкими, заранее подготовленными, единицами являются фонемы, или субфонемные элементы.

  3. Физический синтез. Для физического синтеза реализуется физическая модель артикуляторного тракта, которая управляется последовательностью символов, соответствующих буквам синтезируемого текста, с добавлением специальных символов, отмечающих выделенные речевые фрагменты.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]