- •Лекция 1 Цель преподавания дисциплины
- •Терминология
- •Философские аспекты проблемы систем ии (возможность существования, безопасность, полезность).
- •История развития систем ии.
- •Лекция 2 Различные подходы к построению систем ии
- •Вспомогательные системы нижнего уровня (распознавание образов зрительных и звуковых, идентификация, моделирование, жесткое программирование) и их место в системах ии
- •Лекция 3 Понятие образа
- •Проблема обучения распознаванию образов (оро)
- •Геометрический и структурный подходы.
- •Гипотеза компактности
- •Обучение и самообучение
- •Лекция 4: Адаптация и обучение
- •Персептроны
- •Нейронные сети История исследований в области нейронных сетей
- •Модель нейронной сети с обратным распространением ошибки (back propagation)
- •Нейронные сети: обучение без учителя
- •Нейронные сети Хопфилда и Хэмминга
- •Метод потенциальных функций
- •Метод группового учета аргументов мгуа Метод наименьших квадратов
- •Общая схема построения алгоритмов метода группового учета аргументов (мгуа)
- •Алгоритм с ковариациями и с квадратичными описаниями
- •Метод предельных упрощений (мпу)
- •Коллективы решающих правил
- •Лекция 5: Методы и алгоритмы анализа структуры многомерных данных
- •Иерархический кластерный анализ
- •Стандартизация
- •Быстрый кластерный анализ
- •Кластерный анализ
- •Иерархическое группирование
- •Лекция 6: Логический подход к построению систем ии Неформальные процедуры
- •Алгоритмические модели
- •Продукционные модели
- •Режим возвратов
- •Логический вывод
- •Зависимость продукций
- •Продукционные системы с исключениями
- •Язык Рефал
- •Лекция 7: Экспертные системы Экспертные системы, базовые понятия
- •Экспертные системы, методика построения
- •Этап идентификации
- •Этап концептуализации
- •Этап формализации
- •Этап выполнения
- •Этап тестирования
- •Этап опытной эксплуатации
- •Экспертные системы, параллельные и последовательные решения
- •Пример эс, основанной на правилах логического вывода и действующую в обратном порядке
- •Часть 1.
- •Лекция 8: Машинная эволюция Метод перебора как наиболее универсальный метод поиска решений. Методы ускорения перебора
- •Эволюция
- •Генетический алгоритм (га)
- •Как создать хромосомы?
- •Как работает генетический алгоритм?
- •Эволюционное (генетическое) программирование
- •Автоматический синтез технических решений
- •Поиск оптимальных структур
- •Алгоритм поиска глобального экстремума
- •Алгоритм конкурирующих точек
- •Алгоритм случайного поиска в подпространствах
- •Некоторые замечания относительно использования га
- •Лекция 9. Автоматизированный синтез физических принципов действия. Синтез речи Фонд физико-технических эффектов
- •Синтез физических принципов действия по заданной физической операции
- •Заключительные замечания
- •Слабосвязанный мир
- •Разделяй и властвуй
- •Синтез речи
- •Голосовой аппарат человека
- •Структура языка
- •Технология
- •Методы синтеза
- •Волновой метод кодирования
- •Параметрическое представление
- •Синтез по правилам
- •Конвертация текста в речь
- •Система преобразования текста в речь miTalk
- •Анализ текста
- •Морфологический анализ
- •Правила "буква-звук" и лексическое ударение
- •Парсинг
- •Модификация ударения и фонологические уточнения
- •Просодическая рамка
- •Синтез фонетических сегментов
- •Оценка синтетической речи
Модификация ударения и фонологические уточнения
Последняя фаза анализа состоит в некоторых незначительных поправках к имеющейся уже фонетической транскрипции на основе анализа контекстного окружения. Простой пример — определение произношения артикля "the", которое зависит от начального звука последующего слова. Кроме того, на этом этапе используются некоторые эвристические методы проверки правильного соотношения общего контура предложения с контурами отдельных слов. На этом этапе заканчивается подготовка исходного текста собственно к самому процессу синтеза.
Синтез
Важно осознать, что в системе MITalk не используются готовые речевые волны даже в параметрическом представлении. Система не хранит параметрические представления множества морфов или слов. Вместо этого были разработаны правила контроля параметров, так что можно реализовать любую желаемую речевую волну на выходе.
Просодическая рамка
Первый шаг в создании выходной речевой волны — создание временного контура и частоты основного тона ( основные корреляты интонации ), на основе которых строится детальная артикуляция отдельных фонетических элементов. Распределение ударения, которое было вычислено на стадии анализа, во многом ответственно за контур временного распределения и тональный контур. Часто интенсивность принимают за коррелят ударения, тогда как главными ключами являются длительность и изменения в тональном контуре. Согласные мало меняются по длительности, в то время как гласные более пластичны и могут легко сжиматься или растягиваться. Существует также тенденция растягивать слова на границе основных абзацев предложения, и наоборот, сжимать интервалы на относительно невыделенных участках. Кроме того, на основе временной рамки задается частота основного тона (или тональный контур). В утвердительных предложениях обычно высота тона резко поднимается на первом ударном слоге, затем плавно снижается до п оследнего ударного слога, где она резко падает. Вопросительные и повелительные предложения имеют различные тональные контуры. Кроме целостного контура предложения существуют еще локальные ударения. Большее ударение получают слова, выражающие отрицание или сомнение ( например, слово might ), значение частоты основного тона на них возрастает; новая информация в предложении также больше выделяется ударением. С другой стороны,высота тона используется в семантических и эмоциональных целях, что не может быть выведено из письменного текста. Необходимо лишний раз подчеркнуть важность составления правильного просодического контура, т.к. неправильный просодический контур может привести к трудностям в восприятии.
Синтез фонетических сегментов
Когда завершено создание просодической рамки, создаются параметры, соответствующие модели речевого тракта. Обычно таких параметров 25, которые изменяются с интервалом 5—10 мсек. В настоящее время используются около 100 контекстных правил описания траектории изменения параметров. Когда значения параметров вычислены, они должны быть перенесены на соответствующую модель речевого тракта (обычно это формантная модель или LPC-модель). Выходная дискретная модельсоздается обычно на частоте 10 Кгц.