- •Министерство образования и науки российской федерации
- •Оглавление
- •Список рисунков
- •Введение
- •Основы работы со средой математического моделирования МаtLab
- •История создания и развития системы MatLab
- •Интерфейс пользователя
- •Типы данных в системе MatLab
- •Переменные в системе MatLab
- •Арифметические и логические операции в системе MatLab
- •Массивы и матрицы в системе MatLab
- •Использование знака «:» и множественной индексации в системе MatLab
- •Операции над матрицами в системе MatLab
- •Встроенные функции в системе MatLab
- •Графические возможности системы MatLab
- •Изменение свойств линий и оформление графиков
- •Графики функций двух переменных
- •Вывод нескольких графиков на одни оси
- •Вывод нескольких графиков в одном графическом окне
- •Работа со звуковыми файлами в системе MatLab
- •Считывание данных из wav-файлов
- •Запись данных в wav-файл
- •Воспроизведение звуковых сигналов
- •Запись звуковых сигналов
- •Лабораторная работа №1. Исследование внутренней структуры речевого сигнала
- •Методические указания к лабораторной работе
- •Исследование структуры и временных характеристик речевых сигналов
- •Ручная сегментация исследуемой фонограммы
- •Определение фонетического состава сегментов исследуемого слова
- •Лабораторная работа №2. Исследование спектральных свойств речевого сигнала
- •Методические указания к лабораторной работе
- •Комментарии по оформлению отчета к лабораторной работе
- •Программа анализа спектров фонограмм «Спектр» (версия 4)
- •Назначение программы
- •Функциональные возможности программы
- •Лабораторная работа №3. Исследование корреляционных свойств речевого сигнала
- •Методические указания к лабораторной работе
- •Комментарии к оформлению отчета по лабораторной работе
- •Программа анализа корреляционных функций «Коррелограмма»
- •Назначение программы
- •Предварительный этап работы с фонограммой
- •Порядок работы в программе «Коррелограмма»
- •Дополнительные возможности по работе с программой
- •Лабораторная работа №4. Исследование vad-алгоритма
- •Методические указания к лабораторной работе
- •Комментарии по оформлению отчета к лабораторной работе
- •Исследование алгоритма vad в программе «Коррелограмма»
- •Лабораторная работа №5. Исследование методов оценки основного тона речи
- •Методические указания к лабораторной работе
- •Лабораторная работа №6. Моделирование алгоритмов обработки речи
- •Методические указания к лабораторной работе
- •Список индивидуальных заданий
- •Вопросы для самоподготовки
- •Лабораторная работа №1
- •Лабораторная работа №2
- •Лабораторная работа №3
- •Лабораторная работа №4
- •Лабораторная работа №5
- •Лабораторная работа №6 (Индивидуальные задания)
- •Список литературы
- •Приложение аСписок литературы и web-ресурсы по «Речевым технологиям» и среде математического моделирования «MatLab»
- •Список литературы по «Речевым технологиям»
- •Отечественная литература
- •Общетеоретические вопросы
- •Прикладная фонетика
- •Синтез речи
- •Психоакустика и физиология речи
- •Цифровая связь (телефония)
- •Зарубежная литература
- •Web – ресурсы
- •Список литературы по среде математического моделирования «MatLab»
- •Приложение б Современные направления научно-исследовательских работ кафедры «Бортовых радиоэлектронных систем в области разработки систем обработки речи
- •Основные области применения разрабатываемых алгоритмов
- •Многоуровневая временная сегментация речевых сигналов
- •Модификация фонограмм
Лабораторная работа №2. Исследование спектральных свойств речевого сигнала
Цель работы: анализ спектральных свойств речевых сигналов.
Методические указания к лабораторной работе
В данной лабораторной работе студенту предлагается исследовать спектральные свойства речевых сигналов. Спектральный анализ проводится для временных сегментов, полученных в предыдущей лабораторной работе (см. Лабораторная работа 1):
вокализованных (В-сегменты),
взрывных сегментов (Вз-сегменты),
шумовых сегментов (Ш-сегменты).
Исследования спектров реализуется с помощью программы «Спектр» версии 4, предназначенной для работы в среде MatLab. Приложение выдается преподавателем. Описание приложения приводится ниже.
При отображении результатов анализа спектральных свойств фонограмм следует использовать:
а) линейный масштаб по оси ординат,
б) логарифмический масштаб по оси ординат,
в) для удобства интерпретации результатов по оси абсцисс разметку (сетку) необходимо отображать как в единицах частотных каналов, так и в единицах частоты (герцах).
Примеры представления спектров приведены на рис.3.2 и 3.3.
Для удобного представления результатов спектрального анализа отображение спектра целесообразно проводить раздельно для НЧ-области и для остальной части спектра (средне- и высокочастотная части спектра).
а) анализ для НЧ-области: отображаются частота основного тона (ОТ) и ее гармоники,
б) анализ средне- и высокочастотной областей: отображаются формантные компоненты спектра.
Результаты спектрального анализа необходимо зафиксировать в отчете, указать основные характерные особенности спектров разных типов сегментов, их основные отличия.
Комментарии по оформлению отчета к лабораторной работе
При оформлении отчета для каждого пункта исследований необходимо привести:
1. скриншоты по пунктам исследования,
2. комментарии и выводы по полученным результатам.
Программа анализа спектров фонограмм «Спектр» (версия 4)
Программа «Спектр-4» написана на языке MatLab(версия 6.5), поэтому для проведения исследований необходимо на компьютере установить соответствующее программное обеспечение.
Назначение программы
Основные возможности программы «Спектр»:
а) визуализация файлов произвольной (внешней) фонограммы,
б) визуализация фонограмм в режиме «увеличения»,
в) сегментирование фонограмм – интерактивное выделение временных сегментов фонограммы с последующим их спектральным преобразованием,
г) прослушивание фонограммы или выделенного сегмента фонограммы,
д) БПФ-преобразования и отображения амплитудного спектра всей фонограммы или выделенного сегмента фонограммы.
Функциональные возможности программы
На рис.3.1 приведены обозначения (и нумерация) кнопок управления программой «Спектр-4».
Рис.3.1. Исходная форма и перечень кнопок управления программой
Функциональные возможности программы реализуются через опциональные кнопки управления программой.
Дадим перечень кнопок управления и поясним их функции:
(1) – Кнопка «Phonograma». Кнопка обеспечивает загрузку необходимой фонограммы.
(2) – Окно отображения названия файла.В данном окне отображается название выбранного файла.
(3) – Кнопка «Proslushat». Кнопка запускает фонограмму на прослушивание.
(4) – Кнопка «+» - реализует увеличение масштаба отображения фонограммы
(5) – Кнопка «-» - реализует уменьшение масштаба отображения фонограммы
(6) – Движок скроллинга – обеспечивает перемещение отображаемого фрагмента фонограммы в окне отображения.
(7) – Кнопка «взвода» простановки «Левой границы» выделяемого сегмента фонограммы (см. левую границу на рис.3.1),
(8) – Кнопка «взвода» простановки «Правой границы» выделяемого сегмента фонограммы (см. правую границу на рис.3.1),
(9) – Кнопка «Spectr» - запускает процедуру БПФ-преобразования над выделенным сегментом фонограммы,
Результат вычисления БПФ-спектра по выделенному временному сегменту отображается в нижнем окне «Спектр» (см. рис.3.2 и рис.3.3). В верхнем окне формы отображается преобразуемый (исследуемый) временной сегмент фонограммы.
Программа позволяет изменять параметры осей вывода амплитудного спектра после БПФ-преобразования.
(10) – Кнопка «Логарифмический масштаб» - обеспечивает отображение вычисленного амплитудного спектра сегмента фонограммы в логарифмическом масштабе. Примеры отображения амплитудного спектра влогарифмическом масштабепо оси ординат представлены на Рис.3.3 слева и справа.
Примеры отображения амплитудного спектра в линейном масштабепо оси ординат представлены на Рис.3.2 слева и справа.
(11) – Кнопка «Частотный масштаб» - обеспечивает отображение вычисленного амплитудного спектра сегмента фонограммы со шкалой ЧАСТОТЫ по оси абсцисс. Примеры отображения амплитудного спектра на частотной шкале представлены на Рис.3.2 и Рис.3.3 справа.
Рис.3.2. Пример отображения амплитудных спектров слова «Забияка» в линейном масштабе по оси ординат. В левом окне показана зависимость спектра от номера частотного канала, в правом окне показана зависимость амплитудного спектра от частоты
Рис.3.3. Примеры отображения амплитудных спектров слова «Забияка» в логарифмическом масштабе по оси ординат. В левом окне показана зависимость спектра от номера частотного канала, в правом окне показана зависимость амплитудного спектра от частоты