Лабораторная работа 2 Изучение методов кодирования речевых сигналов
1 Цель работы:
1.1 Исследовать процесс кодирования звуковых и, в частности, речевых сигналов.
1.2 Ознакомиться с методами кодирования речевых сигналов на основе импульсно-кодовой модуляции (ИКМ).
2 Подготовка к работе:
2.1 Повторить материал по теме «Импульсно-кодовая модуляция (ИКМ). Дифференциальные методы ИКМ», использовать вышеприведенную литературу.
2.2 Подготовить форму отчета
3 Оборудование:
3.1 Персональный компьютер
3.2 Программы записи и воспроизведения звуковых сигналов
3.3 Программы конверторы звуковых сигналов
4 Задание:
4.1 Искажения при разностном представлении сигнала. Исследовать возможность представления не абсолютных значений сигнала, как при ИКМ представлении, а сигнал ошибки между предсказанным значением и реальным, для кодирования которой надо меньше разрядов. Пример осциллограммы музыкального сигнала приведен на рис.1. Для получения такой картинки использовать кнопку «+» или кнопку увеличения временного масштаба изображения, расположенной под экраном.
Рисунок 1 – Дискретные отсчеты реального сигнала
Здесь используются дифференциальные методы квантования или разностные системы кодирования и системы с предсказанием - ДИКМ. Основное искажение при использовании ДИКМ, ограничивающее применение для передачи сигналов звукового вещания (СЗВ) - ограничение крутизны, когда нарастание временной функции, атака, не может быть описано сигналом ошибки с ограниченным числом разрядов. Как и при ИКМ, присутствуют шумы квантования, зато отсутствуют искажения ограничения. На практике чаще используется формат АДИКМ, в котором используемый шаг квантования изменяется в зависимости от амплитуды сигнала.
- Для кодирования сигнала с использованием АДИКМ, сохранить его по команде Save as, выбрав тип файла DVI/IMA ADPCM. Выбор разрядности представления осуществляется в всплывающем меню и может изменяться от 2 до 5 разрядов.
- Сравнить звучание исходного и преобразованного файлов. При нормальном слухе можно заметить наличие модуляцию высокочастотных шумов и компонент в преобразованном сигнале. Провести объективную оценку спектральных и статистических свойств сигнала, используя возможности опции Analyze. Как изменились при этом интегральные спектральные и статистические характеристики?
- Исследовать сигнал ошибки представления. Для этого из исходного сигнала вычесть преобразованный сигнал, используя команду MixPaste опции Edit. Поставить галочку в окошке Invertвозле регулятора уровня исходного сигнала, используя режим микширования OverlapиFromFile, нажав на клавишу SelectFile, выбрать компандированный файл. Внешний вид сигнала ошибки для речевого сигнала при использовании 4 разрядов представления и пропорциональном снижении объема сигнала, может быть выглядеть так (рис.2).
- Для изучения искажений эффекта синтезировать многокомпонентный гармонический сигнал. В опцииGenerate, Tones сформировать сигнал, состоящий из базовой гармоники 3000 Гц и пяти ее гармоник, равного уровня и общим уровнем сигнала около 3 дБ. Осциллограмма испытательного сигнала приведена на рис.3.
Рисунок 2 – Сигнал ошибки разностного представления
Рисунок 3 – Тестовый сигнал из пяти гармоник
- Преобразовать сформированный сигнал в АДИКМ формат. Провести спектральный анализ исходного и компандированного сигналов (рис. 4 и 5).
Рисунок 4 – Спектр тонального сигнала из пяти гармоник
Рисунок 5 – Спектр тестового сигнала в разностном представлении
4.2 На рис.6 представлен один и тот же часовой звуковой отрывок радиопередачи на входе и выходе кодека источника, реализующего алгоритм МРЗ (MPEG 1 Layer 3). Для наглядности крупномасштабный нижний фрагмент рисунка представляет разностный сигнал, т.е. непосредственно «искажения компактного представления». Два сигнала нормированы по мощности. Уровень разностного сигнала составляет -9.3 дБ по отношению к уровню исходного сигнала.
Вход
Выход
Ошибка
Рисунок 6 – Изменения в сигнале, вносимые алгоритмом МР3
Рассмотреть искажения, которые возникают в цифровых трактах первичного распределения сигнала вещания, построенных с использованием формата МРЗ, при передаче реального сигнала. Для этого использовать сигнал звуковой программы, предоставленный преподавателем, или сформировать программу самостоятельно, используя соответствующий источник на CD. Ниже, в качестве примера, использована часовая запись радиопрограммы «Маяк». Запись сделана с использованием 16-разрядной ИКМ при частоте дискретизации 32 кГц, что соответствует высшему классу качества. Привести временную диаграмму сигнала (рис.7).
Рисунок 7 - Временная диаграмма исходного сигнала
- Для имитации прохождения компактно представленного в формате МРЗ сигнала через канал воспользуемся возможностьюего сохранения, предусмотренной в большинстве современных редакторов, в том числе и в CoolEdit. Для этого в опцииFile выбрать команду исходный сигнал — сохранить как. В качестве типа файла выбрать МРЗ, в качестве значения цифровой скорости (Bitrate) укажите 128 или 96 или иное количество кбит/с.
- Изучить потери преобразования субъективно при прослушивании и объективно — спектр и статистика в опцииAnalyze.
- Потом вызовите сохраненный сигнал в формате МРЗ и опять сохраните в формате WAV — со всеми «прелестями», собранными в МРЗ. На рис. 8 приведены временные диаграммы для сигнала, сохраненного в формате МРЗ при значениях скорости 128 и 96 кбит/с и вновь преобразованного в формат WAV:
Рисунок 8 - Временные диаграммы сигнала, сохраненного в формате МР3
при значениях скорости 128 (а) и 96 кбит/с и вновь преобразованного
в формат WAV(б)
- Рассмотреть изменения сигнала подробнее. Для этого необходимо сформировать сигнал ошибки как разность между входным и выходным сигналами.
Следует учесть, что для анализа желательно использовать наиболее широкополосные сигналы, для которых устранение избыточности наиболее заметно.Первоначально, для формирования разностного сигнала, скопировать сигнал из МРЗ-wav, откройте также и исходный файл. В менюEdit — MixPasteвыберитеOverlap (сложить) и отметьте галочкойInvert (для инверсии сигнала по фазе). При этом величина ошибки при снижении цифровой скорости будет резко возрастать.
- Для объективного анализа изменений сигнала следует использовать гистограммы распределения мгновенных значений и статистики исходного сигнала и сигнала, прошедшего канал с кодеком источника, а также спектральный анализ.
- Для этого выделить исследуемый сигнал и в менюAnalyzeвыберитеFrequencyAnalysisилиStatistics.
Сделать выводы. Из результатов статистического и спектрального анализа должно быть видно, что сигналы практически не отличаются. При пониженной скорости передачи в распределении мгновенных значений и спектрограммах начинают замечаться отличия. Замечают изменения сигнала и слушатели — примерно в 30 % случаев.
- Самостоятельно провести исследование изменений объективных параметров сигнала для цифровых скоростей компактно представленного сигнала 32 и 16 кбит/с. Такие скорости используются, в частности, в Интернет-вещании. Для удобства сравнения можно использовать псевдостереофоническое представление, записав по одному каналу исходный сигнал, а по другому — искаженный после прохождения кодека МРЗ. В этом случае гораздо удобнее зрительно сравнить характеристики двух сигналов.
- Провести контрольные прослушивания отрезков сигнала. Для этого следует отобрать фрагменты сигналов разных типов (речь, эстрадная музыка и т.д.), длительностью 8... 16 с (при большей длительности фрагмента слушатель не запоминает сигнал и не может его сравнить с исходным). Последовательно прослушайте исходный и искаженный сигналы, снижайте скорость до появления заметности изменений сигнала.