- •Содержание
- •Введение
- •1. Стандарт представления медиа-объектов мреg-4
- •1.1. Предпосылки создания стандарта
- •1.2. Описание сцены
- •1.3. Доставка потоков данных
- •1.4. Кодирование визуальных объектов
- •1.5. Кодирование звуковых объектов
- •1.6. Профили и уровни стандарта мреg-4
- •2. Передача телевизионного сигнала в цифровой форме
- •2.1. Канальное кодирование
- •3. Цифровые способы модуляции
- •3.1. Предварительные замечания
- •3.2. Сигнальные созвездия
- •3.2.1. Полярные диаграммы
- •3.2.2. Квадратурные диаграммы
- •3.2.3. Диаграммы состояний
- •3.3. Амплитудная модуляция
- •3.4. Квадратурная амплитудная модуляция
- •3.5. Относительная фазовая модуляция
- •3.6. Иерархические режимы модуляции
- •3.7. Способ модуляции ofdm
- •4. Принципы построения и структура цифровых систем наземного тв вещания
- •4.1 Стандарт цифрового телевизионного вещания dvb
- •4.2. Общая характеристика систем цифрового наземного тв вещания
- •4.3. Система цифрового наземного тв вещания dvb-т
- •4.3.1. Общая характеристика и структура системы dvb-т
- •4.3.2. Рандомизация данных
- •4.3.3. Внешнее кодирование и перемежение
- •4.3.4. Внутреннее кодирование
- •4.3.5. Внутреннее перемежение
- •4.3.6. Методы модуляции
- •4.3.7. Формирование кадра данных
- •4.3.8. Сигнализация о параметрах передачи
- •4.3.9. Защитные интервалы
- •4.4. Система цифрового наземного тв вещания isdb-т
- •4.4.1. Общая характеристика системы isdb-т
- •4.4.2. Методы мультиплексирования и формирования кадра данных
- •4.4.3. Методы кодирования для канала
- •4.4.4. Методы модуляции
- •4.5. Система цифрового наземного тв вещания 8-vsb атsс
- •4.5.1. Структура системы 8-vsb атsс
- •4.5.2. Формирование кадра данных системы 8-vsв атsс
- •4.5.3. Перемежение и кодирование для канала в системе 8-vsв атsс
- •4.5.4. Модуляция в системе 8-vsв атsс
- •Библиографический список
1.5. Кодирование звуковых объектов
Широкие возможности представляет стандарт МРЕG-4 для кодирования звука. Впервые используются раздельные алгоритмы для кодирования звуков музыкального происхождения и речи, введены мощные средства создания и обработки синтезированного звука.
Наиболее широкий круг звуковых объектов, от низкоскоростных моно до многоканального звука вещательного качества, относится к категории универсального звука (GA — General Audiо). В качестве основного алгоритма кодирования звуков различного происхождения принят известный из МРЕG-2 алгоритм ААС с незначительными усовершенствованиями. Одно из них касается введения режима PNS (Реrсерtuаl Nоisе Substitutiоn — перцептуальное замещение шумом). Суть данного метода заключается в обнаружении в приходящем сигнале шумоподобных составляющих и исключении их из общего процесса кодирования. Декодеру передается информация о мощности шумовых компонентов в отдельных участках спектра, и он подменяет соответствующие спектральные коэффициенты псевдослучайными сигналами с требуемой мощностью. Режим PNS иллюстрируется структурной схемой, показанной на рисунке 1.7.
Рисунок 1.7 — Схема реализации режима PNS:
а) кодер; б) декодер
Еще одно усовершенствование связано с введением алгоритма ВSАС (Вit-Sliсеd Аrithmеtiс Соding — арифметическое кодирование с побитовым расщеплением). Чтобы получить масштабируемый поток, ВSАС использует альтернативный по отношению к ААС модуль кодирования квантованных коэффициентов с точным управлением скоростью потока в пределах от 16 кбит/с до 64 кбит/с с шагом 1 кбит/с.
Существенный выигрыш в скорости потока для стационарных гармонических и квазигармонических сигналов позволяет получить метод долговременного предсказания LТР (Long Теrm Рrеdiсtiоn). В технике кодирования речи этот метод широко используется во временной области. В стандарте МРЕG-4 он интегрирован в схему универсального кодера (см. рисунок 1.8), где операции квантования и кодирования осуществляются над спектральными представлениями входного сигнала.
Рисунок 1.8 — Схема универсального кодера с LТР
Для работы схемы LТР кодированный сигнал предыдущего кадра переводится обратно во временную область с помощью инверсного преобразования TNS и синтезирующего БФ, в блоке LТР он сравнивается с приходящим сигналом, а полученная разность опять переводится в спектральную область. Специальный переключатель FSS (Frequency Selective Switch — переключатель с частотной избирательностью) выбирает исходный или разностный сигнал в зависимости от того, какая альтернатива в данный момент предпочтительнее. По сравнению с предсказанием из МРЕG-2 ААС данный метод предсказания требует вдвое меньших ресурсов памяти и производительности процессора.
Для увеличения эффективности кодирования музыкальных сигналов на низких скоростях разработан алгоритм Twin VQ (Тrаnsfоrm-dоmаin Wеightеd Intеrlеаvе VQ — взвешивающее векторное квантование с перемежением и преобразованием областей). Основная идея — заменить обычное кодирование спектральных компонентов в ААС перемежающим векторным квантованием, приложенным к нормализованному спектру (см. рисунке 1.9).
Рисунок 1.9 — Алгоритм Twin VQ векторного квантования спектральных компонентов
Квантование спектральных коэффициентов осуществляется в два шага: на первом они нормализуются к некоторому пределу, на втором — квантуются с использованием векторного квантования. Процесс нормализации включает оценку спектра по шкале Барка, извлечение периодических компонентов и оценку мощности спектральных составляющих. В результате нормализации спектральные коэффициенты выравниваются и нормализуются вдоль частотной оси. Затем нормализованные коэффициенты описываются как многомерный вектор, чередуются в субвекторы, как показано на рисунке 1.9, и квантуются с использованием векторного квантования. Остальная часть алгоритма ААС остается неизменной.
Алгоритм Тwin VQ дает хорошие результаты в интервале скоростей от 6 кбит/с до 24 кбит/с и используется в основном вуниверсальных кодеках МРЕG-4 с масштабированием для формирования базового слоя.