Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
h2.doc
Скачиваний:
91
Добавлен:
10.02.2015
Размер:
6.92 Mб
Скачать

Особенности стандартаMpeg-2iso/iec13818

MPEG-2 Standart ISO/IEC 13818-3 (принят в марте 1994 г.) расширяет и дополняет MPEG-1 Standart ISO/IEC 11172-3 до возможности формирования в едином цифровом потоке пяти отдельных звуковых каналов и дополнительно канала сверхнизких частот (LFE — Low Frequence Enhancement) с высоким качеством и низкой суммарной скоростью их передачи. Тем самым становится возможным передать в цифровой форме по каналам связи, записать и воспроизвести в помещении прослушивания (комната радиослушателя, видеозал, кинотеатр и т.п.) всю совокупность конфигураций форматов воспроизведения, предусмотренных Документом 10/63Е ITU-R.

В MPEG-2 стандарте может быть организована передача любой конфигурации ЗС: 3/2, 3/1, 3/0, 2/2, 2/1, 2/0, 1/0, а также общего канала сверхнизких частот с полосой до 150 Гц (система звукопередачи 5+1). Напомним, что сформированный в ТФП пятиканальный ЗС перед кодированием подвергается матрицированию с целью выполнения требований совместимости и лишь после этого цифровой обработке для сокращения избыточности. Для компактного цифрового представления ЗС в данном случае используется метод кодирования MUSICAM, но в отличие от MPEG-1 в этом новом стандарте расширен состав применяемых кодеков и используемых частот дискретизации: 16, 22,05 и 24 кГц (дополнительно к ранее предусмотренным значениям: 32, 44,1 и 48 кГц). Стандарт MPEG-2 позволяет передавать одновременно: стереофонические сигналы в двух конфигурациях (3/0 и 2/0); стереофоническое звучание и дополнительно речь на двух языках; моносигнал и дополнительно до семи комментаторских каналов с более низким качеством, используя дополнительные частоты дискретизации 16, 22,05 и 24 кГц. В этом новом формате декодер ISO/IEC 11172-3 (MPEG-1) может восстанавливать два канала без дополнительной многоканальной части, а декодер MPEG-1 ISO/IEC 13818-3 расшифровывать поток данных формата 111723 как устройство более высокой иерархии.

Итак, для пары основных сигналов стереопары Л = Т0 и П = Т1 выполнено требование как прямой, так и обратной совместимости при декодировании (рис. 2.8).

Рис. 2.8 — К пояснению принципа передачи дополнительных сигналов многоканального расширения в стандарте MPEG-1 ISO/IEC 11172-3

Алгоритм декодирования дополнительных сигналов многоканального расширения Т2, Т3, Т4 иной, достаточно гибкий, ориентированный на максимально допустимое сокращение скорости цифрового потока при их передаче. Кроме того, длина фрейма в MPEG-2 составляет 48 мс вместо 24, поэтому для распознавания нового формата ID-бит в MPEG-1 принимает значение 0 (см. разд. 2.14).

В зависимости от вида кодирования декодер MPEG-2 ISO/IEC 13818-3 может декодировать либо чистую стереоинформацию [сигналы Л и П], либо смесь сигналов нескольких каналов.

Заметим, что пространственные сигналы LS и RS имеют полосу частот 100...7000 Гц, как это принято в системе «Dolby-Surround». Полоса частот сигнала С ограничивается значением 9 кГц, лишь два сигнала L и R имеют полную полосу частот.

Матрица кодирования и декодирования исходного пятиканального сигнала MPEG-2 стандарта представлена на рис. 2.9.

Рис. 2.9 — Матрицирование сигналов в стандарте MPEG-2

На передающей стороне системы звукопередачи исходный пятиканальный сигнал преобразуется в новую совокупность в соответствии со следующим алгоритмом (это преобразование выполняется для того, чтобы удовлетворить требованию совместимости:

(2.49)

где α, β, γ — постоянные коэффициенты, которые могут иметь различные значения (табл. 2.1) в зависимости от режима работы.

Таблица 2.1

Ре-жим

Коэффициенты матрицирования

α

β

γ

0

1/(1+2)

1/2

1/2 (см. рис. 2.11)

1

1/(1,5+0,5 X 2)

1/2

1/2 (см. рис. 2.11)

2

1/(1+2)

1/2

1/2 (для сигналов Л и П сдвиг по фазе ±90º)

3

1

1

1 (без матрицирования)

Последняя строка в этой таблице соответствует режиму работы, когда исходная совокупность сигналов без матрицирования прямо доводится до пользователя. Далее, чтобы избежать возможной перегрузки, уровни сигналов T0, T1, T2, T3, T4 при передаче понижаются на значение α. Режим 2 соответствует передаче сигналов системы «Dolby Surround», поэтому при их дематрицировании для выделения пространственных сигналов должен выполняться поворот фазы сигналов Л и П соответственно на ±90°.

На рис. 2.10 изображена в упрощенном виде структура MPEG-2 кодера для многоканальной звукопередачи. Исходными здесь являются входные сигналы LS, L, С, R, RS. Сигнал С центрального фронтального канала ограничивается по полосе сверху значением 9 кГц, а его более высокочастотные компоненты распределяются на левый L и правый R фронтальные каналы. Все исходные сигналы анализируются с учетом психоакустической модели. Кроме того, с помощью банка фильтров, как и ранее в MPEG-1 стандарте, каждый из сигналов разделяется на 32 полосные составляющие, а затем дискретизируется с различной частотой дискретизации, но кратной системной тактовой частоте fs.

Рис. 2.10, a Структурная схема устройства для кодирования многоканального сигнала в соответствии

с MPEG-2 ISO/IEC 13818-3 для слоев «Layer-1» и «Layer-2»:

1 — психоакустическая модель; 2 — ФНЧ и ФВЧ с частотой среза 9000 Гц; 3 — банк полосовых из 32-х ПФ с полосой пропускания 720 Гц каждый; 4 — предварительное квантование отсчетов полосных ЗС; 5 — селекция каналов; 6 — вычисление предсказанных значений; 7 — распределение бит в дополнительных каналах; 8, 9 — кодирование сигналов основных и дополнительных каналов; 10 — форматирование

Рис. 2.10, б — Цифровые последовательности при кодировании

отсчетов полосных сигналов по MPEG-1 для слоев

«Layer-1» и «Layer-2»

Сигналы С, LS, RS дополнительных каналов квантуются до кодирования, чтобы уменьшить ошибки при их матрицировании. Далее все сигналы «взвешиваются» (α, β, γ), после чего поступают на сумматоры (+) для получения совместимых сигналов обычной стереофонии Л = T0 и П = T1. Эта основная пара сигналов дополняется тремя дополнительными сигналами T2, T3, T4, которые должны по возможности иметь при передаче как можно меньший суммарный поток аудиоданных.

В MPEG-2 стандарте для получения максимально возможной компрессии общего цифрового потока при кодировании дополнительного многоканального расширения (сигналы T2, T3, T4) учитывается также и степень корреляции между основными (Т0, Т1) и дополнительными (T2, T3, T4) сигналами. Если корреляция сильная, то от передачи данных по дополнительным каналам можно отказаться и передавать лишь различия по отношению к сигналам основных каналов. Для этой цели служит адаптивное предсказание, которое используется в MPEG-2 кодере при передаче дополнительных сигналов. Более того, сам состав передаваемых сигналов в дополнительных каналах непостоянен.

Возможны следующие восемь их комбинаций с соответствующим переключением в кодере:

Т0

Т1

Т2

Т3

Т4

Л

П

С

LS

RS

Л

П

L

LS

RS

Л

П

R

LS

RS

Л

П

С

L

RS

Л

П

С

LS

R

Л

П

С

L

R

Л

П

R

L

RS

Для уменьшения скорости передачи данных в MPEG-1 предусматривается режим «Joint-Stereo» («объединенное стерео»), в котором для области верхних частот в левом и правом каналах передаются только коэффициенты масштаба, сами же сигналы этой области остаются монофоническими. При более двух передаваемых сигналах можно исходить из того, что не каждый из них одновременно нуждается в максимальном потоке данных при его передаче. Для восприятия ЗС не требуется полной передачи всей информации в каждом из них.

Как правило, вся необходимая для полноценного восприятия информация в текущий момент времени содержится не более чем в двух-трех сигналах, остальные же из них в этот момент времени являются как бы «фоновым дополнением». Например, если в текущий момент явно ощущается какое-то приоритетное направление в пеленгации источника звука, то значительная доля информации в паре сигналов, определяющих его восприятие, идентична.

В этой связи в MPEG-2 стандарте предусматривается значительно более гибкий метод для компрессии общего потока данных — так называемое динамическое переходное затухание между каналами, что позволяет экономить значительное число бит при передаче. Для одного, двух или трех каналов передаются, как и при режиме «Joint-Stereo», лишь коэффициенты масштабирования, с помощью которых после декодирования меняется лишь соотношение уровней данной группы сигналов, остающихся одинаковыми по структуре (монофоническими, точнее говоря, изоморфными).

Иначе говоря, все значения отсчетов для таких групп частотных полос остаются общими и одинаковыми, кроме значения уровня. Одинаковыми и общими после декодирования являются и сами эти сигналы, наблюдаются лишь отличия в их уровне, необходимые для пеленгации (локализации) источника звука. В этой ситуации требуется лишь передать коэффициенты масштаба, а сами значения отсчетов восстанавливаемого сигнала берутся из другого канала. Таким образом, корреляция сигналов различных каналов используется здесь для дополнительной компрессии данных.

И еще одно замечание — при передаче многоканального расширения субполосные сигналы объединяются в 12 групп (табл. 2.2) для их последующего анализа и обработки с целью управления значением динамического переходного затухания между каналами многоканального расширения. В выходной части кодера все множество разделенных цифровых данных форматируется в соответствии с определенными правилами в единый цифровой поток.

Таблица 2.2

Номер группы полосных сигналов

0

1

2

3

4

5

6

7

8

9

10

11

Номер полосной составляющей исходного сигнала

0

1

2

3

4

5

6

7

8–9

10–11

12–15

16–31

Изложенное позволяет говорить о существенном отличии алгоритма обработки сигналов многоканального расширения в кодере MPEG–2 по сравнению с MPEG-1. Это отличие базируется на еще более тонком учете как структуры многоканального сигнала, так и свойств слуха при его восприятии и преследует только одну цель — обеспечить максимально возможное сокращение избыточности передаваемой информации, а значит, и уменьшение скорости цифрового потока при его передаче.

На рис. 2.11 изображена упрощенная структурная схема MPEG-2 декодера. Входной цифровой поток данных разделяется во входной части устройства на сигнальные и управляющие составляющие, а затем восстанавливаются первоначальные значения отсчетов ЗС. Декодированные ЗС подвергаются обратному преобразованию в матрице в каждой из 32 полос. И наконец, различные полосные составляющие каждого из сигналов вновь объединяются в инверсном банке фильтров. На выходе декодера получается исходная совокупность восстановленных сигналов Л', П' и LS', L', С', R', RS'.

Рис. 2.11 — Структура устройства для декодирования многоканального ЗС в соответствии

с MPEG-2 ISO/I ЕС 13818-3:

1 — деформатирование суммарного цифрового потока; 2декодирование; 3 — дематрицирование

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]