Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

(по цифровому вещанию) Dvorkovich_V_Cifrovye_videoinformacionnye_sistemy

.pdf
Скачиваний:
249
Добавлен:
15.03.2016
Размер:
23.26 Mб
Скачать

Глава 6. Непосредственное кодирование изображений

Рис. 6.11. Варианты одномерного и двумерного преобразований изображения

В табл. 6.3 приведены характеристики различных видов предсказателей и дана усредненная оценка их эффективности, характеризуемая величиной энтропии (при 35-уровневом квантовании разностного сигнала) [3.17, 3.28].

Изменение свойств предсказателей при наличии движения в передаваемом изображении связано с двумя факторами:

при движении снижается корреляция между пикселами текущего и предыдущего кадров (полей);

интегрирование сигнала видеокамерой приводит к возрастанию корреляции внутри поля в направлении движения.

По этой причине эффективно использование адаптивных предсказателей, изменяющих свою структуру в зависимости от скорости движения.

Например, Грэхем (Graham) [3.16] предложил адаптивный предсказатель, использующий для предсказания значение пиксела X(i, j, k, 1) величины предыдущего пиксела в строке X(i − 1, j, k, 1), смежного пиксела в предыдущей строке X(i, j − 1, k, 1) или пиксела предыдущего кадра X(i, j, k − 1, 1) в зависимости от того, какая из разностей

|X(i − 1, j, k, 1) − X(i − 2, j, k, 1)| (межэлементная разность),

|X(i − 1, j, k, 1) − X(i − 1, j − 1, k, 1)| (межстрочная разность),

|X(i − 1, j, k, 1) − X(i − 1, j, k − 1, 1)| (межкадровая разность) является минимальной.

6.4. Квантование сигналов, ошибки предсказания

 

Рис. 6.12. К использованию межкадрового предсказания

Как следует из рассмотренного материала, способы обработки массивов данных статических изображений обобщены для динамических изображений.

Выбор типа шкалы квантования зависит от принципа формирования и метода кодирования разностного сигнала. При малом шаге квантования обычно выбирают линейную шкалу, поскольку в данном случае линейная шкала минимизирует энтропию квантованного сигнала. Однако при квантовании разностных сигналов для обеспечения достаточного качества восстановления изображений не требуется использование малого шага квантования, и разностные сигналы обычно квантуются нелинейным способом [3.1, 3.4, 3.5, 3.17, 3.18, 3.29].

Для определения шкалы квантования используют критерий минимизации среднеквадратичного отклонения и субъективную оценку качества восстанавливаемого изображения.

Применение первого критерия не вызывает особых осложнений, поскольку для этого необходимо знать лишь плотность распределения вероятностей разностного сигнала и число уровней квантования.

Глава 6. Непосредственное кодирование изображений

Таблица 6.3. Межкадровое предсказание

Вид

Элемент, по которому

Энтропия

предсказателя

осуществляется

разностного

п/п

[X(i, j, k, 1) − Px]

предсказание (Px)

сигнала, биты/пиксел

1

Межкадровая

X(i, j, k − 1, 1)

2,1–3,9

разность

2

Межэлементная

X(i − 1, j, k, 1)

2,0–3,7

разность

 

Межэлементная

X(i, j, k − 1, 1)+

 

3

и межкадровая

+X(i − 1, j, k, 1) −

1,8–3,1

 

разность

− X(i − 1, j, k − 1, 1)

 

 

Межстрочная

X(i, j, k − 1, 1)+

 

4

и межкадровая

+X(i, j − 1, k, 1) −

1,5–3,5

 

разность

− X(i, j − 1, k − 1, 1)

 

5

Межполевая

[X(i, j − 1, k, 2) +

1,8–2,5

 

разность

+ X(i, j, k, 2)]/2

 

 

Межэлементная

X(i − 1, j, k, 1)+

 

 

+[X(i, j − 1, k, 2)+

 

6

и межполевая

+X(i, j, k, 2)]/2−

1,5–2,5

 

разность

−[X(i − 1, j − 1, k, 2)+

 

 

 

+X(i − 1, j, k, 2)]/2

 

Плотность распределения вероятностей разностного сигнала, как уже было

отмечено, подчиняется закону Лапласа

 

p(x) =

λ

· exp(−λ |x|) ,

(6.5)

2

где λ — вариация, связанная со среднеквадратичным отклонением σ соотношением λ = 2/σ.

При определении уровней и порогов квантования обычно пользуются критерием Ллойда–Макса [3.17, 3.18, 3.30], описанным в Части I.

При этом плотность распределения разностного сигнала разбивают на ряд участков таким образом, чтобы вероятности попадания уровней сигнала в каждый участок были одинаковыми. Границы этих участков и являются пороговыми уровнями нелинейной шкалы квантования.

Далее вычисляется «центр тяжести» каждого интервала, являющийся соответствующим уровнем квантования для всех значений разностного сигнала, попадающий в интервал между соседними пороговыми уровнями.

Процесс определения пороговых уровней и уровней квантования поясняется на рис. 6.13.

Определение пороговых уровней dj и уровней квантования rj сводится к решению уравнений:

 

m =

dj

p(x) dx ,

i = 1, . . . , m − 1,

(6.6)

 

 

1

 

 

 

 

 

 

 

 

dj−1

 

 

 

rj =

dj

xp(x) dx ,

i = 1, . . . , m − 1,

(6.7)

 

 

dj−1

 

 

 

6.4. Квантование сигналов, ошибки предсказания

Рис. 6.13. К определению пороговых уровней и уровней квантования

Таблица 6.4. Пороги и уровни квантования, оптимальные для распределения Лапласа

1 разряд

2 разряда

3 разряда

4 разряда

Пороговые уровни

Уровни квантования

Пороговые уровни

Уровни квантования

Пороговые уровни

Уровни квантования

Пороговые уровни

Уровни квантования

 

 

 

 

 

 

 

 

 

 

 

 

 

 

−∞

−4,4311

 

 

 

 

 

 

−3,7240

−3,0169

 

 

 

 

 

 

−2,5971

−2,1773

 

 

 

 

 

 

−1,8776

−1,5778

 

 

 

 

−∞

−3,0867

−1,3444

−1,1110

 

 

 

 

−2,3796

−1,6752

−0,9198

−0,7287

 

 

−∞

−1,8340

−1,2527

−0,8330

−0,5667

−0,4048

−∞

−0,7071

−1,1269

−0,4198

−0,5332

−0,2334

−0,2664

−0,1240

0,0000

0,7071

0,0000

0,4198

0,0000

0,2334

0,0000

0,1240

 

1,1269

1,8340

0,5332

0,8330

0,2664

0,4048

 

 

 

1,2527

1,6752

0,5667

0,7287

 

 

 

 

2,3796

3,0867

0,9198

1,1110

 

 

 

 

 

1,3444

1,5778

 

 

 

 

 

 

1,8776

2,1773

 

 

 

 

 

 

2,5971

3,0169

 

 

 

 

 

 

3,7240

4,4311

 

 

 

 

 

 

 

где dj , rj — соответственно j-е порог и уровень квантования, m — число уровней шкалы.

В табл. 6.4 дано расположение уровней квантования и пороговых уровней квантователей Ллойда–Макса при Лапласовой плотности распределения разностного сигнала и σ = 1. В случае если преобразуется цифровой многоуровневый сигнал, значения пороговых уровней и уровней квантования могут быть определены следующим образом:

d= round(N σ dj ), r= round(N σ rj ),

где dj , rj — значения пороговых уровней и уровней квантования, определяемые по табл. 6.4; σ — относительная величина среднеквадратичного отклонения разностного сигнала; N — число уровней квантования исходного сигнала.

Другой стратегией в определении шкалы квантования в системах с предсказанием является учет визуального восприятия при выборе пороговых уровней и уровней квантования [3.1, 3.5, 3.31–3.33].

Глава 6. Непосредственное кодирование изображений

При субъективной экспертизе оптимизация шкалы квантования может определяться различными способами.

Например, один из них предполагает, что в распоряжении исследователей имеется достаточно большой набор различных шкал квантования, из которых необходимо выбрать шкалу, обеспечивающую наилучшее субъективное качество воспроизводимых изображений. В этом случае используется абсолютная шкала оценок качества.

Другой способ основан на изменении расстановки пороговых уровней и уровней квантования с использованием результатов субъективных экспертиз, приводимых по относительной шкале оценки качества. При этом исходят из предпосылки, что отдельные участки шкалы квантования искажают в основном различные части изображения.

Так, уровни шкалы квантования, расположенные в районе нуля шкалы мгновенных значений, в основном обеспечивают качество передачи монотонных перепадов яркости кодируемого изображения и отсутствие/наличие гранулярного шума, т. е. шума квантования на участках изображения с мало изменяющейся яркостью.

Средние участки шкалы квантования в основном определяют качество воспроизведения участков изображения со средней скоростью изменения яркости. Кроме того, эти участки используются при квантовании мелких деталей.

Участки шкалы квантования, наиболее удаленные от центра шкалы, предназначены для передачи резких перепадов яркости изображений.

Обращают на себя внимание значительные отличия шкал квантования, оптимизированных по субъективному критерию, и шкал квантования, рассчитанных по критерию Ллойда–Макса.

Основные отличия этих шкал заключаются в различной расстановке уровней квантования в средней части шкалы. Это понятно, поскольку заметность ложных контуров на изображении с большим количеством переходов и мелких деталей значительно ниже.

На рис. 6.14 приведены три монохромных изображения (и их увеличенные фрагменты): исходный (слева) и восстановленные из разностных сигналов с двумя вариантами четырехбитовой шкалы квантования, определенной по минимуму квадрата ошибки (в центре) и по максимуму субъективной оценки качества (справа).

Следует указать, что эффективность использования второй шкалы невысока. Для уменьшения ошибки квантования иногда применяют адаптивный метод, при котором производится мгновенное компандирование шкалы квантования. В зависимости от распределения яркости на локальном участке изображения изменяется расстановка уровней квантования, например, переключением со шкалы квантования с малым шагом на шкалу с большим шагом. Путем такой адаптации к локальным распределениям яркости участков изображения обеспечивается дополнительное сокращения объема передаваемой информации или повышение

качества ее передачи.

Команда на переключение шкал квантования производится по результатам анализа окружающих элементов и предыдущего предсказания.

При передаче участков ровного фона или плавных перепадов яркости используется точная шкала квантования, при резких изменениях сигнала применяется более грубая шкала.

6.5. Помехоустойчивость кодирования с предсказанием

Рис. 6.14. Монохромные изображения с 4-битовой шкалой квантования

В табл. 6.5 приведены результаты субъективных экспертиз качества телевизионных изображений, кодируемых с использованием предсказателей [3.5].

Таблица 6.5. Субъективная оценка кодирования с предсказанием

№ п/п

Вид предсказания

Число бит/пиксел

Оценка качества по

пятибальной шкале

 

 

 

 

 

3

3,0

1

Одномерное

4

4,0

неадаптивное

5

4,5

 

 

 

6

5,0

 

 

 

 

 

Одномерное

4

4,5

2

адаптивное

5

5,0

 

с коммутацией шкал

 

 

 

 

 

 

 

3

Двумерное

3

4,0

неадаптивное

4

4,5

 

 

 

 

 

 

Двумерное

3

4,5

4

адаптивное

4

5,0

 

с коммутацией шкал

 

 

 

 

 

 

 

Глава 6. Непосредственное кодирование изображений

Рис. 6.15. Примеры влияния помех на искажения при использовании межэлементного (слева) и межстрочного (справа) предсказания

При передаче изображений с использованием предсказаний особо важным является вопрос помехоустойчивости канального кодирования информации. При импульсно-кодовой модуляции (ИКМ) видеоинформации помеха искажает кодовые посылки только того пиксела, который передавался в момент возникновения помехи. Если помеха одиночная, то она поражает лишь один пиксел изображения. По этой причине заметны лишь те помехи, которые поражают старшие разряды ИКМ-кодов.

Усреднение яркостей пикселов смежных кадров в значительной мере снижает заметность даже существенно нерегулярных искажений пикселов.

В системах с предсказанием даже одиночная помеха при восстановлении вызывает искажения ряда пикселов [3.5, 3.34, 3.35]. Возникает трек ошибки, характер которого зависит от способа предсказания, а также частоты передачи опорных отсчетов.

При одномерном предсказании по одному пикселу будут искажены все последующие пикселы в направлении предсказания. На рис. 6.15 приведены примеры таких искажений для случаев предсказания в горизонтальном и вертикальном направлениях.

Помеха как бы «выбивает» следующую за ней часть изображения в направлении предсказания. Главная причина, из-за которой возникают столь заметные искажения, вызвана правилом декодирования кодовой последовательности на приемной стороне — для восстановления k-го пиксела необходимо сложить все поступающие из канала связи ошибки предсказания:

k

k = eˆi,

i=1

где i — порядковый номер элемента разностного сигнала, отсчитываемый в направлении предсказания от опорного пиксела x0.

Таким образом, каждая возникающая во время передачи j-го элемента предсказания ошибка Δˆei будет присутствовать при восстановлении всех пикселов, расположенных в направлении предсказания k j.

6.5. Помехоустойчивость кодирования с предсказанием

Чтобы уменьшить влияние ошибок канала связи, нужно либо сократить период между опорными отсчетами, либо уменьшить вес, с которым учитывается каждое приходящее значение ошибки предсказания. Последнее эффективно реализуется при увеличении порядка предсказания (см. табл. 6.2).

Скорость убывания размаха помехи и ее заметность определяются соотношениями весовых коэффициентов и алгоритмом предсказания. При этом происходит перераспределение энергии помехи в нескольких направлениях, что вызывает резкое снижение ее заметности.

При кодировании изображений с предсказанием возможности сокращения цифрового потока ограничены. Это связано в первую очередь с тем, что предсказание производится поэлементно, и использование нелинейного квантования не позволяет существенно сократить визуальную избыточность без снижения качества восстанавливаемого изображения. При кодировании с предсказанием практически не удается обойтись меньшим объемом информации, чем 4 бита на пиксел.

Альтернативой кодированию, использующему декорреляцию видеоинформации предсказанием, является групповое кодирование, основанное на разбиении изображений на участки и одновременном кодировании сразу группы элементов. При этом более экономное кодирование связано с одной стороны с использованием условного кодирования (см. часть I), а с другой стороны — с возможностью нарушения соотношений между пикселами таким образом, что это не приведет к визуально заметным искажениям.

При групповом кодировании обычно используют преобразование исходных данных. В этом случае повышение эффективности кодирования связано, в основном, с тремя факторами [3.1, 3.5, 3.17, 3.18, 3.36–3.39]:

в процессе преобразования ряд коэффициентов становятся настолько малыми по величине, что их можно отбросить без заметного изменения качества восстанавливаемых изображений;

в процессе преобразования осуществляется декорреляция данных, обеспечивающая повышение эффективности статистического кодирования;

различное нелинейное квантование коэффициентов преобразования позволяет существенно сократить объем передаваемой информации без заметного изменения качества изображения при его восстановлении.

Широкое распространение получили так называемые унитарные преобразования, являющиеся частным случаем линейных преобразований, при которых линейный оператор обратим (т. е. матрица, умножением на которую реализуется преобразование, обязательно имеет обратную ей матрицу, умножением на которую исходные данные могут быть точно восстановлены), а его ядро удовлетворяет условиям ортогональности [3.18, 3.40–3.44].

7.1. Дискретные линейные ортогональные преобразования

Предположим, что прямоугольный участок изображения размером N1 ×N2 пикселов X(n1, n2), 1 n1 N1; 1 n2 N2, отображается линейным преобразованием в компоненты F (m1, m2):

N1 N2

F (m1, m2) =

X(n1, n2)·A(n1, n2; m1, m2),

(7.1)

n1=1 n2 =1

где 1 m1 N1, 1 m2 N2, A(n1, n2; m1, m2) — ядро прямого преобразования. Исходный участок изображения можно получить с помощью обратного преобразования:

N1 N2

X(n1, n2) =

F (m1, m2)·B(n1, n2; m1, m2),

(7.2)

m1=1 m2=1

B(n1, n2; m1, m2) — ядро обратного преобразования. Преобразование является унитарным, если выполняются условия:

N1 N2

A(n1, n2; m1, m2) · A (j1, j2; m1, m2) =

m1=1 m2=1

N1 N2

=

B(n1, n2; m1, m2) · B (j1, j2; m1, m2) = δ(n1 − j1, n2 − j2), (7.3)

m1=1 m2=1

а также

N1 N2

A(n1, n2; m1, m2) · A (n1, n2; k1, k2) =

n1=1 n2=1

N1 N2

=B(n1, n2; m1, m2) · B (n1, n2; k1, k2) = δ(m1 − k1, m2 − k2). (7.4)

n1 =1 n2=1

Здесь — знак сопряженного преобразования, получаемого комплексным сопряжением и транспонированием матрицы преобразования.

Преобразование называется разделимым, если

A(n1, n2; m1, m2) = AC (n1, m1) · AR(n2, m2),

(7.5)

B(n1, n2; m1, m2) = BC (n1, m1) · BR(n2, m2),

где AC (BC ) и AR(BR) — одномерные операторы преобразования столбцов и строк. В этом случае результат воздействия двумерного унитарного преобразования можно получить в два этапа — сначала выполняется одномерное преобразование по всем столбцам блока изображения, а затем над полученными результатами

проводится преобразование по всем строкам:

N1

P (m1, n2) = X(n1, n2) · AC (n1, m1);

n1=1

(7.6)

N2

F (m1, m2) = P (m1, n2) · AR(n2, m2).

n2 =1

Возможны различные интерпретации унитарных преобразований. Преобразование изображения можно рассматривать как разложение исходно-

го изображения в обобщенный двумерный спектр. Каждая спектральная состав-