Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

(по цифровому вещанию) Dvorkovich_V_Cifrovye_videoinformacionnye_sistemy

.pdf
Скачиваний:
249
Добавлен:
15.03.2016
Размер:
23.26 Mб
Скачать

Глава 6. Непосредственное кодирование изображений

Рис. 6.3. Разложение цветного изображения на три компоненты

В частности, в стандартных телевизионных системах PAL и SECAM разрешение и по горизонтали и вертикали для сигналов U и V может быть уменьшено в четыре раза, с учетом того, что их граничная частота в четыре раза меньше граничной частоты сигнала яркости Y . На рис. 6.3 приведено исходное цветное изображение, а также изображения сигналов YD, CR и CB .

Напомним,

YD = round (219EY + CR = round (160ER−Y CB = round (126EB−Y

16);

+128);

+128).

При обратном преобразовании этих изображений получаемое цветное изображение практически не отличается от исходного. Объем информации в каждом из сигналов CR и CB в 16 раз меньше объема информации монохромного изображения YD .

Небольшое сокращение объема информации при использовании ИКМ возможно за счет использования адаптивного кодирования.

Хотя плотность распределения вероятностей уровней пикселов, усредненная по множеству изображений, подчиняется практически равномерному закону, для конкретных изображений она может быть существенно неравномерной, что позволяет использовать вероятностные методы кодирования, снижающие среднее количество используемых битов на пиксел.

На рис. 6.4 приведено монохромное изображение «Залив», а также плотность распределения вероятностей уровней его пикселов. При этом если при неадаптив-

ном кодировании требуется использование ˆн битов/пиксел, то адаптивное

L = 8

кодирование снижает ее величину до ˆa бита/пиксел.

L = 7,3

6.2. Кодирование изображений с предсказанием

P

0,040

0,035

0,030

0,025

0,020

0,015

0,010

0,005

Y

0 31 63 95 127 159 191 223 255

Рис. 6.4. Распределение плотности вероятностей яркости пикселов изображения

-

Кодирование изображений с использованием ИКМ не позволяет существенно сократить объем исходной информации, поскольку не учитывает корреляционные связи между пикселами. Более эффективными являются системы кодирования

спредсказанием, принцип работы которых заключается в том, что в соответствии

снекоторыми алгоритмами по значениям предшествующих пикселов производится предсказание значения текущего пиксела. При этом кодируются и передаются лишь ошибки предсказания, по которым на приемной стороне восстанавливается исходное изображение.

Методы такого кодирования принято называть дифференциальной импульс- но-кодовой модуляцией (ДИКМ).

Подробнее процедура ДИКМ была уже описана в Части II.

Очевидно, что эффективность предсказания связана с согласованием алгоритма предсказания со статистическими свойствами передаваемого изображения [3.14-3.17].

На рис. 6.5 приведены изображение «Залив» и зависимости, характеризующие корреляционные связи между соседними элементами вдоль и поперек строк.

Концентрация точек вокруг прямой линии, исходящей из начала координат, говорит о высокой корреляции между соседними пикселами и, следовательно, о возможности достаточно точного предсказания последующих отсчетов по известным предыдущим.

Аналогичная картина наблюдается и при оценке корреляционных связей в цветоразностных сигналах. На рис. 6.6 приведены цветное изображение «Залив»

Глава 6. Непосредственное кодирование изображений

Рис. 6.5. Корреляционные связи между яркостями соседних пикселов вдоль и поперек строк

изависимости, характеризующие корреляционные связи между значениями цветоразностных сигналов U и V, соответствующими смежным пикселам в строке

ипоперек строк.

Таким образом, изучение статистики изображений показывает, что в предшествующих пикселах содержится значительная часть информации об очередном пикселе.

Наибольшее распространение получили методы линейного предсказания, в которых значение текущего пиксела предсказывается в виде линейной комбинации (n − 1) известных пикселов [3.1, 3.5, 3.17, 3.18]:

 

n−1

 

 

i

(6.1)

k =

αi xk−i.

 

=1

 

Заметим, что xk−i — не обязательно отсчеты сигнала, предшествующие xk в строчном интервале или в предшествующих строках. Разность между истинным значением пиксела xk и предсказанной величиной xˆk

6.2. Кодирование изображений с предсказанием

Рис. 6.6. Корреляционные связи между цветностями соседних пикселов

ek = xk − xˆk

(6.2)

называется ошибкой предсказания, а соответствующий ей сигнал — разностным сигналом.

Разностный сигнал имеет больший динамический диапазон по сравнению с исходным и может принимать как положительные, так и отрицательные значения.

Однако распределение плотности вероятностей разностного сигнала выгодно отличается от распределения плотности вероятностей исходного, а именно:

оно значительно меньше зависит от вида изображения;

статистики разностных сигналов почти всегда могут быть охарактеризованы Лапласовым распределением, вариация которого в основном зависит только от вида предсказания.

Отметим еще раз, что при этом для одного и того же вида предсказателя алгоритм кодирования оказывается эффективным для различных изображений.

Плотность распределения вероятностей разностного сигнала имеет ярко выраженный неравномерный характер с максимумом в области нулевых значений. Это означает, что ошибка предсказания благодаря сильным связям между соседними элементами в большинстве случаев мала. При этом энтропия разностного сигнала оказывается существенно меньше энтропии исходного сигнала.

Корреляционные связи между элементами разностного сигнала существенно ослабевают, хотя они все-таки остаются, что проявляется, например, в сохранении контуров объектов в разностном сигнале.

Глава 6. Непосредственное кодирование изображений

Рис. 6.7. Исходное изображение и изображения разностных сигналов (справа сверху — между смежными пикселами в строке, справа снизу — между смежными пикселами соседних строк)

На рис. 6.7 приведено исходное изображение и изображения двух разностных сигналов — между смежными пикселами в строке и смежными пикселами

всоседних строках.

Вкачестве критерия, обеспечивающего расчет весовых коэффициентов линейного предсказания, зачастую используют минимум среднеквадратичного отклонения ошибки предсказания:

min E(x

N

N

).

(6.3)

N

 

 

 

Это условие приводит к определению коэффициентов αi из системы уравнений [3.17, 3.18]:

N −1

αirij = rN j , 1 j N − 1,

(6.4)

i=1

где rij — коэффициенты автокорреляции между пикселами, смещенными один относительно другого на интервал |i − j|.

Наиболее простой способ линейного предсказания реализуется в системах кодирования с дельта-модуляцией [3.19—3.21], при которой обычно предусматривается квантование разностного сигнала лишь на два уровня, что позволяет передать лишь знак ошибки предсказания. Если знак ошибки положителен, то

6.2. Кодирование изображений с предсказанием

Рис. 6.8. Варианты включения квантователя в кодирующих устройствах с предсказанием

сигнал в декодере увеличивается на некоторую заданную величину , равную минимальному дискрету шкалы квантования; в противном случае сигнал в декодере уменьшается на эту же величину .

Характерной особенностью такого алгоритма работы является возникновение значительных искажений сигнала при резких его изменениях (так называемые перегрузки по крутизне). Эта особенность приводит к снижению четкости восстанавливаемых изображений.

Повышение качества передачи изображений при использовании дельта-моду- ляции связано с применением алгоритмов адаптивного изменения шкалы квантования (или компандирования).

Принцип компандирования заключается в том, что если, например, знак приращения сигнала не изменяется в течение, скажем, трех-четырех интервалов дискретизации, то шкала изменения сигнала удваивается.

При отсутствии изменения знака приращения процесс удвоения шкалы может осуществляться несколько раз.

Недостатки дельта-модуляции устраняются использованием многоуровневого квантования разностных величин. При этом кодирующее устройство может быть выполнено двумя способами, зависящими от места включения блока квантования [3.5, 3.18, 3.22–3.24], как показано на рис. 6.8.

В первом варианте квантователь включен вне цепи обратной связи, формирующей сигнал предсказания. В этом случае требуется использование большого числа уровней квантования, поскольку шумы квантования при восстановлении изображений укрупняются предсказателем на приемной стороне.

Поясним это следующим образом. Пусть при квантовании k-го отсчета разностного сигнала возникла некоторая ошибка квантования k. Так как на пере-

Глава 6. Непосредственное кодирование изображений

Рис. 6.9. Структурные схемы предсказателей

дающей стороне имеется истинное значение k-го отсчета xk, то при определении (k + 1)-го отсчета разностного сигнала ошибка k учтена не будет, в то время как на приемной стороне ошибка квантования k-го отсчета будет присутствовать при вычислении всех последующих отсчетов.

Это приводит к накоплению ошибок и к увеличению их заметности на переданных и восстановленных изображениях.

Устранение такого эффекта достигается включением квантователя в цепь обратной связи.

В зависимости от того, каким образом выбираются элементы изображения, используемые для предсказания, системы ДИКМ могут быть разделены на три основные группы — одномерного, двумерного и трехмерного предсказания, структурные схемы которых приведены на рис. 6.9а, б, в, соответственно.

Одномерные предсказатели используют предсказание по одному измерению, например межэлементное, межстрочное, межкадровое предсказание.

При межэлементном предсказании (рис. 6.9) требуется наименьший объем памяти.

Использование в предсказателях элементов телевизионного изображения, взятых по вертикали, осложняется принятым в вещательном телевидении принципом чересстрочного разложения, поскольку корреляция между смежными эле-

6.3. Основные виды предсказания

Рис. 6.10. Позиции и наименования элементов поля изображения с ортогональной и шахматной структурами

ментами соседних строк одного поля значительно ниже, чем между смежными элементами соседних строк двух последовательно передаваемых полей. Существенным препятствием в использовании в предсказателях элементов смежных полей является влияние изменений изображения в результате движения.

Двумерные предсказатели (рис. 6.9, справа сверху) используют для оценки уровней текущих пикселов элементы, смещенные как по горизонтали, так и по вертикали.

Менее всего до сих пор использовались трехмерные предсказатели (рис. 6.9, снизу), однако следует полагать, что их эффективность более высока, чем у двумерных и тем более одномерных.

Одним из важнейших вопросов реализации ДИКМ является создание рациональной шкалы квантования, использование которой позволяет уменьшить число уровней квантования.

6.3.1. Внутрикадровое предсказание

Алгоритм внутрикадрового предсказания зависит от структуры дискретизации изображений.

На рис. 6.10 в качестве примера приведены позиции и наименования элементов поля телевизионного изображения, используемых для предсказания элемента X(i, j) при двумерной дискретизации с одинаковой начальной фазой для каждой строки.

Чаще всего для предсказания используются значения пикселов X(i − 1, j),

X(i − 1, j − 1) и X(i, j − 1).

В табл. 6.1 приведены варианты используемых коэффициентов предсказания для сигнала яркости и цветоразностных сигналов [3.17, 3.24]. В правой крайней

Глава 6. Непосредственное кодирование изображений

Таблица 6.1. Оценка различных методов предсказания

 

Коэффициенты предсказания для пикселов

Дисперсия

Видеосигнал

разностного

 

X(i − 1, j)

X(i − 1, j − 1)

X(i, j − 1)

сигнала, σ2

 

e

 

1

53,1

EY

1

−1/2

1/2

29,8

 

3/4

−1/2

3/4

27,9

 

7/8

-5/8

3/4

26,3

 

1

22,6

E

1

6,8

1/2

−1/2

1

4,9

R−Y

 

5/8

−1/2

7/8

4,7

 

1

13,3

E

1

3,2

1/2

−1/2

1

2,5

B−Y

 

3/8

−1/4

7/8

2,5

колонке даны усредненные по множеству цветных изображений дисперсии разностных сигналов σe2. Дискретизация сигнала яркости производилась с частотой 10 МГц, а цветоразностных сигналов — с частотой 2 МГц, квантование — восьмибитовое.

Из этой таблицы следует, что предсказание цветоразностных сигналов особенно эффективно. Эти варианты приведены в табл. 6.2.

Мощность сигнала ошибки предсказания — не единственный критерий, определяющий качество предсказателя. Более важными являются субъективная оценка качества изображений при их восстановлении, влияние порядка предсказания на характер помех, вызываемых появлением ошибок в каналах связи.

Переход от одномерных видов предсказания (пп. 1–3 табл. 6.2) к двумерным хотя и приводит к уменьшению мощности ошибки предсказания, но радикально не изменяет ситуацию.

Однако при этом возможно резкое повышение качества воспроизводимых изображений и снижение влияния помех канала передачи информации. Можно выделить две основные группы алгоритмов предсказания [3.5]. Одна из них предусматривает расчет предсказуемой величины как взвешенной суммы значений ближайших к нему элементов. Весовые коэффициенты при этом положительны, характер предсказания и число учитываемых при предсказании элементов не меняется в зависимости от локальной структуры изображения.

Другая группа алгоритмов использует для предсказания не только положительные, но и отрицательные весовые коэффициенты, причем зачастую имеются два весовых коэффициента, близкие по величине, но разные по знаку. Такой алгоритм позволяет адаптироваться к локальной структуре изображения: при кодировании участков изображения с плавно изменяющимся или не изменяющимся фоном происходит компенсация влияния элементов с коэффициентами, равными по величине, но разными по знаку.

На рис. 6.11 приведены варианты изображений, определяемые разностными сигналами при использовании одномерного и двумерного алгоритмов внутрикадрового предсказания.

Для данного изображения алгоритм, использующий двумерное предсказание, является более эффективным — границы контуров изображения менее выраже-

6.3. Основные виды предсказания

Таблица 6.2. Различные варианты коэффициентов предсказания

 

Количество

 

 

 

 

 

элементов,

 

 

 

 

Структура

применяемых

Коэффициенты предсказания для пикселов

дискретиза-

п/п

для

 

 

 

 

ции

 

 

 

 

 

 

предсказания

 

 

 

 

 

 

 

X(i − 1, j)

X(i − 1, j − 1)

X(i, j − 1)

X(i + 1, j − 1)

 

1

1

1

рис. 6.10а

 

 

 

 

 

 

 

2

-»-

1

-»-

 

 

 

 

 

 

 

3

-»-

1

-»-

 

 

 

 

 

 

 

4

2

1/2

1/2

-

рис. 6.10а, б

 

 

 

 

 

 

 

5

-»-

1/2

1/2

-»-

6

3

1/2

1/4

1/4

рис. 6.10а

7

-»-

1/2

1/4

1/4

-»-

8

-»-

1

−1

1

рис. 6.10а, б

9

-»-

1

−1/2

1/2

-»-

10

-»-

1/2

−1/2

1

-»-

11

-»-

3/4

−1/2

3/4

-»-

12

-»-

3/4

−9/16

13/16

-»-

13

-»-

7/8

−5/8

3/4

-»-

14

4

7/8

−1/2

1/2

1/8

рис. 6.10б

ны. Заметим также, что выбор лучшего алгоритма предсказания существенно зависит от используемой структуры дискретизации изображения. Изменение периода дискретизации при любой структуре расположения отсчетов приводит к изменению корреляционных связей между близко расположенными друг к другу пикселами.

6.3.2. Межкадровое предсказание

Движущееся телевизионное изображение представляет собой последовательность кадров (полей) неподвижных изображений. Свойства неподвижных изображений с точки зрения сжатия объема, необходимого для их передачи и воспроизведения информации, рассмотрены выше.

Специфическими особенностями движущихся телевизионных изображений являются наличие временной корреляции между соответствующими элементами в последовательности сменяющих друг друга кадров и связанной с этим временной статистической избыточностью информации об уровнях пикселов изображений.

Межкадровое предсказание использует комбинацию из пикселов текущего и предыдущих кадров. Этот вид предсказания особенно эффективен при малом изменении изображения от кадра к кадру. При увеличении скорости движения в предсказателях эффективно использование лишь пикселов смежных полей. Для сцен с большим движением целесообразно использование лишь внутрикадрового предсказателя.

На рис. 6.12 приведены обозначения пикселов в двух соседних кадрах, используемых в предсказателях. Смежные поля каждого кадра условно обозначены как первое (второе) и второе (первое) поля. X(i, j, k, 1)−i-й пиксел j-й строки первого поля k-го кадра.