Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Цифра / ЦОСиИ_2014_2015_заочн / Теория и практика вейвлет-преобразования.pdf
Скачиваний:
163
Добавлен:
18.05.2015
Размер:
9.01 Mб
Скачать

Глава 9

ПОТЕНЦИАЛЬНЫЕ ХАРАКТЕРИСТИКИ КОДИРОВАНИЯ ИЗОБРАЖЕНИЯ С ПРИМЕНЕНИЕМ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ

Коэффициенты вейвлет-преобразования имеют приблизительно гауссовскую плотность распределения. Из теории информации известно, что в случае, если шаг квантователя достаточно мал, среднеквадратичная ошибка ко-

дирования D(R ) пропорциональна 22R , где R - среднее число бит на пик-

сел. Под малым шагом квантователя понимается то, что вероятность попадания коэффициента в тот или иной интервал квантователя постоянна и не зависит от значения этого интервала. Коэффициент пропорциональности зависит от используемого базиса и алгоритма распределения бит. В интересующем диапазоне кодирования изображения тратится менее 1 бит на пиксел. В этом случае предположение о малости шага квантователя становится неверным. В данной главе представлены аналитические соотношения для случая вейвлет-кодирования изображений при низких битовых скоростях

( R < 1 бит/пиксел).

В разделе 9.1 кратко рассматриваются основные положения теории информации, касающиеся скалярных квантователей с ограниченной энтропией и кодирования с преобразованием. В разделе 9.2 представлена аналитическая зависимость искажения от скорости для вейвлет-кодеков при низких скоростях кодирования.

9.1. Основные формулы и теоремы теории связи, относящиеся к кодированию с преобразованием при высоких скоростях

(>1бит/пиксел)

Изображение, подвергаемое кодированию, представляется случайным

вектором Y размерностью N.

Хотя оно является двумерным, для простоты

обозначений отдельные пикселы обозначаются как Y [n]. Кодер с преобразо-

ванием

декомпозирует эти

изображения по ортонормальному базису

G = {gm

}0m :

 

N 1

Y = A[m]gm .

m=0

Каждый коэффициент A[m] есть случайная величина, определяемая как

129

N 1

[n].

A[m]= Y , g m = Y [n]g m*

n =0

 

Для построения конечного кода каждый коэффициент A[m] аппроксими-

руется квантованной переменной

ˆ

A[m]. Далее рассматриваются только ска-

лярные квантователи как наиболее часто встречающиеся при кодировании с преобразованием.

9.1.1.Скалярное квантование с ограниченной энтропией

Скалярный квантователь Q аппроксимирует случайную переменную Х

квантованной переменной

ˆ

= Q(X ), которая может принимать конечное

X

множество значений. Предполагается, что Х принимает значения в диапазоне

[a,b],

который может соответствовать всей вещественной оси. Интервал

[a,b]

декомпозируется на К интервалов (yk 1 , yk ]1k K переменной длины с

y0 = a

и yk = b . Если x (yk 1 , yk ], то Q(x)= xk

. Для скалярного квантовате-

ля известно, что энтропия

 

 

K

 

 

ˆ

pk

 

H (X )= −pk log2

k =1

есть нижняя граница среднего количества бит на символ, используемого для

кодирования значений

ˆ

-

вероятность того, что x (yk 1 , yk ].

X , где pk

Арифметическое энтропийное кодирование достигает сколь угодно близкого к этой границе среднего числа бит на символ. Поэтому в дальнейшем считается, что эта граница достигнута. Скалярный квантователь с ограниченной

энтропией минимизирует

ˆ

H (X ) для фиксированного среднеквадратичного

искажения

ˆ 2

 

D = Ε{(X X ) }.

 

Пусть

p(x) есть плотность распределения вероятности отсчетов случай-

ного

источника Х. Считается, что квантователь имеет высокое разрешение,

если

p(x)

примерно постоянна в каждом интервале квантования

(yk 1 , yk

]

размером

k = yk yk 1. Это будет иметь место в случае, когда размеры

k

достаточно малы относительно скорости изменения p(x). Известно, что рав-

номерные квантователи являются оптимальными среди квантователей с высоким разрешением.

130

Если Q - квантователь с высоким разрешением относительно p(x), то

ˆ

 

1

 

 

 

 

H (X )H d

(X )

 

log

2

(12D).

(9.1)

2

 

 

 

 

 

 

Это неравенство превращается в равенство, если и только если Q является

2

равномерным квантователем. Тогда D = . 12

Для фиксированного искажения D, при условии соблюдения гипотезы о высоком разрешении, минимальная средняя скорость RX = H (X ) достигается поэтому равномерным квантователем и

RX = H d (X )log2 .

(9.2)

Зависимость искажения от скорости получается из (9.1):

D(RX

) =

1

22 H d (X )22 RX .

(9.3)

 

 

12

 

 

По-видимому, даже если гипотеза о квантовании с высоким разрешением не выполняется, равномерный квантователь близок к оптимальному для большого класса источников, при условии, что число интервалов квантования достаточно велико.

9.1.2.Зависимость искажения от скорости

Получим зависимость искажения от скорости для коэффициентов A[m]

вейвлет-разложения Y = N 1 A[m]gm . Средний бюджет бит, необходимый для

m=0

кодирования

ˆ

= H (A[m]) . Для квантования с высоким

A[m]= Q(A[m]) есть Rm

разрешением ошибка квантования будет минимальна при использовании равномерного скалярного квантователя. Процедура оптимального распреде-

 

 

 

 

N 1

ления бит должна минимизировать общее число бит R = Rm для заданной

 

 

 

 

m=0

N 1

 

 

 

 

суммарной ошибки D = Dm . Пусть

 

=

R

есть среднее число бит на от-

R

 

m=0

 

 

N

131

счет. Применяя множители Лагранжа, можно доказать, что R будет мини-

мальна в случае, если все Dm равны. Тогда

 

 

 

 

 

 

D(

 

 

)=

 

N

22

 

d 22

 

,

 

R

H

R

(9.4)

 

 

12

 

 

 

 

 

 

 

где

 

d есть средняя дифференциальная энтропия:

 

H

 

 

 

 

 

 

 

 

 

 

N 1

(A[m]).

 

 

 

 

 

d =

1

H d

 

 

 

H

 

 

 

 

 

 

 

 

 

 

 

 

 

N m=0

 

 

 

 

Искажение (9.4) зависит от базиса вейвлетов G через H d . В общем случае

трудно найти G, минимизирующий

H

d , так

как плотность распределения

вероятности A[m]= Y , gm может зависеть от

gm сложным образом. Если Y

распределен по гауссовскому закону, то коэффициенты A[m] будут гауссовскими случайными переменными в любом базисе. В этом случае плотность распределения вероятности A[m] зависит только от дисперсии σ m2 и

H d (A[m]) = log2 σ m + log2 2πe .

Данное выражение подставляется в (9.4) :

 

 

 

πe N 1

2

1/ N

2

 

 

 

D(R )= N

R

.

(9.5)

6

σ m

 

2

 

 

 

 

 

m=0

 

 

 

 

 

 

 

N 1

Известно, что σ m2 минимально, если и только если G является базисом

m=0

Карунена-Лоэва для Y, то есть G диагонализирует ковариационную матрицу Y. Таким образом, оптимальным с точки зрения кодирования с преобразованием базисом для гауссовского процесса является базис Карунена-Лоэва. Если Y не является гауссовским (например, в случае изображения), базис Ка- рунена-Лоэва не является априорно оптимальным.

Наиболее популярным при кодировании изображений является разделимый базис вейвлетов. Разделимый вейвлет-базис включает в себя три семейства вейвлетов с горизонтальной, вертикальной и диагональной ориентацией,

индексируемые 1 ≤ k ≤ 3 . При ориентации k и масштабе 2 j вектор вейвлета

132