Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Цифра / ЦОСиИ_2014_2015_заочн / Теория и практика вейвлет-преобразования.pdf
Скачиваний:
163
Добавлен:
18.05.2015
Размер:
9.01 Mб
Скачать

gm = ψ kj , p ,q примерно центрирован в точке (2 j p,2 j q) с квадратной областью

определения, размер которой пропорционален 2 j . Как было отмечено, при высоких битовых скоростях кодирования минимальное искажение достигается путем равномерного квантования всех коэффициентов декомпозиции. Гладким участкам изображения соответствуют вейвлет-коэффициенты с малым значением амплитуды, которые квантуются в нуль. Для повышения эффективности кодирования вейвлет-коэффициенты сканируются в заранее определенном порядке, и позиции нулевых коэффициентов кодируются кодером длин серий. Амплитуды ненулевых квантованных коэффициентов кодируются кодером Хаффмана или арифметическим кодером.

Из формулы (9.4) следует, что

 

 

 

 

 

 

N

 

 

 

 

log2 D(R )= 2Hd

+ log2

− 2R ,

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

где H d есть средняя дифференциальная энтропия вейвлет-коэффициентов при всех масштабах и ориентациях. Из данной формулы следует, что log 2 D(R ) является убывающей функцией с наклоном –2. Однако из практики известно, что для области R < 1 функция log 2 D(R ) убывает значительно

быстрее. Для данной области формула (9.4) не выполняется в силу того, что предположение о квантовании с высоким разрешением уже неверно. Сжатие изображения с применением вейвлет-преобразования достигает хороших результатов для скоростей значительно меньших 1 бит/отсчет. Поэтому в следующем разделе исследуется зависимость скорости от искажения для низких скоростей кодирования.

9.2. Сжатие изображения при низких скоростях кодирования

При низких скоростях кодирования имеет место грубое квантование коэффициентов декомпозиции. Так как многие из коэффициентов обращаются в нуль, позиции нулевых и ненулевых коэффициентов сохраняются в бинарной карте значений, которая сжимается при помощи кодера длин серий или более сложного алгоритма нульдерева (см. главу 10). Теория передачи с погрешностью, описываемая выше, неприменима по следующим двум причинам. Во-первых, не выполняется предположение о квантовании с высоким разрешением в силу того, что интервалы квантователей большие. Во-вторых, невозможно представить общий бюджет бит R в виде суммы битов Rm, независимо распределенных для каждого коэффициента декомпозиции, так как кодирование коэффициентов при помощи бинарной карты значений яявляется, по сути, разновидностью векторного квантования.

133

Для оценки зависимости искажения от скорости необходима некоторая стохастическая модель изображения. Однако до сих пор не существует модели, которая бы учитывала сложную нестационарную структуру изображения, описывала бы текстуру и контуры. Поэтому далее изображение рассматривается как детерминированный вектор, чьи коэффициенты вейвлетдекомпозиции G имеют параметрический спад. Зависимость скорости от искажения, таким образом, будет находиться не для ансамбля сигналов, а для каждого сигнала f. Основным результатом данного раздела является вывод о том, что функция искажение-скорость зависит от точности аппроксимации f малым числом векторов, выбранных из G.

9.2.1. Функция искажение-скорость

Пусть сигнал f декомпозирован по вейвлет-базису G = {gm }0mN :

N 1

f = a[m]gm с a[m]= f , gm .

m=0

Коэффициенты преобразования квантуются, и декодер восстанавливает

 

 

 

N 1

 

 

fˆ = Q(a[m])gm .

 

 

 

 

m=0

 

Ошибка кодирования

 

 

 

 

 

 

 

 

 

 

2

N 1

 

D =

f fˆ

 

 

=

a[m]Q(a[m])

2 .

(9.6)

 

 

 

 

m=0

 

Можно показать, что в случае применения ортонормального базиса, ошибка квантования в области трансформанты будет равна ошибке в области исходного изображения. На этом основано много алгоритмов кодирования. Через h[x] обозначим дискретную гистограмму N коэффициентов a[m], нор-

мализованную так, что x h[x]= 1 . Значения этой гистограммы интерполи-

 

+∞

руются, и вводится функция p(x)0 для всех x R , такая что p(x)dx = 1.

Тогда p(x)

−∞

есть плотность распределения вероятности случайной перемен-

ной Х. Предполагается, что N – достаточно большое и, следовательно, гистограмма достаточно регулярна, так что для всех функций φ(x) справедливо выражение:

134

1

N 1

 

+∞

 

φ(a[m])= φ(x)h[x]φ(x)p(x)dx = Ε{φ(X )}.

(9.7)

 

N m=0

x

−∞

 

Данная гипотеза выполняется для гистограмм большинства «естественных» изображений. Это эквивалентно тому, что коэффициенты a[m] есть

случайная последовательность Х. Заменив φ(x) = x Q(x)2 , из (9.7) получается

 

 

 

 

 

 

N 1

 

 

 

 

 

2 = Ε{X Q(X )

 

2 }.

 

 

 

 

D

=

1

 

a[m]Q(a[m])

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

N m =0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть

 

есть среднее число

бит на коэффициент для кодирования

R

Q(a[m]). Если Q является квантователем с высоким разрешением с шагом ,

то из (9.3) вытекает формула, аналогичная (9.4):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(

 

)

=

1

22 Hd (X )22

 

.

 

 

 

 

 

 

 

 

 

R

 

 

 

 

 

 

 

 

 

 

R

(9.8)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

12

 

 

 

 

 

 

 

 

 

 

Как правило, многие вейвлет-коэффициенты

a[m]= f , gm

близки к ну-

лю, и малое их количество имеет большую амплитуду. Поэтому p(x) имеет

острый пик при x = 0 . Если шаг квантования

велик, то p(x) имеет флюк-

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

туирующие значения в интервале

 

, где коэффициенты квантуются в

 

 

 

 

 

 

 

 

 

 

 

2 2

 

 

 

 

 

 

 

нуль. Следовательно, в этом интервале не выполняется гипотеза о квантовании с высоким разрешением. Это объясняет то, что функция log2 D(R ) имеет

спад порядка 2R только для R 1 .

На практике для квантования вейвлет-коэффициентов зачастую применяется «почти» равномерный квантователь. Все интервалы квантования, кроме нулевого, имеют равные размеры , а интервал возле нуля [T ,T ] - больше,

с отношением θ = T , которое может быть вычислено (обычно θ = 1 ). Для

x > T флюктуации p(x) в каждом интервале квантования относительно ма-

лы, и можно считать, что гипотеза о высоком разрешении квантователя выполняется. Эта гипотеза есть всего лишь аппроксимация, но она достаточно точно описывает свойства квантователя для проведения точных вычислений вплоть до очень низких скоростей кодирования. Для x [T ,T ] гипотеза о квантовании с высоким разрешением не выполняется.

135

Коэффициенты не квантуются в нуль, если они превышают некоторый порог a[m] > T . Такие коэффициенты обычно называют значимыми. Коди-

рование положения ненулевых коэффициентов эквивалентно сохранению бинарной карты значений, определяемой как

 

если

 

a[m]

T

 

 

 

0,

 

 

b[m]=

если

 

a[m]

.

(9.9)

 

1,

 

> T

 

 

 

 

 

 

 

 

 

 

 

 

Вейвлет-кодер изображения может использовать кодер длин серий для кодирования карты значений. Применяются также более эффективные методы кодирования карты, получившие название алгоритмов нульдерева.

Пусть R0 - число бит, требуемое для представления карты значений. Пусть М – число значащих коэффициентов. Можно записать пропорцию

p = M индексов m таких, что b[m]= 1. Верхнюю границу для R0 можно по-

N

лучить в предположении, что в позициях «1» и «0» в карте значений нет избыточности. Среднее количество бит для кодирования позиции одного коэффициента тогда будет равным энтропии бинарного источника, символы кото-

рого с вероятностью p =

M

 

принимают значения 1 и с вероятностью 1 p

N

 

 

 

принимают значение 0:

 

 

 

 

R0

≤ − p log2 p (1 p)log2 (1 p).

(9.10)

 

 

N

 

 

 

 

Для x (0,1] справедливо неравенство x log2 x (1 x)log2 e ,

так что

среднее количество бит на значащий коэффициент для кодирования карты значений будет

r0

=

R0

log2

N

+ log

2 e .

(9.11)

M

 

 

 

 

M

 

 

 

Для вейвлет-коэффициентов, когда отношение

M

мало, на выходе коде-

 

 

 

 

 

 

 

 

N

ра длин серий средняя битовая скорость r0 = R0 значительно меньше верх-

M

ней границы (9.11), так как существует значительная избыточность в позициях нулевых коэффициентов. Для большого класса изображений расчеты по-

казывают, что r0

=

R0

меняется медленно относительно

M

.

M

 

 

 

 

N

136

Амплитуды М значащих коэффициентов равномерно квантуются с шагом , и эти квантованные значения подвергаются энтропийному кодированию.

Пусть R1 - число бит, необходимое для кодирования этих коэффициентов. Для M >> 1 М значащих коэффициентов a[m] имеют нормализованную гистограмму, то есть

 

 

pT (x) =

N

p(x)1

 

>T }

.

(9.12)

 

 

 

x

 

 

 

M

{

 

 

 

 

 

 

 

 

 

 

Пусть

X T

есть случайная переменная, чья плотность распределения веро-

ятности -

pT

(x). Так как к значащим коэффициентам применима гипотеза

квантования с высоким разрешением, среднее число бит для кодирования амплитуды каждого значащего коэффициента, обозначаемое r1 , вычисляется из (9.2):

r1 =

R1

= H d (X T )log2 .

 

 

 

(9.13)

 

 

 

 

 

M

 

 

 

 

В целом кодирование с преобразованием требует R = R0

 

 

+ R1 бит.

Для получения оценки ошибки квантования D =

 

 

 

f fˆ

 

 

 

2

(9.6) суммарное

 

 

 

 

искажение делится на две части: искажение, возникающее в силу квантования незначащих коэффициентов в нуль ( D0 ), и искажение, возникающее в силу квантования значащих коэффициентов ( D1 ): D = D0 + D1 , где

 

 

 

 

 

 

 

 

 

 

D0 =

 

a[m]

2

 

 

 

 

(9.14)

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

a [m ]

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D1 =

 

a[m]

Q(a[m])2 .

 

 

 

 

 

 

 

 

 

 

 

 

(9.15)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a[m]

 

>T

 

 

 

 

 

D1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя ошибка квантования на значащий коэффициент

вычисляется

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с учетом гипотезы о квантовании с высоким разрешением:

 

 

 

D1

=

1

 

 

 

a[m]Q(a[m])

 

2 = Ε{X T Q(X T )

 

2 }=

2

. (9.16)

 

 

 

 

12

 

 

 

 

M

M

 

a [m ]

 

>T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для вычисления ошибки квантования незначащих коэффициентов рассматривается аппроксимация f посредством М векторов gm из G, чьи ска-

137

лярные произведения с f имеют наибольшие амплитуды. Тогда искажение D0 будет

 

 

M

=

 

f fM

 

2

=

 

a[m]

2

 

 

D0

 

 

 

 

 

 

 

 

.

(9.17)

 

 

 

 

N

 

 

 

 

 

 

a[m]

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Величина D0 называется нелинейной ошибкой аппроксимации, так как М векторов выбираются в зависимости от f. Оценка скорости убывания D0 при увеличении М изучается в теории аппроксимации функций.

Если провести сортировку a[m] по амплитуде, то k-й коэффициент может быть записан в виде

x

k

=

 

a[m ]

 

 

 

 

 

 

 

k

 

N

 

 

 

 

 

 

k + 1

 

 

a[mk +1 ]

 

 

x

 

 

 

=

для 1 ≤ k N .

(9.18)

 

 

 

N

 

 

 

 

 

Ошибка аппроксимации D0 есть сумма N M квадратов коэффициентов меньшей амплитуды:

 

 

M

N

 

 

k

 

2

 

 

 

 

 

D0

 

 

 

=

 

x

 

 

 

.

(9.19)

 

 

 

 

N

k =M +1

 

 

N

 

 

 

 

 

 

M

M

, если x(z) убывает

Ошибка

D0

 

 

убывает быстро при увеличении

 

 

 

 

 

 

N

N

 

быстро при увеличении z. Таким образом, можно рассматривать функцию

x(z) при

z [0,1], которая интерполирует значения

 

k

x

 

.

 

 

 

 

N

Для оценки убывания D0 (z) при увеличении z в теории аппроксимации

функций

x(z) сравнивается с z γ для некоторого

γ > 0 . Для функций, де-

композированных в вейвлет-базис, экспонента γ

характеризует функцио-

нальные

пространства Бесова. Однако предположение, что x(z)= Cz γ , не

подходит для моделирования интересующего нас класса сигналов. Вместо этого вводится предположение о том, что эта экспонента медленно изменяется. Тогда можно определить

γ (z)= −

d log

2

x(z)

 

 

 

 

.

(9.20)

 

 

 

d log 2 z

138

Зависимость скорости от искажения при кодировании с низкими скоростями была получена С.Маллатом и Ф.Фальзоном. Для этого он предполо-

жил, что вторая производная не превосходит некоторого ε > 0 :

 

 

 

x(z)

 

 

 

 

 

 

.

 

d 2 log 2

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

ε

для

z 0,

 

.

(9.21)

 

(d log 2

2

 

 

 

z)

 

 

 

 

2

 

Также предполагается, что

 

 

 

 

 

 

 

 

 

 

 

γ (z)> 0 ,

 

 

 

(9.22)

 

d 2 log2 x(z)

0

для

z (0,1),

(9.23)

 

(d log2 z)2

 

и что p(x) симметрична:

 

 

 

 

 

 

 

 

 

 

 

p(x) = p(x) .

 

 

(9.24)

Большинство реальных

изображений

удовлетворяют

условиям

(9.21)-(9.24). При выполнении этих условий справедлива следующая теорема. Теорема 1. Предположим, что x(z) удовлетворяет (9.21)-(9.24). Пусть

 

 

 

M

 

1

 

 

 

 

M

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

γ M

= γ

 

 

 

>

 

. Если

 

 

ε и M

 

 

, то

 

 

 

 

 

 

 

 

2

N

 

ε

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(R )= (1 + K )D0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r1

+ r0

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2γ M 1

[1 + O(ε

 

 

 

 

 

 

 

 

+ ε 2γ M 1 )]

 

 

 

 

 

 

 

 

 

K =

D1

=

 

log

2

ε

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D0

 

 

 

12θ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 1 + (1 + γ M )log

2 e + log2 γ M + log2 θ + O(ε ).

 

 

 

 

 

 

r1

=

R1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(9.25)

(9.26)

(9.27)

Для практического применения данной теоремы формулы могут быть упрощены за счет пренебрежения коэффициентом ε . Так как вторая производная (9.21) мала, наклон

139

 

 

 

 

 

 

 

 

 

 

− log2

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

γ M

=

 

N

 

 

 

 

(9.28)

 

 

 

 

 

 

 

d log2 z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

изменяется медленно, как функция от

log2

M

. В диапазоне сжатия изобра-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

жений его можно считать постоянным: γ M γ . Из (9.26) и (9.27) следует, что

K =

D1

и r1 =

R1

также постоянны. Как уже было отмечено, в этом случае

D0

 

 

 

 

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r0 =

R0

 

. Следовательно, D(

 

) вычисляется в (9.25) путем масштабирования

 

R

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D0 (z) на постоянные

и умножения нелинейной ошибки аппроксимации

множители:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R

 

 

 

 

 

 

 

D(R )

= (1 + K )D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

(9.29)

 

 

 

 

 

 

 

 

+ r

 

 

 

 

 

 

 

 

 

 

 

0

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

0

 

 

Так как γ M γ , из (9.28) следует, что D0 (z) ~ z 2γ 1 и D(R )~ R 12γ .

Получившаяся зависимость скорости от искажения значительно отличается от известной формулы для гипотезы квантования с высоким разрешением,

где D(R )~ 22 R .

Искажение D в (9.29) существенно зависит от ошибки аппроксимации D0

сигнала f M векторами ( M =

 

R

 

 

), выбранными в базисе G. Для опти-

 

 

 

r1

+ r0

мального кодирования с преобразованием базис G должен точно аппроксимировать каждый из сигналов f малым числом базисных векторов. Если рассматривать f как реализацию случайного вектора Y, желательно было бы най-

 

 

M

 

ти базис, минимизирующий Ε D0

 

 

 

по всем реализациям. Из теории

 

 

 

N

 

известно, что оптимальным для аппроксимации сигнала Y с использованием M векторов является базис Карунена-Лоэва, но в данном случае это свойство оптимальности теряется, так как число векторов меняется в зависимости от реализации. В некоторых случаях известно, как найти базис, который мини-

 

 

 

M

мизирует максимальную ошибку

D0

 

 

для целого класса сигналов. На-

 

 

 

 

N

пример, базис вейвлетов является оптимальным в этом минимаксном смысле

140