(по цифровому вещанию) Dvorkovich_V_Cifrovye_videoinformacionnye_sistemy
.pdfГлава 10. Внутрикадровое кодирование изображений
Рис. 10.9. Порядок фильтрации краев блоков яркости 16 × 16 (а) и цветности 8 × 8 (б); примеры примыкания пикселов к вертикальным (г) и горизонтальным (д) границам
Таблица 10.2. Правила выбора типа границ блоков
Описание типа границ |
Величина bS |
|
При кодировании блоков P и/или Q границей является граница |
4 |
|
между блоками яркости 16 × 16 или блоками цветности 8 × 8 |
||
|
||
При кодировании блоков P и/или Q границей не является |
|
|
граница между блоками яркости 16 × 16 или блоками цветности |
3 |
|
8 × 8 |
|
|
Ни блок P, ни блок Q не кодируются непосредственно, но |
2 |
|
используются кодированные коэффициенты |
||
|
||
Ни блок P, ни блок Q не кодируются, но имеют различные |
1 |
|
ссылки |
||
|
||
Во всех прочих случаях |
0 |
p 0 = min { max(0, p0 + Δ), 2BY − 1}, |
|
q 0 = min { max(0, q0 + Δ), 2BY − 1}, |
|
либо |
(10.58) |
p 0 = min { max(0, p0 + Δ), 2BC − 1}, |
|
q 0 = min { max(0, q0 + Δ), 2BC − 1}, |
|
|
|
|
|
|
|
|
|
10.3. Уменьшение влияния блокинг-эффекта |
|
|||||||||||||
Таблица 10.3. Зависимости α , β |
от величин DA, DB |
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
DA для α ; DB для β |
|
|
|
|
|
|
|
|
|||||||
|
1,. . . ,15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
|
23 |
24 |
25 |
26 |
|
27 |
28 |
29 |
30 |
31 |
32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
α |
0 |
4 |
4 |
5 |
6 |
7 |
8 |
9 |
|
10 |
12 |
13 |
15 |
|
17 |
20 |
22 |
25 |
28 |
32 |
|
|
β |
0 |
2 |
2 |
2 |
3 |
3 |
3 |
3 |
4 |
4 |
4 |
6 |
|
6 |
7 |
7 |
8 |
8 |
9 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
DA для α ; DB для β |
|
|
|
|
|
|
|
|||||||
|
33 |
34 |
35 |
36 |
37 |
38 |
39 |
40 |
|
41 |
42 |
43 |
44 |
|
45 |
46 |
47 |
48 |
49 |
50 |
51 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
α |
36 |
40 |
45 |
50 |
56 |
63 |
71 |
80 |
|
90 |
101 |
113 |
127 |
|
144 |
162 |
182 |
203 |
226 |
255 |
255 |
|
β |
9 |
10 |
10 |
11 |
11 |
12 |
12 |
13 |
|
13 |
14 |
14 |
15 |
|
15 |
16 |
16 |
17 |
17 |
18 |
18 |
|
где = min { max(−tC , [(4(q0−p0)+(p1−q1)+4)/8]), tC }, а порог tC определяется
по формулам при обработке сигнала яркости |
|
иначе| |
− |
| |
|
|
|||||
tC = tC0 + |
0, |
иначе| |
− |
| |
+ |
0, |
, |
||||
|
1, |
при p2 |
|
p0 < β |
|
1, |
при q2 |
|
q0 |
< β |
|
tC0 = tC0 · 2(BY −8), при обработке сигнала цветности tC = tC0 + 1 и tC0 = tC0 ×
× 2(BC−8).
Переменная tC0 определена в табл. 10.4 в зависимости от значений DA и bS. Результирующие значения фильтрации пиксела p’1 определяются следующим образом: при обработке сигнала яркости и при
|p2 − p0| < β − p 1 = p1 + min { max(−tC0, [(p2 + (p0 + q0 + 1)/2 − −2 · p1)/2]), tC0},
(10.59) при обработке сигнала цветности или при |p2 − p0| β − p 1 = p1. Результирующие значения фильтрации пиксела q’1 определяются следующим образом: при обработке сигнала яркости и при
|q2 − q0| < β − q 1 = q1 + min { max(−tC0, [(q2 + (p0 + q0 + 1)/2 − −2 · q1)/2]), tC0},
(10.60)
при обработке сигнала цветности или при |q2 − q0| β − q 1 = q1. Результирующие значения фильтрации пикселов p 2 и q 2 всегда устанавли-
вают равными значениям входных пикселов:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
p 2 = p2; |
|
q 2 = q2. |
|
|
|
|
|
(10.61) |
|||||
|
Таблица 10.4. Значения tC |
0 в зависимости от DA и bS |
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
DA |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
0. . . 16 |
17. . . 20 |
21,22 |
23. . . 26 |
27. . . 30 |
|
31,32 |
33 |
34 |
35,36 |
37 |
38,39 |
40 |
41 |
42 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
bS = 1 |
0 |
|
0 |
|
|
0 |
1 |
|
1 |
|
1 |
2 |
2 |
2 |
3 |
3 |
4 |
4 |
4 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
bS = 2 |
0 |
|
0 |
|
|
1 |
1 |
|
1 |
|
2 |
2 |
2 |
3 |
3 |
4 |
5 |
5 |
6 |
|
||||||
|
bS = 3 |
0 |
|
1 |
|
|
1 |
1 |
|
2 |
|
3 |
3 |
4 |
4 |
5 |
6 |
7 |
8 |
9 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
DA |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
42434445464748495051 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
bS = 1 |
4 |
5 |
6 6 |
7 |
8 |
|
9 |
101113 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
bS = 2 |
6 |
7 |
8 8 |
|
|
101112131517 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
bS = 3 |
9 |
|
|
101113141618202325 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Глава 10. Внутрикадровое кодирование изображений
Процесс фильтрации краев при bS = 4
При этом производится фильтрации значений примыкающих друг к другу пикселов pi и qi (i = 0 . . . 3). Результирующие значения фильтрации пикселов p i (i = 0 . . . 2) находят следующим образом: при обработке сигнала яркости, если выполняются условия |p2 − p0| < β и |p0 − q0| < (α/4 + 2), то
p 0 = (p2 + 2 |
· |
p1 + 2 |
· |
p0 + 2 |
· |
q0 + q1 + 4)/8, |
|
||||
p 1 = (p2 |
|
|
|
|
|
|
|
||||
+ p1 |
+ p0 + q0 + 2)/4, |
(10.62) |
|||||||||
p 2 = (2 |
· |
p3 + 3 |
· |
p2 + p1 + p0 + q0 + 4)/8; |
|
||||||
|
|
|
|
|
|
|
|
|
|
при обработке сигнала цветности и если не выполняются условия, указанные
в (10.61), то |
|
|
p 0 = (2 |
· |
p1 + p0 + q1 + 2)/4, |
|
|
|
p 1 = p1, |
(10.63) |
|
p 2 = p2. |
|
Результирующие значения фильтрации пикселов q i (i = 0 . . . 2) находят следующим образом:
при обработке сигнала яркости, если выполняются условия |q2 − q0| < β и
|p0 − q0| < (α/4 + 2), то
q 0 = (p1 + 2 |
· |
p0 + 2 |
· |
q0 + 2 |
· |
q1 + q2 + 4)/8, |
|
||||
q 1 = (p0 |
|
|
|
|
|
|
|
||||
+ q0 |
+ q1 + q2 + 2)/4, |
(10.64) |
|||||||||
q 2 = (2 |
· |
q3 + 3 |
· |
q2 + q1 + q0 + p0 + 4)/8. |
|
||||||
|
|
|
|
|
|
|
|
|
|
при обработке сигнала цветности и если не выполняются условия, указанные
в (10.63), то |
|
|
q 0 = (2 |
· |
q1 + q0 + p1 + 2)/4, |
|
|
|
q 1 = q1, |
(10.65) |
|
q 2 = q2. |
|
На рис. 10.10 приведены примеры результатов фильтрации изображения при различных параметрах коэффициента квантования (изображения взяты из книги [4.17]).
Важной проблемой при кратномасштабной обработке изображений (их кодировании и сжатии) является выбор вейвлет-базиса. В общем случае это — сложная задача, не решенная до настоящего времени. Известен ряд критериев, определяющих качество того или иного вейвлет-базиса, среди которых наиболее важными являются гладкость, точность восстановления изображения, частотная избирательность фильтров. Одним из возможных подходов к решению этой проблемы является оценка изменений распределения энергии по высокочастотным компонентам в зависимости от выбранного для обработки вейвлет-базиса [4.19].
Как уже отмечалось в главе 9, наиболее часто используется последовательное разложение изображения по столбцам и строкам. Такой вид обработки соответствует использованию разделимых двумерных фильтров, импульсная характеристика которых есть тензорное произведение импульсных характеристик соответствующих одномерных фильтров. При использовании двухполосных вейвлетфильтров частотная плоскость изображения разбивается на четыре области.
В этом случае используется последовательное применение преобразования сначала к строкам, а затем к столбцам изображения. При этом сначала формируются 2 области (левая — низкочастотная и правая — высокочастотная), а затем каждая из них разбивается еще на две области (рис. 11.1). Одна из этих областей НН — низкочастотная (в левом верхнем углу) и три высокочастотных области: НВ (в нижнем левом углу), ВН (в верхнем правом углу), ВВ (в нижнем правом углу).
Рис. 11.1. Структурные схемы вейвлет-разложения изображения на четыре области и шесть областей
Если необходимо, данная процедура может быть снова применена к НН-ком- поненте изображения, в результате чего вместо нее будет сформировано еще 4 частотных компоненты. Для оценки изменений распределения энергии по высокочастотным компонентам в этом нет необходимости. В данном случае рационально дополнительное преобразование, примененное к НВ- и ВН-компонентам изображения. В результате чего все изображение разделяется на 6 частотных областей [4.20–4.22]: одну низкочастотную и пять высокочастотных, как показано на рис. 11.1.
11.1. Оценка энергетических характеристик изображения
-
Оценка энергетических характеристик различных областей вейвлет-разложения изображения производилась путем исследования зависимостей средней величины яркости пиксела в той или иной области изображения от выбранного базиса, при
этом среднее значение яркости в каждой области оценивалась соотношением:
-
(Nk−1)×(Mk−1)
|
|
Y 2 |
|
|
|
i =0 |
ik |
|
|
Y¯k = |
k! |
|
, |
(11.1) |
Nk × Mk |
|
|||
|
|
|
|
где Nk × Mk — размер k-ой выделенной области изображения.
Для устранения зависимости энергетической характеристики от конкретного изображения и его размера использовалась относительная величина (относительно суммарной яркости всех компонент), например для компоненты НВН она определялась следующим образом:
|
|
|
¯ |
|
|
|
|
|
¯ |
|
|
YHBH |
|
|
|
(11.2) |
|
IHBH = |
¯ |
¯ |
¯ |
¯ |
¯ |
¯ |
. |
|
|
YHH + YHBH + YHBB |
+ YBHH + YBHB + YBB |
|
Для исследования энергетических характеристик преобразования от типа вей- влет-базиса было использовано 7 тестовых изображений (рис. 11.2), их названия и основные параметры приведены в табл. 11.1.
«Barbara»
Рис. 11.2. Тестовые изображения: а — «Лена», б — «Барбара», в — «Золотой холм», г — «Залив», д, е, ж — 206, 444, 1165 кадры из фильма «Матрица» соответственно
Каждое из этих изображений имеет свои отличительные особенности:
–изображение «Лена» — классическое тестовое изображение, обладающее плавными цветовыми переходами, наклонными границами;
–изображение «Барбара» — черно-белое изображение, множество полосок на
Глава 11. Обработка изображений при кратномасштабном анализе
скатерти, платке и брюках, здесь часто возникает муар и другие артефакты;
–изображение «Золотой холм» — черно-белое изображение, содержащее множество мелких деталей как на переднем, так и на заднем планах;
–изображение «Залив» — классическое тестовое изображение, содержащие большое количество вертикально ориентированных элементов.
Таблица 11.1. Типы тестовых изображений
Название изображения |
Исходный размер |
Разрешение |
|
|
|
|
|
«Лена» |
786 486 байтов |
512 × 512 |
|
«Барбара» |
786 486 байтов |
512 × 512 |
|
«Золотой холм» |
786 486 байтов |
512 × 512 |
|
«Залив» |
786 486 байтов |
512 × 512 |
|
Кадры из фильма «Матрица» |
0206 |
1 244 214 байтов |
720 × 576 |
0444 |
1 244 214 байтов |
720 × 576 |
|
|
1165 |
1 244 214 байтов |
720 × 576 |
Три последних изображения являются яркими примерами телевизионных изображений, спектр которых содержит небольшое число высокочастотных элементов:
–изображение 206-го кадра из фильма «Матрица» характеризуется плавными цветовыми переходами и невысокой контрастностью;
–изображение 444-го кадра из фильма «Матрица» имеет большое количество вертикально и горизонтально ориентированных деталей и также невысокую контрастность изображения;
–изображение 1165-го кадра из фильма «Матрица» характеризуется большим числом мелких прямолинейных элементов, произвольно ориентированных в пространстве.
При оценке зависимостей относительных энергетических величин высокоча-
¯ |
¯ |
¯ |
¯ |
¯ |
стотных областей преобразованных изображений IHBH, |
IHBB, |
IBHH, |
IBHB, |
IBB |
использовались КИХ-фильтры нижних/верхних частот, обозначаемые количеством отсчетов цифровой решетки соответственно (см. главу 9): 2/2; 3/5; 4/8; 5/7; 6/6; 7/9; 8/8; 9/11; 10/10.
На рис. 11.3–11.9 приведены результаты этих исследований. В каждом из этих рисунков имеются два графика: на левом графике (а) кривые характеризуют изменения усредненных яркостей соответствующих областей разделенного изображения, а на правом графике (б) — распределение усредненных яркостей по высокочастотным компонентам после обратного вейвлет-преобразования до проведения операции суммирования отдельных компонент. По оси абсцисс на этих графиках приводятся длины используемых КИХ-фильтров нижних частот — от двух до десяти.
Оценивая результаты исследований, можно сделать ряд выводов:
– с ростом числа отчетов цифровой решетки низкочастотного и высокочастотного фильтров, т. е. с увеличением ширины полосы пропускания ФНЧ и уменьшением соответствующей полосы ФВЧ, наблюдается небольшое уменьшение энергии в высокочастотных компонентах только при переходе от фильтров с 2 или 3 отсчетами цифровой решетки к фильтрам, имеющим
11.2. Выбор маски квантования высокочастотных компонент
Рис. 11.3. Распределение энергии по высокочастотным компонентам изображения «Лена» после прямого преобразования — а и восстановления составляющей — б
большее количество таких отсчетов, дальнейшее уменьшение мало заметно или вообще отсутствует;
–по мере увеличения числа отсчетов цифровой решетки фильтров, очевидно, требуется увеличение времени на выполнение операции дискретного вейвлет-преобразования, поэтому в реальных системах сжатия изображений необходим компромисс между выбранным размером носителя вейвлетбазиса и скоростью обработки информации;
–из полученных результатов следует, что в различных высокочастотных компонентах содержатся разные части энергии изображения, и к этим компонентам возможно применять различные маски квантования.
-
Разбиение изображения на одну низкочастотную область и большое количество высокочастотных областей позволяет сконцентрировать основную энергию в НН-об- ласти и обеспечивает возможность квантования высокочастотных компонент со значительно меньшим количеством уровней.
После вейвлет-преобразования в каждой из высокочастотных областей изображения содержится различное количество энергии. Поэтому к каждой из этих областей изображения возможно применение своей маски квантования, незначительно ухудшающей качество изображения.
Соответственно для описания случайной величины — яркости пикселов в каждой из высокочастотных компонент вейвлет-преобразования — можно использовать одномерную плотность распределения вероятностей, с достаточной степе-
Глава 11. Обработка изображений при кратномасштабном анализе
Рис. 11.4. Распределение энергии по высокочастотным компонентам изображения «Барбара» после прямого преобразования — а и восстановления составляющей — б
Рис. 11.5. Распределение энергии по высокочастотным компонентам изображения «Золотой холм» после прямого преобразования — а и восстановления составляющей — б
нью точности подчиняющейся закону Лапласа: |
|
|||
w(x) = |
λ |
e−λ|x|. |
(11.3) |
|
2 |
||||
|
|
|
Величину λ можно найти, зная среднеквадратичное отклонение (СКО) или усредненное значение модулей дискретных значений (Mod) данного распределения, т. к. по определению для непрерывного случайного процесса с нулевым математическим ожиданием:
11.2. Выбор маски квантования высокочастотных компонент
Рис. 11.6. Распределение энергии по высокочастотным компонентам изображения «Залив» после прямого преобразования — а и восстановления составляющей — б
Рис. 11.7. Распределение энергии по высокочастотным компонентам изображения 206-го кадра из фильма «Матрица» после прямого преобразования — а и восстановления составляющей — б
|
& |
|
|
|
|
|
N −1 M−1 |
nm |
|
1 |
nm |
1 |
|
||||||
|
' |
× |
|
|
|
× |
|
|
|
СКО = |
( |
|
Y 2 , |
Mod = |
|
Y |
|
, (11.4) |
|
|
'M N n=0 m=0 |
|
M N n=0 m=0 | |
|
| |
где Ynm и M ×N — соответственно значения и количество отсчетов в исследуемой области изображения.