Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

(по цифровому вещанию) Dvorkovich_V_Cifrovye_videoinformacionnye_sistemy

.pdf
Скачиваний:
249
Добавлен:
15.03.2016
Размер:
23.26 Mб
Скачать

Глава 2. Системы формирования и передачи видеоинформации

Рис. 2.11. Шкалы сигнала яркости и цветоразностных сигналов при компонентном кодировании

вательно, в случае 8-разрядного кодирования сигнала яркости и двух цветоразностных сигналов общая скорость цифрового потока составит:

I0 = 8 · 30 · [640 · 480 + 2 · 320 · 240] = 110,592 Мбит/с.

Телевидение высокой четкости, рассматривавшееся в первых вариантах реализации как новая аналоговая система, в настоящее время развивается только в цифровом виде.

Телевидение повышенной четкости имеет иной формат кадра, определяемый соотношением 16 : 9 его ширины к высоте, примерно в два раза большее пространственное разрешение (1280×720) по сравнению со стандартным ТВ и может иметь в два раза большее временное разрешение (50, 60 кадров/с) при использовании прогрессивной развертки. Цветоразностные сигналы имеют в два раза меньшее разрешение по горизонтали по отношению к сигналу яркости и такое же или в два раза меньшее разрешение по вертикали (так называемые модели цветности 4 : 2 : 2 и 4 : 2 : 0) [1.2, 1.51–1.55]. При этом скорости формируемого цифрового потока для систем ТВ повышенной четкости лежат в диапазоне 264–844 Мбит/с.

Телевидение высокой четкости имеет еще более высокое пространственное разрешение (1920×1080) [1.2, 1.51–1.55]. При воспроизведении на большом экране повышается заметность мельканий и погрешностей цветности, поэтому в системах ТВЧ, как правило, рекомендуется использовать прогрессивную развертку

2.4. Видеотелефония и видеоконференцсвязь, домашнее видео

с частотой кадров 50 или 60 Гц и модель яркость/цветность 4 : 2 : 2, при которой на каждый пиксел приходится 16 битов информации (точнее, 32 бита на 2 пиксела — 2 восьмибитных значения яркости и по одному восьмибитному значению каждого из цветоразностных сигналов). Результирующий цифровой поток видеоданных, таким образом может составить до 2 Гбит/с.

Еще большие значения скорости цифрового потока получаются для перспективных систем ТВ сверхвысокой четкости и «цифрового кино» [1.52]. Здесь предполагается использовать пространственные разрешения от 1920 × 1080 (уровень Н0) до 7680 × 4320 (уровень Н3). Для представления отсчетов яркости и цветности предполагается использовать 10 (Н0, Н1) или 12 (Н2, Н3) битов. Скорость цифрового потока, таким образом, составит от 2,3 (Н0) до 66,7 (Н3) Гбит/с.

Наряду с улучшением и созданием новых систем сжатия традиционных видеосигналов, снимаемых с одной точки наблюдения, бурно развивается как стереоскопическое телевидение (бинокулярное), так и автостереоскопическое (с несколькими точками наблюдения, обычно до 9–16 видов). Кроме того, создано и развивается такое направление, как телевизионные системы с произвольной точкой наблюдения (ТСПТН) [1.54].

Мультивидовое видео, записанное синхронизированными фотоили видеокамерами с различных точек наблюдения, дает обширную 3D-информацию о сцене и расширяет зрительские впечатления по сравнению с традиционным видео. 3D-телеви- дение обеспечивает трехмерное ощущение глубины наблюдаемого вида, а ТСПТН дает возможность интерактивного выбора точки наблюдения и направления в пределах определенного рабочего диапазона углов обзора. Реализация 3D-прило- жений зависит от полного цикла обработки, включая захват, сжатие, передачу, отображение и интерактивное представление. Кодирование нескольких видов динамических изображений является одной из наиболее многообещающих технологий, поскольку огромный объем данных, пропорциональный числу камер, должен быть сжат до такой степени, чтобы его можно было передавать в пределах возможностей сетей связи.

Всистемах видеотелефонии и видеоконференцсвязи предъявляются пониженные (по сравнению с обычным ТВ) требования как к четкости изображения (пространственному разрешению), так и к его динамичности (временному разрешению).

Ввидеотелефонии обычно используются разрешения до 176×144 пиксела при скорости смены кадров до 5 кадров/с. Соответственно, скорость результирующего цифрового потока сравнительно невелика — до 1,5 Мбит/с.

Ввидеоконференцсвязи может использоваться большая четкость изображения — до четверти телевизионного при кадровой скорости до 25–30 кадров/с, скорость цифрового потока доходит до 35 Мбит/с.

Всистемах домашнего видео и видео по запросу используется телевизионное временное разрешение (25–30 кадров/с), но снижены требования к простран-

Глава 2. Системы формирования и передачи видеоинформации

ственному разрешению, поэтому скорость цифрового потока в этих системах примерно в 4 раза ниже, чем в ТВ-системах.

Цифровое представление видеосигнала требует больших объемов памяти для хранения и высоких пропускных способностей каналов связи (см. табл. 2.10). Использование каналов связи для передачи цифровых видеосигналов без специальной обработки было бы малоэффективным, так как цифровое представление видеоинформации обладает, как правило, существенной избыточностью.

Для снижения потока видеоданных в различных системах передачи информации чаще всего используются стандартизованные методы, позволяющие производить совместимое оборудование множеству компаний, работающих в этой области. Наибольшее распространение получили стандарты семейства MPEG [1.56– 1.60], использующие общую схему видеокомпрессии.

Втабл. 2.10 приведены параметры исходных видеосигналов для различных приложений, обеспечивающих передачу движущихся изображений, а в табл. 2.11 — параметры исходных сигналов для некоторых видеоинформационных систем со многими точками наблюдения.

Вряде случаев такие изображения статические и двухуровневые. Так как изображение обычно состоит из текста и рисунков, требуется более высокое пространственное разрешение по сравнению со стандартным телевидением.

Вбольшинстве случаев такие изображения можно представить в виде сочетания мозаичных или геометрических элементов, которые хранятся в памяти приемного устройства.

Имеются стандарты МККТТ по передаче графических изображений. Факсимильные системы обеспечивают передачу сигналов по телефонным аналоговым или цифровым каналам (общего пользования или выделенным). Цифровая передача обычно ведется со скоростями 1200, 2400, 4800 или 9600 бит/с. В новейших системах скорости достигают 56 Кбит/с при помехоустойчивом кодировании.

Интерактивные системы передачи изображений — это так называемые системы Телетекст и Видеотекс [1.61, 1.62]. Первая из них предполагает передачу информации в интервалах строк гасящих импульсов полей ТВ-сигнала, вторая использует телефонные линии общего пользования. Обе имеют один стандарт, определяющий набор используемых символов:

литеры и мозаичные элементы;

прямые;

точки;

дуги;

многоугольники и т. д.

Они объединены в кодовые таблицы, составляющие иерархическую структуру.

2.5. Графические изображения, факсимильные системы

Таблица 2.10. Параметры видео для различных приложений

Приложения

Размер кадра

Модель цветности, количество битов на пиксел

Формат экрана

Частота кадров, кадров/с, развертка

Скорость цифрового потока, Мбит/с

Видеотелефония

subQCIF,

4 : 2 : 0, 12

4 : 3

1–5

0,141–1,45

QSIF, QCIF

прогрессивная

 

 

 

 

 

 

 

 

Видеоконференц-

QSIF,

 

 

5–30

 

QCIF,

4 : 2 : 0, 12

4 : 3

1,10–34,8

связь

 

прогрессивная

 

 

 

SIF, CIF

 

 

 

 

 

 

 

 

 

 

 

Домашнее видео,

SIF

 

 

30

26,4

видео по

4 : 2 : 0, 12

4 : 3

прогрессивная

 

 

требованию

 

 

 

 

 

 

 

 

CIF

 

 

25

29,0

 

 

 

 

 

прогрессивная

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Стандартное ТВ

640 × 480

4:2:0, 12 4:2:2, 16

4:3

30

105–141

(NTSC)

чересстрочная

 

 

 

 

 

 

 

 

 

 

 

 

720 × 576

 

 

25

119–158

 

 

 

(PAL, SECAM)

 

 

чересстрочная

 

 

 

 

 

 

 

 

ТВ-повышенной

1280 × 720

4 : 2 : 0, 12

16 : 9

25, 30, 50, 60

264–844

четкости

4 : 2 : 2, 16

прогрессивная

 

 

 

 

 

 

 

 

 

 

 

1920 × 1080

 

 

25, 30

791–949

ТВЧ

 

4:2:2, 16

16:9

чересстрочная

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25, 30, 50, 60

791–1900

 

 

 

 

 

 

прогрессивная

 

 

 

 

 

 

 

 

 

 

H0

1920 × 1080

4:2:2, 20

 

 

2370

Цифровое

H1

3840 × 2160

16 : 9

60

9490

 

кино

 

H2

5760 × 3240

4 : 4 : 4, 36

 

прогрессивная

38400

 

 

 

 

 

 

H3

7680 × 4320

 

 

68300

 

 

 

 

 

Глава 2. Системы формирования и передачи видеоинформации

Таблица 2.11. Параметры видео для некоторых информационных систем со многими точками наблюдения

Многомерные

 

Модель цветности

Число кадров

Скорость

Формат и размер

и количество би-

цифрового

телевизионные

в секунду, тип

кадра

тов на

 

потока,

системы

развертки

 

 

пиксел

 

Гбит/с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Трехмерное ТВ —

1920 : 1080;

4 : 2 : 0;

50, 60;

 

 

 

(2 × 960) : 1800;

0,8–0,95

2

×

1080i

12

чересстрочная

 

 

16 : 9

 

 

 

 

 

 

 

 

 

 

 

 

Трехмерное ТВ —

 

 

 

 

 

 

Blu–Ray;

1920 : 1080;

4 : 2 : 2;

24;

 

 

1,58

3D(кино);

16 : 9

32

прогрессивная

 

 

 

 

 

2 × 1080p

 

 

 

 

 

 

 

 

 

 

 

 

 

Трехмерное ТВ —

1920 : 1080;

4 : 2 : 0;

50, 60;

 

3,2–3,6

HD-3D; 2 × 1080p

16 : 9

24

прогрессивная

 

 

 

 

Трехмерное ТВ —

 

 

 

n × 1,5

MultiView 3D-TV,

1920 : 1080;

4 : 2 : 0;

50, 60;

несколько видов;

16 : 9

12

прогрессивная

100–1000

n × 1080p

 

 

 

 

 

 

Трехмерное ТВ —

 

 

 

 

 

 

Free Viewpoint

 

 

 

n × 1,5

TV (FTV) —

1920 : 1080;

4 : 4 : 4;

50, 60;

произвольное к-во

16 : 9

24

прогрессивная

100–1000

 

видов;

 

 

 

 

 

 

n × 1080p

 

 

 

 

 

 

Трехмерное ТВ —

 

 

 

 

 

 

3D-Integral

 

 

 

 

 

 

Imaging, на

 

 

60;

n

2

× 1,5

 

основе

7680 : 4320

4 : 4 : 4

 

интегральной

 

 

прогрессивная

 

15 000

 

 

 

 

 

 

фотографии;

 

 

 

 

 

 

n2 × 4320p

 

 

 

 

 

 

Голографические

4320 : 8192

 

60;

40 × 1,5

системы ТВ

 

прогрессивная

 

10 000–

 

 

1 000 000

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Телевизионное и компьютерное изображение в его цифровом представлении является набором значений интенсивностей светового потока, распределенных на конечной площади, имеющей обычно прямоугольную форму.

Для простоты рассмотрим монохромные изображения. Тогда интенсивность излучаемой световой энергии с единицы поверхности в точке с координатами (x, y) изображения можно представить неким числом B(x, y), характеризующим яркость пиксела с координатами (x, y).

Задача состоит в удобном для цифровой обработки представлении B(x, y) конечным количеством двоичных цифр (битов).

Если даже B(x, y) изменяется во времени, предполагается, что объем информации в единицу времени, требуемый для представления B(x, y), конечен, т. е. конечна скорость ее передачи.

Таким образом, поскольку движение непрерывно, а скорость передачи конечна, то имеет место дискретное представление непрерывного процесса, и часть визуальной информации безвозвратно теряется.

Однако если даже значения B(x, y) могут быть получены с большой точностью (например, для не меняющегося во времени B(x, y) или для меняющегося во времени B(x, y) при очень высокой скорости передачи информации), то, как будет показано ниже, далеко не всегда необходимо сохранять всю информацию.

Плотность размещения пикселов связана с пространственным разрешением, которое в телевидении обычно определяется количеством различимых линий на единицу длины. На рис. 3.1 в качестве примера приведено изображение вертикальных и горизонтальных черно-белых линий, изменяющихся по ширине скачками от минимальной величины. Очевидно: если плотность черно-белых линий достигает некоторой критической величины, то зрительное их восприятие нарушается — визуально они воспринимаются в виде непрерывного серого поля.

Обычно значение уровня сигнала в каждом из пикселов определяют путем взвешенного усреднения B(x, y) в малой окрестности δ [1.37, 1.63]:

 

y+δ x+δ

 

Bˆ(x, y) =

B(w, z) · HC (x − w, y − z) dwdz,

(3.1)

y−δ x−δ

где HC (u, v) — взвешивающая функция или импульсный отклик фильтра.

Глава 3. Цифровое представление видеоинформации

Рис. 3.1. Изображение вертикальных и горизонтальных черно-белых полоc

Этот процесс называется префильтрацией, т. к. изображение фильтруется до дискретизации. Часто в качестве взвешивающей функции используют функцию Гаусса:

HC (u, v) = K · exp(−au2 − bv2),

(3.2)

где |u|, |v| < δ; K, a, b — константы.

Два варианта откликов для разных значений констант a и b приведены на псевдотрехмерной диаграмме рис. 3.2.

Рис. 3.2. Варианты импульсных откликов префильтра Гаусса

При восстановлении изображения (т. е. воспроизведении точек между дискретными пикселами) используют различные методы интерполяции:

3.1. Графические изображения, факсимильные системы

 

Bˆ(x, y) = Bˆ(xk , yk) · Hd(x − xk , y − yk),

(3.3)

k

 

где Hd(u, v) — интерполяционная функция [1.37, 1.63]. Обычно используют билинейную функцию:

Hd(u, v) = S(u, x) · S(v, y),

(3.4)

где x и y — горизонтальные и вертикальные расстояния между пикселами.

Для прямоугольных массивов пикселов используют линейную интерполяцию:

S(z, Δ) = 1 −

 

z

 

,

 

z

 

1.

(3.5)

 

 

 

 

 

 

 

 

 

 

Часто применяются более гладкие интерполяции.

 

 

 

 

 

 

 

 

 

 

 

 

 

Квадратичная интерполяция:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S(z, Δ) =

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ,

 

 

 

 

 

 

 

 

 

 

 

9

3

z

 

 

+

 

 

1

z

 

1

 

<

 

z

 

 

3 .

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

2

z

 

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

1

;

 

 

2

 

 

3

2 ,

 

 

 

 

 

 

 

 

 

 

 

 

z

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

Кубическая интерполяция (непрерывная

первая

 

производная):

S(z, Δ) = 2 4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

 

 

 

+

5

z

 

 

2

 

 

1

z

3

, 1 <

z

 

2.

 

 

 

 

 

 

 

 

 

 

 

 

1

5

 

z

 

2

+

3

 

 

z

 

3 ,

 

 

 

 

 

 

 

 

 

z

 

1;

2

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3.6)

(3.7)

Интерполяция кубическим B-сплайном (непрерывные первая и вторая производные):

S(z, Δ) =

2

 

z

2 +

1

 

z

3 ,

 

 

 

 

 

z

1;

 

 

 

 

 

 

 

 

 

 

 

 

3

2

 

 

 

+

2

 

 

2

 

 

 

z 3 ,

1 < z

 

2.

(3.8)

4

 

z

 

 

z

 

 

1

 

 

 

3

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Псевдотрехмерное представление интерполяционных многочленов приведено на рис. 3.3. Этот процесс интерполяции называется постфильтрацией. Целиком цепочка цифровой обработки изображений выглядит так, как показано на рис. 3.4.

При этом перед цифровой обработкой изображения осуществляется его префильтрация, затем следуют дискретизация, квантование и кодирование пикселов. При восстановлении изображения после декодирования пикселов производится постфильтрация.

Наиболее часто встречающаяся форма пространственной дискретизации — сканирование растра, преобразующее двумерное изображение в одномерную временную функцию. В частности, в телевидении используется чересстрочная развертка. Из функции B(x, y) при этом создается одномерная функция [1.37, 1.47]

B(t) = B[t(x, y)], которая подвергается префильтрации:

ˆ

(3.9)

B(t) = B(τ ) · hC (t − τ )dτ ,

ˆ

где hC (τ ) — импульсная характеристика префильтра. Затем B(t) дискретизи-

руется так, чтобы в строке умещалось целое количество точек ˆ k

B(t ) (k =

= 1 . . . NS ), а в кадре — целое количество строк. Полученный продискретизированный сигнал

NS

 

 

 

ˆ

(3.10)

BS (t) = B(t) · δ(t − tk)

k=1

Глава 3. Цифровое представление видеоинформации

Рис. 3.3. Псевдотрехмерное представление интерполяционных многочленов, используемых при восстановлении изображений

Рис. 3.4. Последовательность операций цифровой обработки изображений

квантуется и превращается в цифровой код. Здесь δ(τ ) — дельта-функция. После декодирования и временной постфильтрации производится восстанов-

ление непрерывного сигнала и растра:

˜

 

˜

 

B(t) =

BS (τ ) · hd(t − τ )dτ = B(xt, yt) или

 

B˜(x, y) =

 

B˜(t) · hd(x − xt, y − yt)dt.

(3.11)

3.2. Фурье-преобразование, теорема о дискретизации

-

Пространственная дискретизация и квантование уровней пикселов изображения — не единственный метод представления визуальной информации конечным количеством данных.

Если исходное изображение B(x, y) преобразуется в некоторую другую форму до дискретизации и квантования, то иногда можно получить более удобное представление и кодирование информации.

Одним из таких представлений является Фурье-преобразование [1.64–1.69],

при котором прямоугольное изображение B(x, y)

в координатах 0

x X;

0 y Y , с помощью комплексных функций

+

Y )

(3.12)

Φmn(x, y) = XY

· exp 2πi ( X

1

 

nx

my

 

может однозначно быть записано в виде ряда:

 

 

 

 

 

 

 

 

 

 

 

B(x, y) =

cmn · Φmn(x, y),

(3.13)

m=−∞ n=−∞

где

Y X

cmn = B(x, y) · Φmn(x, y) dx dy,

00

Φmn(x, y) комплексно сопряжена с Φmn(x, y), а базисные функции Φmn(x, y) — ортогональны, поскольку

Y X

Φmn(x, y) · Φkl (x, y) dx dy = δmk · δnl.

(3.14)

00

Как известно, преобразование Фурье, примененное к одномерной функции y = F (x), позволяет получить разложение этой функции на частотные компоненты так, что каждая точка кривой F (x) может быть представлена суммой синусоид и косинусоид различных частот, взятых каждая со своим коэффициентом [1.69, 1.70]. Аналогично, представление B(x, y) в сочетаниях экспоненциальных базисных Фурьеизображений есть разложение изображений на компоненты пространственных частот:

fx = Xn периодов на единицу длины по оси x и

fy = mY периодов на единицу длины по оси y.

Комплексные коэффициенты cmn характеризуют интенсивность и фазу этих пространственных частот относительно выбранной системы координат.

Общая пространственная частота двумерного периодического изображения

определяется соотношением:

f s = f x2 + f y2 .

Компоненты высших пространственных частот определяют быстрые изменения интенсивности в изображении, характеризующие мелкие детали, резкие переходы