Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Л9,10,11 / Л11_DVD

.pdf
Скачиваний:
11
Добавлен:
10.02.2015
Размер:
824.33 Кб
Скачать

Таким образом, для обеспечения высокой стабильности и надежности системы оптической записи-воспроизведения числовую апертуру целесообразно уменьшать, тогда как для повышения разрешающей способности – увеличивать. Её компромиссное значение в лазерных головках плейеров DVD выбрано равным 0,6.

Информационная емкость – важнейшая характеристика систем дисковой памяти. Она представляет собой максимальное количество байт, которое может быть накоплено на диске. Информационная емкость определяется разрешающей способностью системы записи-воспроизведения, минимальным размером питов, который зависит от диаметра фокального пятна лазера, свойств носителя, технологии получения диска и ряда других факторов.

Зная информационную емкость диска и общую длину спиральной дорожки записи, т.е. зная сколько бит может быть записано на этой дорожке, нетрудно найти протяженность воображаемой элементарной ячейки памяти, занимаемую одним битом, и, соответственно, минимальный размер питов на диске. Информационная емкость простейшего диска DVD равна 4,7 ГБ или приблизительно 40 Гбит. Витки спиральной дорожки записи расположены на диске DVD с шагом t = 0,74 мкм, а общую длинуl спиральной дорожки можно найти по простой формуле l = π/t(R2-r2), где R и r – радиусы внешней и внутренней границ зоны записи. Принимая R = 5,8 см и r = 2,3см, получим

I 12000 м, т.е. длинудорожки12 км! Тогдапротяженность элементарной ячейки

памяти, или минимальная длина пита, на DVD определится из соотношения l/40 Гбит = 0,3 мкм/бит. При расчете предполагалось, что биты – нули или единицы – занимают одинаковые по протяженности ячейки памяти. В действительности бит, соответствующий минимальному питу, занимает ячейку несколько большей протяженности, чем бит, соответствующий минимальному промежутку между питами. Практически реализуемая минимальная длина питов на DVD 0,4 мкм.

5.Обработка видео и звуковых сигналов

5.1.Полоса частот и цифровой поток записи видеосигналов

Полосу частот, требуемую для передачи при линейной импульсно-кодовой модуляции (ИКМ), нетрудно определить. Количество отсчетов в секунду задается частотой дискретизации fд, а каждый отсчет передается n битами, т.е. в интервале времени от одного отсчета до другого надо передать n бит, а всего в секунду fд × n бит. Это значение называют скоростью передачи данных, пото-

ком информации или пропускной способностью канала передачи сообщений. Полоса частот, требуемая для заданной пропускной способности, зависит от особенностей канала. Для каналов оптической и магнитной записи требуе-

мая полоса частот в Гц численно равна пропускной способности в бит/с. Рассмотрим в качестве примера поток информации, записываемый в

режиме линейной ИКМ магнитофонами цифрового профессионального формата магнитной видеозаписи D1. В этом формате сигнал яркости Y и оба цветоразностных сигнала R-Y и В-Y имеют одинаковые полосы частот 3,375 МГц. Частота дискретизации сигнала яркости в 4 раза больше верхней частоты этого сигнала и равна 4×3,375 = 13,5 МГц. Частоты дискретизации цветоразностных сигналов в 2 раза больше их верхних частот и равны 2 × 3,375 = 6,75 МГц. Соот-

ношение частот дискретизации всех трех компонентов видеосигнала в данном случае выражается как 4:2:2. Поэтому рассматриваемый формат относят к так называемымкомпонентным форматам 4:2:2.

Записываемый поток видео в формате 4:2:2 при 8-битном квантовании равен (13,5 + 2 × 6,75) × 8 бит = 216 Мб/с. К этому потоку следует добавить по-

ток звука 3,07 Мбит/с. Но и так получается слишком большой поток данных, который трудно как передавать, так и записывать, поскольку требуются высокие скорости записи. А какой по длительности фильм можно записать с вещательным качеством на диске DVD, обладающем информационной емкостью 4,7 ГБ, если его записывать в форме линейного ИКМ-сигнала? Не будем говорить о каких-либо других сигналах, кроме сигналов изображения. Так как 4,7 ГБ

– это приблизительно 40000 Мбит, то длительность фильма при потоке ви-

деоданных 216 Мб/с получается равной 40000/216 = 185 с 3 мин. Результат

обескураживает. Ведь перед разработчиками дисков DVD стояла задача записи с вещательным качеством фильмов длительностью не менее 120 мин, т.е. в 40 разболеепродолжительных.

Но решение задачи оказалось возможным. Перед тем как к нему перейти, рассмотрим, какие по величине потоки видео и других данных можно реально записывать на дисках DVD, чтобы обеспечить демонстрирование фильмов длительностью 120 мин. По-прежнему будем рассматривать диск DVD с информационной емкостью 4,7 ГБ. Стандартный DVD-плейер способен обрабатывать потоки цифровых данных величиной максимум 10,08 Мб/с. При этом максимальный совместный поток цифровых данных видеосигнала, звукового сопровождения и субтитров составляет 9,8 Мб/с (эти максимальные значения потоков приняты в результате успешного решения вышеуказанной задачи, но мы их будем рассматривать просто как заданные предельные значения). Исходя из вышеприведенных величин нетрудно подсчитать, какие потоки видео- и других данных можно реально записать на диске DVD.

Информационная емкость диска емкостью 4,7 ГБ в битах составляет 4,7 × 10243 × 8 × 10-6 40373 Мб, причем 4% этой емкости резервируется для служеб-

ных целей (графическое меню, навигационная адресация и др.). Полезная емкость диска составляет 40373 × 0,96 38758 Мб. Поток данных, исполь-

зуемый для записи информации на DVD в течение 120 мин, не должен превышать 38758/(120×60) = 5,38 Мб/с. Часть этого потока идет на звуковое сопро-

вождение (0,768 Мб/с) и субтитры (0,16 Мб/с). Среднее значение цифрового потока видеосигнала DVD составляет 4,45 Мб/с.

5.2.О стандартах MPEG

Впоследние 15...20 лет разработаны эффективные способы компрессии цифровой видеоинформации, позволяющие во много раз сократить записываемый поток видеоданных без ущерба или с очень малым ущербом для качества изображения.

В 1988 г. при международной организации по стандартизации создана группа экспертов по движущимся изображениям – Moving Picture Expert Group (MPEG), которой поручена разработка стандартов на компрессию цифровых данных при передаче движущихся изображений, а также звука. Этой группой в 1992 г. выпущен стандарт MPEG-1 на компрессию данных при передаче движущихся изображений в компьютерных и мультимедийных системах с использованием дисков CD-ROM. Стандарт распространяется на системы со скоростью передачи данных до 1,5 Мбит/с, применяющие прогрессивную развертку изображения. Качество стандартизованного компрессированного изображения относительно невысокое.

Затем был разработан стандарт MPEG-2 на компрессию данных в телевизионных системах. Он распространяется на широкий круг таких систем от VHS до телевидения высокой четкости (ТВЧ). Охват всего этого круга осуществляется посредством использования специальных алгоритмов для «профилей» (profiles) и «уровней» (levels) разрешения изображения. Алгоритмом в данном случае называется порядок действий по упрощению, модификации и предсказанию данных в процессе их обработки. Вообще, MPEG-2, как и предыдущий стандарт MPEG-1, устанавливает не конкретные количественные параметры и нормы для той или иной стандартизуемой системы, а общие правила компрессии информации, основанные на использовании избыточности источника сигналов и на физиологических особенностях зрения и слуха. К таким особенностям относится, например, способность глаза различать мелкие детали неподвижного изображения и не замечать эти же детали в сценах с движением. Стандарт MPEG-2 касается систем, работающих при скоростях передачи данных от 1,5 до 15 Мбит/с и более, и содержит раздельные рекомендации по кодированию видео и аудиосигналов (MPEG-2-Audio). Примером одного из таких профилей и уровней является Main Profile @ Main Level (главный профиль на главном уровне). Он записывается как MP@ML и охватывает вещательное телевидение, включая форматы изображений, содержащих до 720 пикселей × 576 строк при 25 к/с (изображение по стандартам SECAM и PAL – 833

пикселя × 625 строк). Стандарт MPEG-2 распространяется и на диски DVD с

разрешением максимум 720 пикселей × 576 строк. Разрешение ТВЧ в дисках

DVD не реализуется.

Этим стандартом предусматривается возможность применения различных способов компрессии данных, подразделяемых на две разновидности – на способы компрессии, осуществляемые за счет перераспределения поступающих данных, в основном, без их сокращения, и на способы компрессии за счет исключения некоторых данных и элементов изображения, по возможности незаметного для зрения. Общее требование во всех этих способах компрессии состоит в передаче изображения и звука посредством возможно меньшего количества данных с возможно лучшим качеством.

5.3. Компрессия видеосигнала при записи дисков DVD

Как же записывается 2-часовой фильм, если при линейной ИКМ информационной емкости DVD хватает только на 3 мин? Вопрос можно сформулировать иначе: как при скорости передачи данных 4,45 Мб/с записать практически без потери качества ИКМ-поток изображения 216 Мб/с?

В системе DVD применяется в основном способ компрессии за счет перераспределения данных, затрагивающий одновременно группу кадров с учетом происходящих в них движений. Изображение от кадра к кадру в большинстве случаев изменяется мало. Поэтому полностью можно записывать только некоторые кадры (в среднем каждый 13-й), а для последующих кадров ограничиться передачей различий между ними и предыдущими кадрами.

Примером может быть картина на берегу моря: небо и песчаный берег выглядят неизменно, непрерывно движутся лишь волны. После опорного кадра в данном случае можно записывать только движение водной стихии. Плейер по командам с DVD преобразует эту информацию в полноценные 25 к/с (добавляя небо и берег к движению волн), поступающие на экран телевизора.

Таким образом, в результате сравнения текущих кадров с предыдущими выявляются их различия, и информация, повторяющаяся в те-

кущем кадре, при записи опускается. Она возвращается только в плейере, поступая из схемы промежуточной памяти. При этом достигается 40...50-кратная экономия информационной емкости DVD.

При компрессии по рассматриваемому способу видеосигнал разбивается на группы кадров GOP (Groupe of Picture), включающие кадры трех типов:

I-кадр, Intra-frame – начальный кадр группы, содержащий полную (некомпрессированную) информацию о всех деталях изображения;

Р-кадр, Predictive frame – вычисляемый кадр, содержащий только информацию об изменениях по сравнению с предыдущими I и Р-кадрами. Это наиболее скомпрессированный кадр, служащий для восстановления В-кадра;

В-кадр, Bi-directional frame – кадр, использующий для своего восстановления при воспроизведении информацию как предыдущего, так и последующего кадров.

Каждая группа GOP состоит из 15 кадров, и их последовательность имеет вид I-B-B-P-B-B-P-B-B-P-B-B-P-B-B-I. Среди них I-кадры – ключе-

вые, поскольку содержат полную информацию об изображении, начинают и завершают каждую группу. Кадры В и Р содержат данные только о тех пикселях изображения, которые претерпели изменение, т.е. кадры В и Р описывают изменения изображения между двумя I-кадрами данной группы. Динамичные фильмы кодируются более короткими группами GOP во избежание резкого снижения качества изображения. Кроме того, при каждом монтажном стыке добавляется I-кадр, если изображение на стыке полностью изменяется.

При возрастании сложности кадров из-за ограниченности потока информации качество изображения может ухудшаться. Сложными считаются кадры, представляющие такие явления, как буря, молнии; кадры, содержащие шумы, мелкие детали и быстрые изменения содержания. Применяются два способа решения проблем, вызываемых

усложнением кадров. Во-первых, возможно временное увеличение потока информации: большее число бит позволяет сохранить качество на должном уровне. Во-вторых, возможно снижение сложности отдельных кадров посредством дополнительной обработки. Способы кодирования с постоянной скоростью передачи данных, с переменной скоростью при усложнении кадров, а также со снижением сложности кадров дополнительной обработкой предусмотрены стандартом MPEG-2.

Если записываются кадры, богатые мелкими деталями и движущимися объектами, то скорость передачи высокая, если же кадры имеют мало мелких деталей или объекты съемки неподвижны, т.е. повторяются на своих местах от кадра к кадру, то скорость передачи низкая. Этим достигается экономия информационного пространства на носителе, за счет которой можно улучшить запись сложных кадров.

Обычно применяется кодирование как с постоянной, так и с переменной скоростью, причем величина постоянной скорости или среднее значение переменной скорости могут быть различными в зависимости от длительности фильма и других факторов. Чем короче фильм, тем больше может быть скорость передачи данных и тем лучше качество изображения. При длительности фильма свыше 120 мин в большинстве случаев применяется кодирование с переменной скоростью, что позволяет сохранить высокое качество записи и при этом уместить фильм на одной стороне диска.

Запись с переменной скоростью кодирования требует использования весьма сложных анализаторов сигналов и высокой точности анализа, от которого зависит качество изображения. Компьютер анализирует видеоданные каждого кадра и определяет оптимальную скорость передачи содержащейся в нём информации. Однако он не вникает в тонкости, обусловливающие зрительское восприятие. Например, кадры в целом могут быть бедны деталями, но содержащуюся в них информа-

цию целесообразно передавать с относительно высокой скоростью, чтобы очень четко передать какой-то небольшой, но важный для зрителей участок изображения. Поэтому в процессе обработки важную роль играет «человеческий фактор» – оператор, наблюдающий на мониторе обрабатываемые изображения, помогает процессу обработки. При подготовке материалов для записи оригинала DVD суперкомпьютеру может понадобиться больше часа на обработку одного кадра, и это допустимо, а сравнительно простая электроника плейера DVD декодирует и реконструирует эти данные в течение долей секунды.

6. Звуковой сигнал и его обработка в системе DVD. Технология DVD позволяет получить не только превосходное изо-

бражение, но и звук исключительно высокого качества. «Обволакивающий», прозрачный до тончайших оттенков цифровой 5.1-канальный звук с очень широким динамическим и частотным диапазоном в сочетании с изображением производит весьма сильное впечатление. Но это далеко не всё. Существует возможность записи звукового сопровождения на разных языках в различных форматах, или системах звукопередачи. Максимально на DVD может быть записано до восьми независимых цифровых потоков звукового сопровождения. Они могут содержать либо разноязычные версии в одном и том же формате, либо передавать звук на одном языке в любом из известных цифровых форматов как с компрессией, так и без неё; либо представлять собой комбинации различных языков и форматов. Например, на DVD может быть записано восемь независимых потоков цифрового 5.1-канального звука, хотя обычно используются более разнообразные варианты.

В дисках DVD применяют два формата 5.1-канального звука: MPEG-2- Audio и Dolby АС-3 (Dolby Digital). Для стран с телевизионным стандартом PAL основным является формат MPEG-2-Audio, а формат АС-3 – дополнитель- ным. Для стран с телевизионным стандартом NTSC, наоборот, основным является АС-3, а дополнительным MPEG-2-Audio. Кроме того, в дисках DVD для

всех телевизионных стандартов применяется двухканальный формат с линейной ИКМ (см. табл. 6.1).

 

 

Таблица 6.1

Стандарт

PAL

NTSC

Основной

MPEG-2 и/или

Dolby АС-3 и/или

линейная ИКМ

линейная ИКМ

Дополнительный

Dolby АС-3

MPEG-2

 

 

 

Этот двухканальный звук воспроизводится непосредственно через обычные стереосистемы,

или посредством ProLogic-декодера преобразуется в 5.1-канальный, т.е. воспроизводится так же, как и стереозвук с кассет HiFi-видеомагнитофонов VHS. Наряду с тремя вышеприведеными возможно применение и других форматов цифрового звука.

В линейной ИКМ компрессия не применяется. Аналого-цифровое преобразование звука происходит с квантованием (разрешением по уровню) 16, 20 или 24 бита на отсчет и с частотой дискретизации 48 или 96 кГц. Такие характеристики обеспечивают очень высокое качество звука, но обусловливают и большие потоки аудиоинформации. Например, при частоте дискретизации 96 кГц, 24-битном квантовании и 2 каналах величина потока составляет 96кГц × 24 бит × 2 = 4,608 Мб/с.

Таблица 6.2

Частота

Разреше-

 

Число каналов

 

дискрети-

ние, бит

 

 

 

 

 

зации, кГц

на отсчет

Моно

2

5

 

8

48

16

Да

Да

Да

 

Да

48

20

Да

Да

Да

 

Нет

48

24

Да

Да

Да

 

Нет

96

16

Да

Да

Нет

 

Нет

96

20

Да

Да

Нет

 

Нет

96

24

Да

Да

Нет

 

Нет

В табл. 6.2 приведено число аудиоканалов, которое можно записать на диске DVD посредством линейной ИКМ при различных характеристиках аналого-цифрового преобразования.

Возможно использование до 8 ИКМканалов. Однако из-за ограничения аудиопотока линейной ИКМ значением 6,144 Мбит/с реализуются не все комбинации числа каналов, частоты дискретизации и разрешения.

В форматах Dolby АС-3 и MPEG-2-Audio применяется компрессия аудиопотоков за счет исключения избыточных данных с учетом особенностей слуха. «Лишние» звуки исключаются из тех участков передаваемого частотного спектра, где ухо малочувствительно к звуку. Так, можно не записывать шумы, уровень которых ниже порога слышимости, а также слабые звуки, возникаю-

щие сразу же после громких, или слабые звуки, перекрываемые громкими (эффект маскирования. Например, общение в дискотеке возможно только посредством крика; нормальный разговор здесь маскируется музыкой. Поэтому скомпрессированные цифровые аудиосигналы содержат только действительно слышимые звуки, а все другие исключаются в процессе обработки. Несмотря на это, компрессированная музыка звучит так же хорошо, как и без компрессии, записанная на компакт-дисках CD (линейная ИКМ). Диапазон передаваемых частот у DVD так же, как и у CD простирается до 40 кГц, и сохраняются другие достоинства цифрового звука, обусловленные почти полным отсутствием шумов и очень большим динамическим диапазоном.

Частота дискретизации в каждом канале звука в форматах АС-3 и MPEG- 2-Audio 48 кГц. Применяются схемы корреляции, позволяющие смешивать различные каналы и записывать их на диск в виде единых для каждого из обоих форматов потоков данных. В результате 5.1-канальный звук с очень высоким качеством требует для записи меньше информационного пространства, чем простой стереофонический звук, записываемый в форме линейной ИКМ. Соответственно ниже и скорость передачи данных. Основные параметры аудиопотоков в системе DVD, приведены в табл. 6.3.

Таблица 6.3

Параметры

Линейная ИКМ

MPEG-2

Dolby АС-3

MPEG-1

 

 

 

 

 

Максимальныйцифровойпоток, Мб/с

6,144

0,912

0,448

0,384

Частотадискретизации, кГц

48/ 96

48

48

48

 

 

 

 

 

Число битна отсчет

16/ 20/ 24

16скомпрессией

8

 

 

 

 

 

Максимальное число каналов

от1 до 8

от1 до 5.1 или 7.1

от1 до5.1

2

 

 

 

 

 

Запись и воспроизведение звука чаще производятся с постоянной скоростью, но возможно и применение переменной скорости.

Кроме 5.1-канального формата АС-3 используется двухканальный формат АС-3. Посредством интегрированного в каждом DVD-плейере блока Downmix сигнал АС-3 перекодируется в двухканальный сигнал Surround и в зависимости от возможностей плейера подается на его выход в цифровой или аналого-

Соседние файлы в папке Л9,10,11