- •Лекции по курсу
- •4 Видеосигналы 44
- •1 Цифровые фильтры
- •1.1 Сущность явления Гиббса
- •1.2 Весовые функции
- •1.3 Разностное уравнение
- •1.4 Нерекурсивные фильтры
- •1.5 Рекурсивные фильтры
- •1.6 Структурные схемы цифровых фильтров
- •1.7 Импульсная характеристика фильтров
- •1.7.1 Свертка входного сигнала с импульсной характеристикой цифрового фильтра
- •2 Аналого-цифровое преобразование
- •2.1 Цифровая обработка звуковых сигналов
- •2.2 Основные понятия и определения
- •2.3 Структура и алгоритм работы цап
- •2.4 Структура и алгоритм работы ацп
- •2.4.1 Параллельные ацп
- •2.4.2 Ацп с поразрядным уравновешиванием
- •2.4.3 Ацп с плавающей точкой
- •3.1 Методы и стандарты передачи речи по трактам связи, применяемые в современном оборудовании (7 кГц)
- •3.1.1 Импульсно-кодовая модуляция (pcm — Pulse-Code Modulation)
- •3.1.3 Методы эффективного кодирования речи
- •3.1.4 Кодирование речи в стандарте cdma
- •3.1.5 Речевые кодеки для ip-телефонии
- •3.1.6 Оценка качества кодирования речи
- •3.2 Основные понятия цифровой звукозаписи
- •3.2.1 Натуральное цифровое представление данных
- •3.2.2 Кодирование рсм
- •3.3 Формат mp3
- •3.3.1 Сжатие звуковых данных
- •3.3.2 Кратко об истории и характеристиках стандартов mpeg.
- •3.3.3 Каковы отличия режимов cbr, vbr и abr?
- •3.3.4 Какие методы кодирования стерео информации используются в алгоритмах mpeg (и других)?
- •3.3.5 Какие альтернативные mpeg-1 Layer III (mp3) алгоритмы компрессии существуют?
- •3.4 OggVorbis
- •3.6 Flac
- •4 Видеосигналы
- •4.1 Общие положения алгоритмов сжатия изображений
- •4.2 Алгоритмы сжатия
- •4.2.1 Gif (CompuServe Graphics Interchange Format)
- •4.2.3 Jpeg
- •4.2.5 Метод Хаффмана
- •4.2.6 Png (Portable Network Graphics)
- •4.2.7 Tiff (Tagged Image File Format)
- •4.2.8 Pdf (Portable Document Format)
- •4.2.9 Adobe Photoshop Document
- •4.2.10 CorelDraw Document
- •4.2.11 Wmf (Windows Metafile)
- •4.2.12 Bmp (Windows Device Independent Bitmap)
- •4.2.13 Rtf (Microsoft Rich Text Format)
- •4.3 Вейвлет-преобразования
- •4.4 Jpeg2000
- •4.4.1 Общая характеристика стандарта и основные принципы сжатия
- •4.4.2 Информационные потери в jpeg2000 на разных этапах обработки
- •4.5 Видеостандарт mpeg-1
- •4.6 Mpeg-2
- •4.6.1 Стандарт кодирования mpeg-2
- •4.7 Стандарт mpeg-4
- •4.7.1 Особенности стандарта mpeg-4
- •4.7.2 Профайлы в mpeg-4
- •4.8 Стандарт hdtv
- •5 Принципы построения и особенности внедрения систем цифрового тв вещания
- •5.1 Глобальная модель систем цифрового вещания
- •5.2 Определение и классификация систем доставки
- •Приложение п1 Ортогональные разложения функций
- •П2 Дискретизация функций рядами Фурье
- •П4 Частота дискретизации
- •П5 Разрядность
3.2.2 Кодирование рсм
Метод натуральной цифровой записи звука называется РСМ (Pulse Code Modulation - импульсно-кодовая модуляция). Он заключается в том, что в ходе записи в течение каждой секунды многократно регистрируется текущая амплитуда звуковой волны. Некоторое значение амплитуды рассматривается как предельное, которое может быть представлено в звукозаписи. Ему соответствует максимальное целое число, которое "умещается" внутри соответствующего элемента данных. Текущее значение масштабируется относительно максимального и округляется до ближайшего целого числа. В результате получается как бы моментальный снимок звуковой волны. Вся звукозапись представляет собой последовательность таких "снимков".
Терминология, используемая в компьютерной цифровой звукозаписи, не устоялась как в русском, так и в английском языке, что выражается в том, что одни и те же термины используются для обозначения совершенно разных понятий. Так, с помощью английского термина sample обозначают как отдельный "снимок" звуковой волны, так и всю временную последовательность таких снимков.
Рисунок 3.1
На русском языке в том же смысле часто используют термин "сигнал". Сигнал обозначает отдельный снимок звуковой волны, а всю последовательность сигналов мы будем рассматривать как волновую форму (в соответствии с другим часто используемым английским термином waveform).
3.3 Формат mp3
Формат MP3 - сокращение от MPEG Layer3. Это один из потоковых форматов хранения и передачи аудиосигнала в цифровой форме, разработанный Fraunhofer IIS и THOMSON, позднее утвержденный как часть стандартов сжатого видео и аудио MPEG1 и MPEG2. Данная схема является наиболее сложной схемой семейства MPEG Layer 1/2/3. Она требует наибольших затрат машинного времени для кодирования по сравнению с двумя другими и обеспечивает более высокое качество кодирования. Используется главным образом для передачи аудио в реальном времени по сетевым каналам и для кодирования CD Audio.
Формат MP3 - потоковый формат. Это означает, что передача данных происходит потоком независимых отдельных блоков данных - фреймов. Для этого исходный сигнал при кодировании разбивается на равные по продолжительности участки, именуемые фреймами и кодируемые отдельно. При декодировании сигнал формируется из последовательности декодированных фреймов.
Высокая степень компактности формат MP3 по сравнению с PCM 16Bit Stereo 44.1kHz (CD Audio) и ему подобными форматами при сохранении аналогичного качества звучания достигается с помощью дополнительного квантования по установленной схеме, позволяющей минимизировать потери качества.
Последнее, в свою очередь, достигается учетом особенностей человеческого слуха, в том числе эффекта маскирования слабого сигнала одного диапазона частот более мощным сигналом соседнего диапазона, когда он имеет место, или мощным сигналом предыдущего фрейма, вызывающего временное понижение чувствительности уха к сигналу текущего фрейма.
Также учитывается неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, разного для разных частотных диапазонов.
Подобные техники называются адаптивным кодированием и позволяют экономить на наименее значимых с точки зрения восприятия человеком деталях звучания. Степень сжатия, и, соответственно, объем дополнительного квантования, определяются не форматом, а самим пользователем в момент задания параметров кодирования. Ширина потока (bitrate) про кодировании сигнала, аналогичного CD Audio (44.1kHz 16Bit Stereo) варьируется от наибольшего, 320kbs (320 килобит в секунду, также пишут kbs, kbps или kb/s), до 96kbs и ниже.
Термин битрейт в общем случае обозначает общую величину потока, количество передаваемой за единицу времени информации, и поэтому не связан с внутренними тонкостями строения потока, его смысл не зависит от того, содержит ли поток моно или стерео, или пятиканальное аудио с текстом на разных языках, или что-либо еще.
Более низкие битрейты, несмотря на их популярность, не дают возможности обеспечить надлежащее качество кодирования, что незаслуженно обеспечило MP3 дурную славу любительского формата. На самом деле, хотя и 256kbs, и даже 320kbs тоже не дают возможности осуществить полностью прозрачное кодирование, но отличия от CD Audio, по которому кодируется тестовый MP3, сравнимы с отличиями самого CD Audio от исходного аналогового сигнала, из которого он был получен путем оцифровки. То есть потери, конечно, есть, но несущественны с точки зрения того, кому качество CD Audio представляется достаточным. Фактически, их обнаружение обычно является задачей нетривиальной на аппаратуре класса Hi-Fi.