- •Сжатие без потерь
- •1.1.1. Некоторые особые последовательности
- •1.1.2. Разделимые последовательности
- •1.1.3. Последовательности конечной протяженности
- •1.1.4. Периодические последовательности
- •Подходы второго порядка к выделению границ
- •Дифференциальное выделение границ Подходы, основанные на согласованности фаз
- •Семейство стандартов mpeg
- •4.2.1.Стандарт mpeg-1
- •Wma (Windows Media Audio)
- •1. Усовершенствованные виды икм.
- •2. Вокодеры.
- •3. Липредеры
- •1.5. Характеристики лцф с постоянными параметрами
- •1.5.1. Системная (передаточная) функция фильтра в z-форме
- •В чём отличие mpeg-4 от mpeg-1 и mpeg-2?
Wma (Windows Media Audio)
WMA (Windows Media Audio) является продуктом небезызвестной компании Microsoft. Он был создан как альтернатива «народному» формату МРЗ, чтобы стать еще «народней». Последнее утверждение считаем справедливым, потому что в последних версиях Windows Media Player установлен кодировщик, позволяющий сжимать компакт-диски сразу в формат WMA. А с учетом того, что Windows установлена на большинстве компьютеров мира, разработчики рассчитывали переманить пользователей на сторону ■ своего формата. С точки зрения качества звучания формат WMA практически идентичен формату МРЗ, в чем-то превосходя, в чем-то уступая ему. WMA 8 с битрейтом 128 кбит/с уступает по качеству не только CD, но и МРЗ. Но на низких битрейтах он превосходит своего соперника, опять же, по понятным нам причинам. Выпущенный WMA 9 стал поддерживать сжатие с переменным битрейтом и сжатие без потерь, однако по качеству звучания так и не превзошел WMA8. Интересной особенностью формата WMA является защита авторских прав. Если вы не отключите защиту (DRM) при кодировании, то вы не сможете воспроизвести созданный файл на любом другом компьютере. Для этого необходимо загрузить специальный сертификат, разрешающий проигрывать файл ограниченное время, после которого необходимо будет купить его или целый диск. Большим плюсом является поддержка формата многими бытовыми проигрывателями, портативными устройствами, автомагнитолами и другой ау-диотехникой.
Аудио, сжатое в формат WMA поддерживается сегодня большим количеством аппаратных плееров.
Плюсы
Полная поддержка со стороны Windows.
Минусы
Чрезвычайно низкое качество при низком битрейте.
Полная закрытость.
Microsoft WMA V1
Microsoft WMA V2
Microsoft WMA V7
Microsoft WMA V9
Структура кодера сжатия аудиоданных с потерями
Обобщенная структура кодера звукового сигнала с компрессией цифровых аудиоданных
Исходный цифровой звуковой сигнал разделяется на частотные поддиапазоны и сегментируется по времени в блоке временной и частотной сегментации.
Длина кодируемой выборки зависит от формы временной функции звукового сигнала. При отсутствии резких выбросов по амплитуде используется так называемая длинная выборка, обеспечивающая высокое разрешение по частоте. В случае же резких изменений амплитуды сигнала длина кодируемой выборки резко уменьшается, что дает более высокое разрешение по времени. Решение об изменении длины кодируемой выборки принимает блок психоакустического анализа, вычисляя значение психоакустической энтропии сигнала.
После сегментации сигналы частотных поддиапазонов нормируются, квантуются и кодируются. В наиболее эффективных алгоритмах компрессии кодированию подвергаются не сами отсчеты выборки звукового сигнала, а соответствующие им коэффициенты МДКП.
Учет закономерностей слухового восприятия звукового сигнала выполняется в блоке психоакустического анализа. Здесь по специальной процедуре для каждого частотного поддиапазона рассчитывается максимально допустимый уровень искажений (шумов) квантования, при котором они еще маскируются полезным сигналом данного поддиапазона.
Блок динамического распределения бит в соответствии с требованиями психоакустической модели для каждого поддиапазона кодирования выделяет такое минимально возможное их количество при котором уровень искажений, вызванных квантованием, не превышал порога их слышимости, рассчитанного психоакустической моделью.
Также могут использоваться:
матрицирование стерео - сложение и вычитание левого и правого канала для устранения повторяющейся информации
специальные процедуры итерационных циклов, позволяющие управлять величиной энергии искажений квантования в поддиапазонах при недостаточном числе доступных для кодирования бит
процедуры линейного и обратного адаптивного предсказаний
техника сглаживания переходных шумов во временной области (Temporal Noise Shaping - TNS), позволяющая управлять микроструктурой искажений квантования внутри каждого поддиапазона кодирования
Сжатие объема речевой информации
http://latya.narod.ru/coavs/12.htm
В современных цифровых системах регистрации, передачи и хранения речевой информации с целью уменьшения объема, занимаемого информацией на физических носителях, или скорости ее передачи по цифровым каналам связи применяются различные методы сжатия речи. В таких системах речевой сигнал, преобразованный в цифровой вид, перед записью на носитель или передачей кодируется при помощи специального алгоритма сжатия, а при воспроизведении с носителя или на приеме - декодируется. Как известно, речевой сигнал в информационно - коммуникативном плане обладает определенной избыточностью, не влияющей на смысловое содержание речевой посылки. При этом сжатие речи возможно за счет частичного удаления этой избыточности, что может не уменьшать разборчивости и качества слухового восприятия речи, но, вместе с тем, лишить ее особых признаков, необходимых для экспертной идентификации речи. Поэтому при производстве экспертизы важно установить как сам факт сжатия, так и его влияние на речевой сигнал.
В настоящее время применяется множество алгоритмов сжатия речи. Все они могут быть реализованы как аппаратнными, так и программными методами. Условно все алгоритмы можно разделить на три вида: - усовершенствованные виды импульсно-кодовой модуляции (ИКМ, Pulse-Code Modulation PCM); - вокодеры (от англ. Voice и Coder); - липредеры (от англ. Linear и Predictor). Для оценки характера вносимых в речевой сигнал изменений и потерь рассмотрим принципы построения различных методов сжатия.