Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
гарсков 01-10 блеа нью вёршн.docx
Скачиваний:
26
Добавлен:
11.04.2015
Размер:
1.39 Mб
Скачать

Wma (Windows Media Audio)

WMA (Windows Media Audio) является продуктом небезызвестной компании Microsoft. Он был создан как альтернатива «народному» формату МРЗ, чтобы стать еще «народней». Последнее утверждение считаем справедливым, потому что в последних версиях Windows Media Player установлен кодировщик, позволяющий сжимать компакт-диски сразу в формат WMA. А с учетом того, что Windows установлена на большинстве компьютеров мира, разработчики рассчитывали переманить пользователей на сторону ■ своего формата. С точки зрения качества звучания формат WMA практически идентичен формату МРЗ, в чем-то превосходя, в чем-то уступая ему. WMA 8 с битрейтом 128 кбит/с уступает по качеству не только CD, но и МРЗ. Но на низких битрейтах он превосходит своего соперника, опять же, по понятным нам причинам. Выпущенный WMA 9 стал поддерживать сжатие с переменным битрейтом и сжатие без потерь, однако по качеству звучания так и не превзошел WMA8. Интересной особенностью формата WMA является защита авторских прав. Если вы не отключите защиту (DRM) при кодировании, то вы не сможете воспроизвести созданный файл на любом другом компьютере. Для этого необходимо загрузить специальный сертификат, разрешающий проигрывать файл ограниченное время, после которого необходимо будет купить его или целый диск. Большим плюсом является поддержка формата многими бытовыми проигрывателями, портативными устройствами, автомагнитолами и другой ау-диотехникой.

Аудио, сжатое в формат WMA поддерживается сегодня большим количеством аппаратных плееров.

Плюсы

  • Полная поддержка со стороны Windows.

Минусы

  • Чрезвычайно низкое качество при низком битрейте.

  • Полная закрытость.

Microsoft WMA V1

Microsoft WMA V2

Microsoft WMA V7

Microsoft WMA V9

Структура кодера сжатия аудиоданных с потерями

Обобщенная структура кодера звукового сигнала с компрессией цифровых аудиоданных

  • Исходный цифровой звуковой сиг­нал разделяется на частотные поддиапазоны и сегментируется по времени в блоке временной и частотной сегментации.

  • Длина кодируемой выборки зависит от формы временной функции звукового сигнала. При отсутствии резких выбросов по амплитуде используется так назы­ваемая длинная выборка, обеспечивающая высокое разрешение по частоте. В случае же резких изменений амплитуды сигнала длина кодируемой выборки резко уменьшается, что дает более высокое разрешение по времени. Решение об изменении длины кодируемой выборки принимает блок психоакустического анализа, вычисляя значение психоакустической энтропии сигнала.

  • После сег­ментации сигналы частотных поддиапазонов нормируются, квантуются и кодируются. В наиболее эффективных алгоритмах компрессии кодированию подвергаются не сами отсчеты выборки звукового сигнала, а соответствующие им коэффициенты МДКП.

  • Учет закономерностей слухового восприятия звукового сигнала вы­полняется в блоке психоакустического анализа. Здесь по специальной процедуре для каждого частотного поддиапазона рассчитывается максимально допустимый уровень искажений (шумов) квантования, при котором они еще маскируются полезным сигналом данного поддиапазона.

  • Блок динамического распределения бит в соответствии с требованиями психоакустической модели для каждого поддиапазона кодирования выделяет такое минимально возможное их количество при котором уровень искажений, вызванных квантованием, не превышал порога их слышимости, рассчитанного психоакустической моделью.

  • Также могут использоваться:

    • матрицирование стерео - сложение и вычитание левого и правого канала для устранения повторяющейся информации

    • специальные процедуры итерационных циклов, позволяющие управлять величиной энергии искажений квантования в поддиапазонах при недостаточном числе доступных для кодирования бит

    • процедуры линейного и обратного адаптивного предсказаний

    • техника сглаживания переходных шумов во временной области (Temporal Noise Shaping - TNS), позволяющая управлять микроструктурой искажений квантования внутри каждого поддиапазона кодирования

  1. Сжатие объема речевой информации

http://latya.narod.ru/coavs/12.htm

В современных цифровых системах регистрации, передачи и хранения речевой информации с целью уменьшения объема, занимаемого информацией на физических носителях, или скорости ее передачи по цифровым каналам связи применяются различные методы сжатия речи. В таких системах речевой сигнал, преобразованный в цифровой вид, перед записью на носитель или передачей кодируется при помощи специального алгоритма сжатия, а при воспроизведении с носителя или на приеме - декодируется. Как известно, речевой сигнал в информационно - коммуникативном плане обладает определенной избыточностью, не влияющей на смысловое содержание речевой посылки. При этом сжатие речи возможно за счет частичного удаления этой избыточности, что может не уменьшать разборчивости и качества слухового восприятия речи, но, вместе с тем, лишить ее особых признаков, необходимых для экспертной идентификации речи. Поэтому при производстве экспертизы важно установить как сам факт сжатия, так и его влияние на речевой сигнал.

В настоящее время применяется множество алгоритмов сжатия речи. Все они могут быть реализованы как аппаратнными, так и программными методами. Условно все алгоритмы можно разделить на три вида: - усовершенствованные виды импульсно-кодовой модуляции (ИКМ, Pulse-Code Modulation PCM); - вокодеры (от англ. Voice и Coder); - липредеры (от англ. Linear и Predictor). Для оценки характера вносимых в речевой сигнал изменений и потерь рассмотрим принципы построения различных методов сжатия.