Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по ЦО АВС.doc
Скачиваний:
69
Добавлен:
07.09.2019
Размер:
5.86 Mб
Скачать

3.10.1 Сжатие звуковых данных

Итак, использование стандартного формата записи звука связано с важной проблемой - большим объемом получающихся файлов. Такая проблема возникает не только в звукозаписи, но и во многих других случаях, и для ее решения существует стандартный прием - сжатие (упаковка) данных. Вы, вероятно, слышали, что есть два основных метода сжатия - без потери и с потерей информации.

Первый способ, называемый также "обратимым", можно рассматривать как универсальный, он применим к любым данным и позволяет точно восстановить их исходный вид. Однако эффективность сжатия сильно зависит от структуры самих данных. Оказывается, что структура звуковых данных в этом плане очень "неудачна".

Стандартные алгоритмы обратимого сжатия не позволяют сэкономить больше чем 10-20% от общего объема файла. Алгоритмы, учитывающие структуру звукозаписи, позволяют несколько повысить эффективность сжатия, но также не слишком значительно. Не будет преувеличением сказать, что ни один из обратимых алгоритмов не позволяет добиться хотя бы двукратного уменьшения требуемого пространства.

3.10.2 Сжатие с потерей информации

Преодолеть этот барьер удается, как только мы понимаем, что, на самом деле, нам не требуется восстанавливать исходную запись. Вполне достаточно получить запись, которая звучала бы примерно так же, как исходная. То есть, допустимо использовать форматы сжатия с потерей информации, если такая потеря не заметна на слух.

Наиболее распространенным алгоритмом такого сжатия является алгоритм ADPCM (Adaptive Differential Pulse Code Modulation - адаптивная разностная импульсно-кодовая модуляция). Он основан на том, что, в среднем, величина амплитуды звуковой волны мало меняется от одного сигнала к следующему, особенно в музыкальной записи. Поэтому, если хранить не сами сигналы, а разности между текущим и предыдущим сигналами, можно рассчитывать на то, что для хранения нужных данных потребуется меньше битов, чем при записи полного сигнала. Существует несколько вариантов сжатия ADPCM, предложенного разными производителями, но все они обеспечивают сжатие примерно в 4 раза, сопровождающееся незначительным ухудшением качества звучания.

3.10.3 Ориентация на человека

Другие алгоритмы учитывают, что источником или адресатом звука является человек. Например, форматы типа GSM, используемые в телефонной связи, моделируют особенности речевой системы человека и сохраняют необходимый минимум данных, при котором речь еще остается разборчивой. Эти форматы специально предназначены для сжатия речи при низкой разрядности и небольшой частоте дискретизации, что требуется для передачи в режиме реального времени и в цифровом виде телефонных разговоров.

Примерно на той же самой идее основан и формат МРЗ. Этот формат предназначен, в первую очередь, для записи музыки и музыкальных произведений. Формат МРЗ ориентируется на особенности не голосовой, а слуховой системы человека и использует так называемый психоакустический подход. Идентичность исходной и конечной звуковой волны в этом формате вообще не требуется. Зато он обеспечивает их одинаковое восприятие человеком. Не исключено, что летучие мыши или какие-нибудь другие животные с тонким слухом "забраковали" бы такую запись. Но о наличии тонких ценителей музыки в животном мире нам ничего не известно, а если бы и было известно, то их мнением можно было бы пренебречь, так как человеку обнаружить на слух отличия звукозаписи в формате МРЗ от неупакованного оригинала практически невозможно.

При использовании формата МРЗ достигается степень сжатия в 10-12 раз. Подробнее мы поговорим об этом формате несколько позже.