Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика_учебник.doc
Скачиваний:
408
Добавлен:
10.05.2015
Размер:
27.7 Mб
Скачать

3.4.3. Кодировка звука.

Звук – это аналоговый процесс, который можно описать одной (но очень сложной!) функцией P(t), выражающей зависимость давления от времени в какой-либо точке пространства.

Человек различает две основные характеристики звука – громкость и тональность.

Громкость определяется как среднее значение функции P(t) за время  - маленькое с точки зрения человеческого восприятия, но достаточное для того, чтобы за это время произошло много пульсаций функции P(t) и можно было бы говорить о частотах этих пульсаций (например, величина  может составлять 1-2 десятых долей секунды). Тональность звука определяется частотами пульсаций функции P(t) за то же время . Количественно охарактеризовать тональность можно при помощи разложения функции P(t) в ряд Фурье на временном отрезке . В результате получится набор частотных гармоник – составляющих звукового спектра. Амплитуда каждой гармоники определяет громкость соответствующей частоты.

Любое кодирование звука заключается в представлении функции P(t) в виде набора данных, т.е. чисел. Существует много различных способов кодирования звука. Рассмотрим некоторые из них.

Формат MIDI (Musical Instrument Digital Interface) – цифровой интерфейс музыкальных инструментов. Создан в 1982 году ведущими производителями электронных музыкальных инструментов - Yamaha, Roland, Korg, E-mu и др. При этой кодировке считается, что звук создается набором музыкальных инструментов. Для каждого инструмента определяется набор возможных действий (например, нажатие определенной клавиши на фортепиано) и результат каждого действия (спектр звука). Каждому действию каждого инструмента присваивается код.MIDI – файл и состоит из последовательности таких кодов. Можно считать, чтоMIDI-формат является электронным аналогом нотной записи. ПреимуществомMIDI-формата является очень маленький объем получающихся файлов. Одним из недостатковMIDI-формата является зависимость воспроизводимого звука от аппаратно-программного обеспечения, при помощи которого воспроизводится данныйMIDI файл (точно так же, как исполняемое «вживую» музыкальное произведение зависит не только от нот, но и от исполнителя). Вторым (основным) недостатком этого формата является невозможность записать звук, не создаваемый музыкальными инструментами, например, человеческий голос.

Формат WAV(от словаwave – волна). Это формат, основанный на непосредственном табулировании функцииP(t), т.е. на представлении этой функции в виде последовательности числовых значенийPi, в моменты времениti, отстоящие друг от друга на очень маленькую величинуt (t = ti+1 – ti ), называемую квантом дискретизации. За времяtфункцияP(t) должна измениться незначительно, - это означает, что величинаt должна быть существенно меньше периода самого высокочастотного звукового колебания из спектра функцииP(t).Величина обратнаяt(= 1/t) называетсячастотой дискретизации(частотой оцифровки). Числовые значения функцииPi дискретны, общее количество этих значений определяетсяразрядностью кодирования звука– 8 бит (256 значений), 16 бит (64 тыс. значений), 32 бита ( 4 млрд.значений) и т.д. Чем выше частота дискретизации и разрядность кодирования, тем более точно представляется записываемый звук. Достаточными являются значения этих параметров 44 кГц и 16 бит.

Формат WAV позволяет записывать любой звук с любой необходимой точностью. Главным недостатком этого формата является очень большой объем получающихся звуковых файлов. Даже при использовании процедуры сжатия данных объем таких файлов составляет несколько МБ на минуту звука, а объем 5-минутной музыкальные композиции составляют 30-50 МБ. Именно поэтому для записи музыкальных композиций форматWAV используется редко – его вытеснили форматы семейства MPEG. ФорматWAV используется для записи коротких звуков, а также в тех случаях,когда важна точность записи звука, например, при снятии данных с акустических датчиков.

Форматы MPEG ,включаяMP3 иMP4 – это семейство мультимедийных форматов для записи видеоизображения и звука. Принципы кодирования звука в рамках этих форматов основаны на том факте, что человеческое ухо не совершенно и на самом деле точное воспроизводство функцииP(t) дает много избыточной информации, которую органы слуха не в состоянии обработать.

Рассмотрим кодирование звука на примере формата MP3 (сокращение отMPEG Layer 3). Перед кодированием исходный сигнал (функцияP(t)) разбивается на участки длительности, называемые звуковыми фреймами. Каждый звуковой фрейм раскладывается в ряд Фурье, после чего он обрабатывается на основе так называемой психоакустической модели, учитывающей особенности восприятия звука человека. В рамках этой модели учитывается, например, что если в спектре присутствует сильный звук на частоте 1000 Гц, то более слабый звук на частоте 1100 Гц уже не будет слышен, что будет ослаблена чувствительность уха на период в 100 мс после и 5 мс до возникновения сильного звука и т.д. Все неслышимые с точки зрения психоакустической модели звуки из спектра удаляются, это и позволяет значительно уменьшить объем звукового файла. При этом качество звука не ухудшается, а иногда, например, при оцифровке зашумленного звука, может даже улучшится по сравнению с оригиналом. В целом качество звука для рассматриваемых форматов определяется суммарным объемом получаемого кода на единицу времени звучания, т.е. количеством бит, затрачиваемых на кодирование 1 секунды звучания. Эта величина называетсябитрейтоми измеряется в килобитах в секунду (кб/с,kbs). Наивысшее для форматаMP3 качество обеспечивается битрейтом320 кб/с, достаточное качество – битрейтом128 кб/с, это около 1 МБ на одну минуту звучания.

Алгоритмы кодирования звука могут различаться даже в рамках одного формата. Например, можно использовать MP3-кодирование с разными психоакустическими моделями. Непосредственное преобразование данных из звукового файла в звук (т.е. в аналоговый сигнал), а также обратное преобразование осуществляется специальными программными компонентами, которые называютсякодеками(от слов КОдировщик и ДЕКодировщик). Для того чтобы успешно воспроизводить музыкальные файлы и видеофайлы, необходимо установить набор кодеков, соответствующих всем возможным алгоритмам кодирования.

Существуют и другие форматы кодирования звука, использующие те же идеи, что и MPEG. Например, формат VQF позволяем уменьшить размер файла по сравнению сMP3 примерно на 25% за счет использования более сложных алгоритмов кодирования.