Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Самый новый ММТвО-1-11н.doc
Скачиваний:
121
Добавлен:
01.06.2015
Размер:
3.91 Mб
Скачать

1.2.2. Состав аппаратуры мультимедиа

Чтобы реализовать на ПК даже простейшие примеры работы средств ММ, например, запись и воспроизведение музыки, следует дополнить аппаратуру специальной интерфейсной картой – акустическим адаптером (звуковой картой, sound card). Эта карта может выпускаться в виде отдельного устройства, вставляться в слот расширения материнской платы ПК или быть интегрированной с ней. Как правило, звуковые карты не имеют собственного усилителя мощности, поэтому для получения звука достаточной громкости следует пользоваться внешним усилителем или активной акустической системой (со встроенными усилителями). Типовой состав ММ аппаратуры представлен на рис.1.6., где MIDI-секвенсор – устройство записи, воспроизведения, компоновки, редактирования MIDI-файлов.

Рис.1.6. Типовой состав ММ аппаратуры

В состав аппаратуры ММ постоянно включаются новые накопители и носители информации все возрастающей емкости, поскольку развитие технологий DVD и других интенсивно продолжается. Например, уже используются устройства и оптические диски, выполненные по технологии Blu-ray.

В число дополнительных устройств ММ ПК могут входить разнообразные устройства ввода-вывода информации: TV-тюнер, модем, игровые приставки (геймпады), манипуляторы и указатели, аппаратура поддержки среды виртуальной реальности и т.п.

1.3. Обработка звука и звуковые карты

1.3.1. Характеристики звука

Звук – это невидимые волны, которые распространяются в воздухе, чаще всего из-за того, что где-то происходят колебания. С помощью нервных окончаний в нашем ухе мы их и слышим. При этом орган слуха (периферический отдел слухового анализатора) преобразует различные параметры звука (интенсивность, частоту, длительность) в активность периферических и центральных слуховых нейронов, на основе чего формируются субъективные характеристики звука (громкость, высота, продолжительность). Характерной чертой всех источников звука является из вибрация.

Звуковая волна – это процесс распространения в сплошной среде объемных деформаций сжатия и разряжения. При распространении звуковых волн наблюдаются явления, присущие всем волновым процессам: интерференция, дифракция, отражение, рассеивание.

Простейшая звуковая волна (чистый звук, гармонические колебания) представляется аналоговым сигналом – синусоидой (рис.1.7). Амплитуда синусоиды (A) определяет громкость звука, а частота – величина, обратная периоду колебания (T) – его высоту тона (ноту). Чем выше частота, тем выше тон [3-8, 18]. Однако чисто синусоидальные звуковые колебания встречаются в природе крайне редко. Большинство звуковых сигналов имеют негармоническую форму. Они могут быть периодическими (звук скрипки при равномерном движении смычка по струне) или непериодическими (звуки речи).

Рис.1.7. Простейшая звуковая волна

Электрическое отображение реального звука, который мы слышим (аналоговый звук), имеет вид непрерывной кривой. В случае сложных негармонических колебаний высота звука оценивается ухом человека по частоте основного тона.

Реальные звуки кроме громкости и высоты характеризуются еще и тембром – своеобразной окраской или насыщенностью, поскольку они представляют из себя созвучия, состоящие из нескольких простых волн. Тембр обеспечивается присутствием в сигнале кроме основного тона (колебаний основной частоты) еще и дополнительных гармоник – колебаний более высоких (в 2, 3, 4 раза и т.д.) частот – обертонов. Эти звуки располагаются через октаву. Именно обертоны определяют неповторимый тембровый окрас голоса того или иного музыкального инструмента [5]. Тембр зависит от числа, состава и амплитуд обертонов, а также от скоростей нарастания разных амплитуд. Таким образом, в реальных условиях происходит интерференция (сложение) волн основного тона и обертонов, в результате чего отображающая кривая получает замысловатую форму, как на примерах реальных звуковых волн трубы и фортепиано (рис.1.8) [18].

Рис.1.8. Примеры реальных звуковых волн трубы и фортепиано

Созданный с помощью музыкального инструмента звуковой сигнал состоит из четырех характерных фрагментов (фаз), имеющих названия: Атака (Attack), Спад (Decay), Поддержка (Sustain) и Затухание (Release) (рис.1.9).

Огибающая колебаний во время атаки, спада, поддержки и затухания называется амплитудной огибающей (envelope) (рис.1.10). Различные музыкальные инструменты имеют разную форму амплитудной огибающей, отмеченные фазы характерны практически для всех инструментов (исключение составляют ударные). Для создания электронного аналога реального звука (синтеза звука) необходимо воссоздать огибающие гармоник, из которых состоит реальный звук.

Рис.1.9. Четыре фазы звукового сигнала

Рис.1.10. Амплитудная огибающая

В более совершенных синтезаторах сигнал имеет шесть фаз, включая дополнительно фазы задержки (Delay) и удержания (Hold) (рис. 1.11) [19, 20].

Ухо человека слышит сигналы в диапазоне частот от 17-20 Гц до 20 КГц, причем, логарифмически. Поэтому сила звука обычно измеряется в логарифмах отношения сравниваемых амплитуд, например, в децибелах (дБ) [5]:

1 дБ = 20 log10(A/B).

Другими характеристиками звукового сигнала являются: звуковое (акустическое) давление, интенсивность (сила) звука, уровень громкости, естественный динамический диапазон (разность между минимальным и максимальным уровнем громкости сигнала), разделение каналов стереозвука, отношение сигнал/шум, вид амплитудно-частотной характеристики и т.п.

Рис.1.11. Шесть фаз звукового сигнала

Например, для симфонического оркестра динамический диапазон равен

D = 110 – 30 (дБ) = 80 дБ.

1 дБ – уровень сигнала, интенсивность которого равна условному нулевому уровню.

Для сравнения примеры интенсивности:

  • обстановка за городом ночью – 20 дБ;

  • шум клепальной машины, крик с близкого расстояния – 100 дБ;

  • фоновый шум в тихой комнате – 30 дБ;

  • шум реактивного двигателя, рок-концерт –120 дБ;

  • обычный тихий разговор – 50 дБ;

  • болевой порог – около 130 дБ;

  • шум небольшого офиса – 60 дБ;

  • выстрел из орудия с близкого расстояния –140 дБ [3-5].

  • шум внутри трамвая – 70 дБ;

Звуковой сигнал в цифровой форме (цифровой звук) представляет собой последовательность двоичных чисел, выражающих величину его амплитуды, измеренную через определенные промежутки времени.

Процесс преобразования аналогового сигнала в цифровой происходит так. Непрерывный аналоговый сигнал делится на равные отрезки (тактовые интервалы) с помощью очень стабильного источника тактовой частоты. Значения амплитуды в начале каждого интервала (отсчеты) запоминаются и сохраняются до начала следующего с помощью специального устройства выборки и хранения. Эта операция называется дискретизацией, а частота следования отсчетов (число осуществляемых замеров амплитуды в 1 с) – частотой дискретизации. Но значения амплитуды сигнала невозможно записать с бесконечной точностью, поэтому их округляют, выражая ближайшим по значению двоичным числом [14-15]. Данная операция называется квантованием. Точность квантования увеличивается с ростом числа разрядов двоичного представления отсчетов или частоты дискретизации. Она определяет отношение сигнал/шум и динамический диапазон сигнала (хотя это взаимно-обратные величины, но любой реальный тракт имеет и свой уровень шумов и помех).

К снижению уровня шумов в рабочей полосе частот 0 ÷ Fмакс приводит не только увеличение разрядности отсчета, но и повышение частоты дискретизации относительно 2 Fмакс, поскольку шумы квантования распределяются по всей полосе вплоть до частоты дискретизации, а звуковая информация занимает только нижнюю часть этой полосы.

Итак, более или менее точная передача сигнала связана не с лучшей или худшей его слышимостью, а с большей или меньшей зашумленностью и искаженностью оригинального сигнала. Принято считать, что качество звучания определяется, в основном, наличием и «поведением» высоких частот (в полосе от 5 КГц и выше), тогда как частоты в полосе от 0 до 3-5 КГц определяют ясность звучания. Например, человеческую речь и музыку невозможно разобрать без наличия в ней нижней полосы частот, тогда как верхние частоты придают звучанию окрас четкости и качества [14-15].

Динамический диапазон (D) связан с числом разрядов квантования (N) выражением: D = 6×N + 1,76 (дБ). CD-качество обеспечивает 16-разрядное квантование, при котором D = 6×16 + 1,76 (дБ) = 97,76 дБ ≈ 98 дБ.

Частота дискретизации (Fd), определяющая полосу частот кодируемого аналогового сигнала, в соответствии с известной теорией отображения Найквиста-Котельникова должна быть, по крайней мере, в 2 раза выше максимальной частоты искомого частотного диапазона звука (частоты наивысшей гармоники). Если требуется получить верхнюю частоту звука 20 КГц, то частота дискретизации должна быть не ниже 40 КГц. В системе CD частота дискретизации равна 44,1 КГц [3-6, 18].

Но из теоремы Котельникова следует, что сигнал с частотой Fa может быть успешно дискретизирован на Fd = 2Fa только в том случае, если он является чистой синусоидой, так как любое отклонение от синусоиды приведет к выходу спектра за пределы частоты Fa. Таким образом, для временной дискретизации произвольного звукового сигнала (с плавно спадающим спектром) необходимо либо выбирать Fd с запасом, либо принудительно ограничивать спектр входного сигнала ниже ½Fd [21-23].

В процессе развития аудиотехнологий значения Fd довели до 48 КГц, а в студийной аппаратуре (используя более высокие разрешения – 18-, 20- и 24-разрядное квантование) – до 56 КГц, 96 КГц и 192 КГц [5-6, 14]. Это делается для того, чтобы сохранить высшие гармоники звукового сигнала, которые непосредственно не воспринимаются слухом, но влияют на формирование общей звуковой картины [22]. Дело здесь в том, что высокая частота дискретизации гарантирует лучшие качество записи на высоких частотах, детали звучания инструментов и пространственную локализацию (возможность различать на записи положение в пространстве каждого инструмента), чем при стандартной частоте дискретизации 44.1 кГц или 48 кГц. Также при большой частоте дискретизации высокочастотные сигналы выше 20 кГц делают звучание более натуральным [24].

Достоинства и недостатки цифрового звука. Цифровое представление звука ценно, прежде всего, возможностью бесконечного хранения и тиражирование без потери качества. Но преобразование аналог-цифра и обратно все же приводит к частичной его потере. Наиболее неприятные на слух искажения, вносимые на этапе оцифровки – гранулярный шум, возникающий при квантовании сигнала по уровню из-за округления амплитуды до ближайшего дискретного значения. В отличие от простого широкополосного шума, вносимого ошибками квантования, гранулярный шум представляет собой гармонические искажения сигнала, наиболее заметные в верхней части спектра. Искажения, вносимые гранулярным шумом, можно уменьшить путем добавления к сигналу обычного белого шума (псевдослучайного сигнала) амплитудой в ½ младшего значащего разряда. Такая операция называется сглаживанием (dithering). Это приводит к незначительному росту уровня шума, зато ослабляет корреляцию ошибок с ВЧ-компонентами сигнала и улучшает его субъективное восприятие.

При восстановлении звука из цифровой формы в аналоговую возникает проблема сглаживания ступенчатой формы сигнала и подавления гармоник, вносимых частотой дискретизации. Из-за неидеальности АЧХ фильтров может происходить либо недостаточное подавление этих помех, либо избыточное ослабление полезных ВЧ-составляющих. Плохо подавленные гармоники частоты дискретизации искажают форму аналогового сигнала (особенно в ВЧ-области), что создает впечатление «шероховатого», «грязного» звука [22].