Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
гарсков 01-10 блеа нью вёршн.docx
Скачиваний:
26
Добавлен:
11.04.2015
Размер:
1.39 Mб
Скачать

1. Усовершенствованные виды икм.

Параметры ИКМ при оцифровке речевых сигналов описаны в рекомендациях МККТТ (Международный консультативный комитет по телефонии и телеграфии, CCITT) и, как правило, имеют следующие значения: - частота дискретизации 8000 Гц; - число двоичных разрядов на отсчет 8; - скорость передачи 64000 бит/c.

При этом может быть оцифрован и восстановлен аналоговый сигнал с верхней частотой до 4000 Гц.

При использовании дифференциальной (разностной) ИКМ (ДИКМ, Differencial PCM, DPCM) вместо кодирования отсчетов кодируются разности между соседними отсчетами. Обычно разности отсчетов меньше самих отсчетов. Скорость передачи цифрового потока снижается до 32-56 кбит/c. В системах с логарифмической ДИКМ используют А- и мю законы компандирования для реализации неравномерного квантования. Адаптивная ДИКМ (АДИКМ, Adaptive Differencial PCM, ADPCM) - система ДИКМ с адаптацией квантователя (АЦП и ЦАП) и предсказателя. При АДИКМ оцифровывается не сам сигнал, а его отклонение от предсказанного значения (сигнал ошибки, ошибка предсказания). Идея компрессии ADPCM заключается в том, что оцифрованный речевой сигнал представляют не самими отсчетами, а разностями соседних отсчетов, меньших по величине и, следовательно, требующих меньшего числа битов для своего представления.

Наиболее часто применяются следующие разновидности АДИКМ: - рекомендация G.721 МККТТ (скорость передачи 32 кбит/с); - рекомендация G.722 МККТТ (частота дискретизации 16 000 Гц); - рекомендация G.723 МККТТ (скорость передачи 24 кбит/с); - Creative ADPCM (4, 2,6 или 2 бита на отсчет); - IMA/DVI ADPCM (4, 3 или 2 бита на отсчет); - Microsoft ADPCM.

Рассмотренные выше методы могут вносить незначительные изменения и потери в речевые сигналы (например, сужение динамического диапазона в области высших частот, ограничение крутизны сигнала), которые практически не влияют на аутентичность речи.

Схема вокодера

Анализатор

  А - анализатор спектра

  Т-Ш - выделитель сигнала тон-шум

  ВОТ - выделитель основного тона

  УО - устройство объедин. сигналов

 

  КС - канал связи

 

Синтезатор

  УР - устройство разъед. сигналов

  С - синтезатор спектра

  П - переключатель вида спектра

  ГОТ - генератор основного тона

  ГШ - генератор шума

2. Вокодеры.

Вокодеры можно разделить на два класа:- речеэлементные;- параметрические.

В речеэлементных вокодерах при кодировании распознаются произносимые элементы речи (например, фонема) и на выход кодера подаются только их номера. В декодере эти элементы создаются по правилам речеобразования или берутся из памяти декодера. Фонемные вокодеры предназначены для получения предельной компрессии речевых сигналов. Область применения фонемных вокодеров - линии командной связи, управление и говорящие автоматы информационно-справочной службы. В таких вокодерах происходит автоматическое распознавание слуховых образов, а не определение параметров речи и, соответственно, теряются все индивидуальные особенности диктора.

Вообще вокодер (от английских слов voice-голос и coder-кодер) представляет собой устройство, которое совершает параметрическое компандирование речевых сигналов.

Компрессия речевых сигналов в кодере осуществляется в анализаторе, который выделяет с речевого сигнала параметры, которые медленно меняются. В декодере при помощи местных источников сигналов, которые управляются принятыми параметрами, синтезируется речевой сигнал.

В параметрических вокодерах с речевого сигнала выделяют два типа параметров и по этим параметрам в декодере синтезируют речь: - Параметры, которые характеризуют источник речевых колебаний (генераторную функцию) - частота основного тона, ее изменение во времени, моменты появления и исчезновения основного тона (огласованные или гортанные звуки), шумового сигнала (шипящие и свистящие звуки); - Параметры, которые характеризуют огибающую спектра речевого сигнала.

В декодере, соответственно, по заданным параметрам генерируются основной тон, шум, а затем пропускаются через гребенку полосовых фильтров для восстановления огибающей спектра речевого сигнала.

По принципу определения параметров фильтровой функции различают вокодеры:- полосные (канальные);- формантные; - ортогональне.

В полосных вокодерах спектр речи делится на 7 - 20 полос (каналов) аналоговыми или цифровыми полосовыми фильтрами. Большее число каналов в вокодере дает большую натуральность и разборчивость. С каждого полосового фильтра сигнал поступает на детектор для определения среднего уровня. В формантных вокодерах огибающая спектра речи описывается комбинацией формант (резонансных частот голосового тракта). Основные параметры формант - центральная частота, амплитуда и ширина спектра.

В ортогональных вокодерах огибающая мгновенного спектра разлагается на составные части в ряд по выбранной системе ортогональных базисных функций. Рассчитанные коэффициенты этого расписания передаются на приемную сторону. Распространение получили гармонические вокодеры, которые используют расписание в ряд Фуръе. Рассмотренные вокодеры обеспечивают сжатие сигнала до 1200-4800 Бит/с, позволяя восстановить в декодере частоту основного тона с дискретностью в несколько герц и с невысокой точностью огибающую спектра сигнала с периодом изменения 16-40 мс, при этом даже при достаточно высокой разборчивости речи теряются многие индивидуальные особенности диктора.

Из-за сложности определения параметров генераторной функции появились полувокодеры (Voice Excited Vocoder, VEV), в которых вместо сигналов основного тона используется полоса речевого сигнала до 800 - 1000 Гц, которая кодируется, например, АДИКМ, и вместо характеристик основного тона передается на выход кодера. Такой алгоритм позволяет сжать речь до 4800-9600 бит/с, сохраняя генераторную функцию гортани (частоту и закон изменения основного тона) диктора.