Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Понятие о кодировании.doc
Скачиваний:
1
Добавлен:
20.11.2019
Размер:
218.62 Кб
Скачать

Понятие о кодировании

Кодирование – это представление символов из одного алфавита символами из другого алфавита, более удобными для передачи. Сообщения передаются в виде сигналов, имеющих определенную форму и последовательность. В телеграфе сообщение обычно передается при помощи алфавитов, цифр или алфавита и цифр вместе. Сигналы следуют в определенной последовательности. Например, в коде Морзе каждой букве и цифре соответствует некоторая последовательность кратких (точки) и длинных (тире) посылок тока, разделяемых кратковременными паузами по длительности такими же, как и точки. Пробел между буквами при этом изображается выключением тока на три единицы времени, а пробел между словами — на шесть единиц времени. Если обозначить тире 1, а точки 0, то образец этого кода виден в таблице.

По коду Бодо, применявшемуся в буквопечатающих аппаратах, каждой букве соответствует сигнал из пяти импульсов одинаковой длительности и формы. Пример кодировки символов также приведен в таблице. Этот код равномерен, так как на передачу каждого символа требуется одинаковое время.

При передаче сигналов, определяемых некоторыми случайными процессами, возможна дискретизация сигнала по времени и амплитуде, а возможна передача коэффициентов разложения сигнала по некоторым базисным функциям (гармоническим, вейвлет-функциям и другим). В любом случае на принимающей стороне необходимо восстанавливать сигнал в исходной форме.

Таблица 4.2

Примеры кодов Морзе и Бодо

А

Б

В

Г

Д

Код Морзе

01

1000

011

110

100

Код Бодо

10000

00110

01101

01010

11110

Следует различать способ кодирования и способ модуляции сигнала или сообщения.

Так, рассмотренные коды Морзе и Бодо – двоичные, т.е. имеют двоичное основание: сообщения передаются с помощью посылки сигнала (тока) или его отсутствия. Могут быть троичные коды, когда используются посылки положительного и отрицательного знака и отсутствие посылки, пятеричные и т.д. Единичная посылка сигнала может быть в виде напряжения постоянного или переменного тока (радиоимпульса). Наконец, можно передавать тире тремя импульсами, а точку — отсутствием импульсов.

В первом случае имеет место модулированный сигнал постоянного тока, во втором сигнал переменного тока, модулированный прямоугольным напряжением, так называемый радиоимпульс (если частота наполнения лежит в диапазоне радиочастот). Наконец, в последнем случае имеет место кодо-импульсная модуляция. Помимо рассмотренных, могут быть и другие виды модуляции.

По физической природе сигналы могут быть электрические, акустические, механические, радиолокационные и пр. В данном курсе не исследуются ни физическая природа сигналов, ни виды модуляции.

4.3 Оптимальный код Шеннона – Фено

Рассмотрим кратко понятие об оптимальном кодировании символьных сообщений.

Для построения оптимального кода Шеннона – Фено все символы алфавита располагаются в порядке убывания вероятности их появления. Символу, встречающемуся чаще всего, присваивается наиболее короткая комбинация. В английском языке чаще всего встречается буква (смотри таблицу 4.1).Этой букве отведена самая короткая кодовая комбинация – точка. В русском языке наиболее повторима буква О , но ей отведена далеко не самая короткая кодовая комбинация – три тире. В этом смысле для русского языка принятая система кодирования в азбуке Морзе не является оптимальной.

Оптимальным считается код, имеющий минимальную среднюю длину , причем

,

где суммирование выполняется по всем символам алфавита; – длина кодовой комбинации, равная числу ее элементов, соответствующая -му символу алфавита; – вероятность появления в сообщениях данного ансамбля -го символа; при этом

.

Здесь будут рассмотрены только двоичные коды, хотя все изложенное справедливо и для других кодов.

Пример. Рассмотрим таблицу 4.3, в которой приведен алфавит, состоящий из шести символов (сообщений).

Таблица 4.3