Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Кодирование информации.doc
Скачиваний:
39
Добавлен:
03.05.2015
Размер:
139.26 Кб
Скачать

Кодирование информации

Цель: Изучение информационной модели канала связи и эффективного кодирования информации.

Информационные сообщения для передачи по линиям связи необходимо кодировать. Это связано с тем, что по линиям связи необходимо передавать сообщения самой различной физической природы: цифровые данные, полученные от ЭВМ, речь, тексты, телеграммы, команды управления, результаты измерения различных физических величин и т. д. Все эти сообщения предварительно должны быть преобразованы и представлены в унифицированной форме, удобной для последующей передачи.

Большинство сигналов имеют аналоговое происхождение (речь, видео). Современные системы и сети передачи данных строятся на основе цифровых каналов связи. Поэтому аналоговые сигналы подвергаются преобразованию в цифровую форму – аналого-цифровому преобразованию. Такое преобразование является примером кодирования информации.

Рассмотрим кодирование именно дискретной информации.

Упрощенная схема передачи информации по дискретному каналу связи представлена на рисунке 1.

Рис.1. Схема дискретного канала передачи информации

Источник дискретных сообщений (ИДС) использует для представления информации алфавит . Символы исходного сообщения образуют первичный алфавит. Примером такого алфавита является латинский алфавит.

Кодер преобразует алфавит с объемом n символов в алфавит {a} объема m, удобный для передачи по каналу (чаще всего {a} - двоичный алфавит, включающий символы "1" и "0"). Символы, представляющие закодированное сообщение, образуют вторичный алфавит.

Правило однозначного преобразования символов первичного алфавита в символы вторичного алфавита называется кодом.

Основание кода (модуль) m определяется числом различимых символов в алфавите.

Простейший число-импульсный унитарный код имеет алфавит, состоящий из одних единиц, и применяется, например, в АТС для вызова абонента по телефону с помощью телефонного номеронабирателя.

Все другие коды имеют алфавит, состоящий из двух ("0" и "1") и более символов. Коды с основанием m = 2 называются двоичными или бинарным, с основанием m = 3 – троичными и т. д. При использовании в процессе кодирования электрических сигналов значение m определяет число различных градаций их амплитуды, фазы, частоты или других информативных параметров. Примеры кодов даны в Приложении 1.

В системах связи двоичные коды получили наиболее широкое применение из-за простой аппаратурной реализации устройств для передачи, опознавания и запоминания сообщений. Поэтому устройства с основанием m>2 применяются значительно реже.

Комбинация символов вторичного алфавита, соответствующая одному символу первичного алфавита, называется кодовым словом (кодовой комбинацией или вектором).

Длина кодовой комбинации – n – это разрядность кода или количество символов вторичного алфавита, необходимых для кодирования одного символа первичного алфавита. Код называется равномерным, если все кодовые комбинации одинаковы по длине (n = const), и неравномерным, если величина n в коде непостоянна (n = var).

Число кодовых комбинаций – N - в коде, каждая из которых может передавать свое отдельное сообщение. Значение N для кода с основанием m и числом элементов n определяется выражением

(1.4)

Если известны N и m, то длину кодовой комбинации можно вычислить по формуле

где -операция округления в сторону большего целого значения x

При кодировании каждый символ первичного алфавита пронумеровывается, и передача сообщений сводится к передаче последовательности чисел (кодовых слов, составленных из символов вторичного алфавита).

Например, для передачи русских букв от «А» до «Я» нужно передавать числа от 1 до 32. Поэтому число кодовых комбинаций . Если используется бинарное кодирование, то m=2. Тогда длина кодовой комбинации

Двоичные коды будут иметь вид

Символ первичного алфавита

Число

Двоичный код

А

0

00000

Б

1

00001

Я

31

11111

Традиционно для кодирования одного символа используется количество информации равное 1 байту (1 байт = 8 битов). Для кодирования одного символа требуется один байт информации.

Так как каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. (28=256)

Кодирование заключается в том, что каждому символу ставиться в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

Основные задачи кодирования:

  • Снижение объема сообщения (эффективное кодирование)

  • Обнаружение и исправление ошибок (помехоустойчивое кодирование)

  • Защита информации от несанкционированного доступа (шифрование информации)

Для решения этих задач разработано большое количество самых разнообразных кодов.