9.4. Методы эффективного кодирования при неизвестной статистике сообщений

Коды, экономичные одновременно для некоторого класса источников, называют универсальными кодами. Сформулируем постановку задачи универсального кодирования источников. Предположим, что алфавит состоит из двух букв a₁ и a₂, появляющихся независимо с вероятностями p, q=1-p. Однако величина p заранее неизвестна. Требуется построить код, для которого среднее число символов «0» и «1» на одну букву алфавита приближалось бы к H(A) при любом p, 0<=p<=1. Этот код строится так. Множество всех блоков длины n в алфавите A разбиваем на группы, которые имеют одинаковые вероятности при любом р. Таких групп будет ровно n+1. В нулевой группе отсутствует буква a₂, она состоит из единственного блока а₁а₁...а₁, вероятность появления которого рⁿ.

Первая группа состоит из всех блоков длины n, содержащих одну букву а₂. Эта группа состоит из С_п¹=п блоков, вероятность каждого из которых равна рⁿ^-1q. Группа с номером k состоит из всех блоков длины п, содержащих k букв a₂. Эта группа содержит п блоков, вероятность каждого из которых рⁿ^-^k<q^k.

Универсальный код для k-й группы состоит из двух частей: префикса и суффикса. Префикс содержит log₂(n+1) двоичных знаков. Префикс указывает, к какой группе сообщений принадлежит кодируемый блок, суффикс содержит log C_n^k двоичных символов и указывает номер блока в группе. Построенный таким образом код будет однозначно дешифруем. На приемном конце первоначально по log(n+1) элементам кода определяют, к какой группе принадлежит переданное сообщение, а затем по следующим log C_n^k элементам определяют, какое именно сообщение передавалось.

Код 1 в таблице 7 построен описанным выше способом. Здесь выделены штриховой линией префиксы. Этот метод кодирования называется комбинаторным.

Префикс каждой из групп при комбинаторном кодировании содержит ровно log(n+1) символов «0» и «1». Еще большего эффекта можно достичь, если префикс кодировать неравномерным кодом (Рисунок 1). Код 2 в таблице 7 построен именно этим методом. Универсальные методы кодирования хороши не только тем, что они экономичны для любого распределения вероятностей, но и достаточно просто реализуются. Для универсального кодирования на передающем и приемном концах не обязательно знать таблицу, которая определяет кодирование.

Код каждого блока вычисляется по мере поступления на кодирующее устройство букв а₁и а₂. На приемном конце также можно декодировать, не прибегая к таблицам. При этом число операций на кодирование и декодирование блока длины п не превосходит п³.

Таблица 7 - Кодирование при неизвестной статистике сообщений

Из приведенного выше описания метода кодирования видно, наиболее трудоемкой частью кодирования является нахождение суффикса. Опишем алгоритм нахождения суффикса. Пусть в блоке А длины п буква а₁ встречается на местах i₁, i₂, …, i_r, тогда суффиксом для А назовем число N(A), вычисляемое по правилу:

(9)

Очевидно, что блоки с разными наборами (i₁, …, i_r) получают разные номера. При этом максимальное значение номера равно

(10)

Таким образом, двоичная запись номера (суффикса) должна иметь длину | log C_n^r |.

Для нахождения N(A) воспользуемся таблицей биноминальных коэффициентов (треугольником Паскаля):

8	7	81	35	35	21	7	1	0
7	6	15	20	15	6	1	0
6	5	10	10	5	1	0
5	4	6	4	1	0
4	3	3	1	0
3	2	1	0
2	1	0
1	0

Элементы этой таблицы вычисляются по мере надобности либо размещаются в памяти кодирующего устройства.

Приведем фрагмент этой таблицы, в которой на пересечении i-й строки и j-го столбца стоит .

Пример 3. Пусть n=8, A=a₂a₁a₁a₂a₁a₁a₂a₁ тогда r=5; i₁=2, i₂=3, i₃=5, i₄=6, i₅=8. Тогда номер блока N(A)=С₁¹+С₂²+С₄³+С₅⁴+С₇⁵. Слагаемые в N(А) находим, используя таблицу дополнительных коэффициентов. Они выделены жирным шрифтом. Таким образом, N (А)=1+1+4+5+21=32 или в двоичной записи N(А)=100000.

Декодирование производится с помощью этой же таблицы.

Пример 4. Пусть нам известно, что длина передаваемого блока равна 8, и что в блоке пять букв а₁ (количество букв в блоке находим по префиксу). Находим максимальное число в 5-м столбце, не превосходящее 32, это 21=С⁵_8-1, следовательно, i₅=8, находим разность 32—21=11. Находим далее максимальное число 4-го столбца, не превосходящее 11. Это 5=C⁴_6-1 т. е. i₄=6. Аналогично находим i₃=5, i₂=3, i₁=2. Следовательно, декодированное сообщение имеет вид

A=a₂a₁a₁a₂a₁a₁a₂a₁, т.е. совпадает с переданным.

Рассмотренные кодирование и декодирование достаточно просто осуществляются с помощью специализированных вычислительных средств.

<<< < Предыдущая 1 2 3 45 / 215 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.04.201553.25 Кб12Билеты ОКПУ.doc
#
26.08.2019304.64 Кб43Билеты управление проектами.doc
#
05.05.2015542.24 Кб12Блинков_ВЕ-31б_Отчет_Лаб-4 (ОТЦ).pdf
#
07.09.20191.26 Mб11Богаткина Е. А. Оценка экономической эффект-ти...doc
#
07.05.2019545.28 Кб44Будылдина Н. В. Основы передачи дискретных сооб...doc
#
22.11.20183.02 Mб59Будылдина Н. В. Помехоустойчивое кодирование в....doc
#
15.04.20191.92 Mб15Булдакова Р. А. Программное обеспечение ЦСК_200....doc
#
21.11.20194.63 Mб15ВАРИАНТ 13 - КТ208Д.doc
#
21.11.2019841.73 Кб7ВАРИАНТ 18 - КТ208Л.doc
#
21.11.2019821.76 Кб16ВАРИАНТ 27 - КТ301Ж.doc
#
21.11.20191.27 Mб26ВАРИАНТ 34 (2) - КТ201А (Б).doc