Добавил:

mihail1000 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Воронежский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

7qof31jgDC.file.О.doc

Скачиваний:

Добавлен:

30.04.2022

Размер:

1.48 Mб

Скачать

☆

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 2425 / 4125 26 27 28 29 30 31 32 33 34 35 36 37 > Следующая >>>

9.10. Методы кодирования

Под кодированием понимается замена элементов открытого текста (букв, слов, фраз и т.п.) кодами. Различают символьное и смысловое кодирование. При символьном кодировании каждый знак алфавита открытого текста заменяется соответствующим символом. Примером символьного кодирования служит азбука Морзе, а также методы шифрования заменой и перестановкой.

Рассмотрим метод символьного кодирования, который использует предыдущие символы открытого текста (метод стопки книг).

Предположим, что нужно передать сообщение X из алфавита А, в котором буквы алфавита отождествлены с числами 1,2,..L, где L – число элементов алфавита А. Каждой букве алфавита соответствует код k_i, i=1..L. При появлении в сообщении X очередной буквы х_j ее код представляется кодом номера позиции j, занимаемой в данный момент буквой х_j в списке. Это дает возможность на приемном конце по коду номера позиции j определить букву х_j. После кодирования буквы х_j одновременно на приемном и передающих концах перемещают букву х_j в начало списка, увеличивая тем самым на единицу номера букв, стоявших на позициях от 1 до j-1. Номера букв, стоявших на позициях от j+1 до L, остаются без изменений. В результате кодирования открытого текста в начале списка будут находиться буквы, которые наиболее часто встречались в открытом тексте.

Пример 17.

Открытый текст: «АБРАКАДАБРА».

Алфавит: {А,Б,Д,К,Р}.

Начальный список соответствует последовательности букв в алфавите и ему соответствует список кодов {К1,К2,КЗ,К4,К5}.

К1 А А Б P А К А Д А Б Р А

К2 Б Б А Б Р А К А Д А Б Р

К3 Д Д Д A Б Р Р К К Д А Б

К4 К К К Д Д Б Б Р Р К Д Д

К5 Р Р Р К К Д Д Б Б Р К К

¦ ¦

¦ начальный список

список кодов

Закодированное сообщение: «К1 К2 К5 К3 К5 К2 К5 К2 К5 К5 К3».

Смысловое кодирование – это кодирование, в котором в качестве исходного алфавита используются не только отдельные символы (буквы), но и слова и даже наиболее часто встречающиеся фразы.

Пример 17.

Открытый текст: «19.9.1992 ГОДА».

Таблица кодирования представлена в табл. 19.

Таблица 19

Элементы открытого текста	Коды
1	089 146 214 417
2	187 226 045 361
9	289 023 194 635
ГОД	031 155 217 473
.	786 432 319 157

Закодированное сообщение при одноалфавитном кодировании:

«89 289 786 289 786 089 289 289 187 031»

Закодированное сообщение при многоалфавитном кодировании:

«89 289 786 023 432 146 194 635 187 031».

Среди различных кодов, применяемых для кодирования естественных языков, особый интерес вызывает код Хаффмена, который позволяет сжимать открытый текст. Суть его состоит в присваивании наиболее часто встречающимся буквам наиболее коротких кодов.

Строка двоичных символов кодов Хаффмена единственным образом разлагается на коды.

9.11. Другие методы шифрования

Специфика применения ПЭВМ позволяет реализовать дополнительные методы кодирования для надежного закрытия содержимого файлов. Примером такого кодирования является метод рассечения-разнесения, в соответствии с которым содержимое одного файла разбивается на блоки, которые разносятся по нескольким файлам. Каждый такой файл не несет никакой информации, а сбор данных в единое целое осуществляется простой программой.

Пример 18.

Блок (файл открытого текста) начинается словами:

«МЕТОД_РАССЕЧЕНИЯ-РАЗНЕСЕНИЯ».

Для рассечения блока открытого текста на 8 частей запишем открытый текст в следующем виде:

	1	2	3	4
1	М	Е	Т	О
2	Д	_	Р	А
1	С	С	Е	Ч
2	Е	Н	И	Я
1	-	Р	А	З
2	Н	Е	С	Е
1	Н	И	Я	…

Для рассечения текста на 8 частей выбраны 2 строки и 4 столбца. Пусть столбцы s_j выбираются в последовательности {4,1,3,2}, а строки r_i– в последовательности (2,1}. Тогда номер k блока Ф_k, куда записывается очередной символ открытого текста, определяется по формуле:

k= (r_i-1)n+s_j,

где n – число столбцов.

Первый символ М запишется в блок с номером (_ri=2, s_j=4):

k=(2-1)*4+4=8;

второй символ E – в блок с номером (r_i=2, s_j=1);

k=(2-1)*4+1=5, и т.д.

Тогда блоки Ф_k, записанные в порядке номеров, будут содержать следующие символы: Ф₁=(_НЕ...), Ф₂=(АЯЕ...), Ф₃=(РИС..,), Ф₄={ДЕН...), Ф₅={ЕСРИ...}, Ф₆={ОЧЗ...), Ф₇={ТЕАЯ...), Ф₈={МС-Н...}. Таким образом, один блок открытого текста заменяется восемью блоками, которые в сумме дают длину исходного блока.

Методы сжатия данных осуществляют такое преобразование повторяющихся символов и строк символов, которое позволяет использовать для хранения данных меньший объем памяти.

Методы сжатия можно разделить на два класса: статические и динамические (адаптивные).

Методы статического сжатия данных эффективны, когда частоты появления символов изменяются незначительно. Методы динамического сжатия адаптивно отслеживают неравномерности частот появления символов с сохранением последовательности изменений вероятностей появления символов.

К статическим методам можно отнести код Хаффмена и метод стопки книг.

Адаптивные методы сжатия могут динамично реагировать на изменения в открытом тексте, происходящие по мере кодирования. Первые такие методы являлись модификацией кодов Хаффмена и использовали счетчики для хранения текущих частот появления каждого символа. При таких методах наиболее часто встречающиеся символы сдвигаются ближе к корню дерева и, следовательно, получают более короткие кодовые слова.

Кодирование Лемпеля-Зива использует синтаксический метод для динамического источника. Этот метод осуществляет синтаксический анализ символьных потоков, которые не превышают заданной длины, и строит таблицу отображения этих потоков в кодированные слова фиксированной длины. Длина кодового слова зависит от размера таблицы, используемой для хранения кодового отображения поток-слово. Например, размер таблицы в 4096 слов требует 12-битового кодового слова. Кодовое слово является просто табличным адресом соответствующих слов в таблице.

Каждый из методов кодирования может использоваться для защиты данных, особенно если используется свой (нестандартный) вариант метода сжатия данных. Стойкость кодирования повышается при использовании нескольких методов сжатия для одного блока открытых данных.

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 2425 / 4125 26 27 28 29 30 31 32 33 34 35 36 37 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
30.04.2022417.28 Кб57iBBvgAQ74.doc
#
30.04.20222.97 Mб57IBy8Vyee9.file.1.doc
#
30.04.2022367.1 Кб47NVzkPLEDc.file-1.doc
#
30.04.2022367.1 Кб27NVzkPLEDc.file.doc
#
30.04.20224.76 Mб67p68CmhFHt.doc
#
30.04.20221.48 Mб217qof31jgDC.file.О.doc
#
30.04.2022344.06 Кб47R4LLKY5yw-1.doc
#
30.04.2022344.06 Кб77R4LLKY5yw.doc
#
30.04.20226.3 Mб377TpJUjciVN.file.doc
#
30.04.2022484.35 Кб107UN2bypl3A-1.doc
#
30.04.2022484.35 Кб27UN2bypl3A.doc

	1	2	3	4
1	М	Е	Т	О
2	Д	_	Р	А
1	С	С	Е	Ч
2	Е	Н	И	Я
1	-	Р	А	З
2	Н	Е	С	Е
1	Н	И	Я	…

	1	2	3	4
1	М	Е	Т	О
2	Д	_	Р	А
1	С	С	Е	Ч
2	Е	Н	И	Я
1	-	Р	А	З
2	Н	Е	С	Е
1	Н	И	Я	…

	1	2	3	4
1	М	Е	Т	О
2	Д	_	Р	А
1	С	С	Е	Ч
2	Е	Н	И	Я
1	-	Р	А	З
2	Н	Е	С	Е
1	Н	И	Я	…