Алгоритм rle

В основу этого алгоритма положен принцип выявления повторяющихся последовательностей данных и замены их простой структурой, в которой указхывается код данных и коэффициент повтора.

Например, для последовательности: 0; 0; 0; 127; 127; 0; 255; 255; 255; 255 (всего 10 байт) образуется следующий вектор:

Значение	Коэффициент повтора
0	3
127	2
0	1
255	4

При записи в строку он имеет вид: 0; 3; 127;2; 0; 1; 255;4 (всего 8 байт).

В данном примере коэффициент сжатия равен 8/10, т.е. экономия объема составляет 20 %.

Программные реализации алгоритмов RLE отличаются простотой, высокой скоростью работы, но в среднем обеспечивают недостаточное сжатие. Наилучшими объектами для данного алгоритма являются графические файлы, в которых большие одноцветные участки изображения кодируются длинными последовательностями одинаковых байтов. Этот метод также может давать заметный выигрыш на некоторых типах файлов баз данных, имеющих таблицы с фиксированной длиной полей. Для текстовых файлов данных методы RLE, как правило, не эффективны.

Алгоритм kwe

В основу алгоритмов кодирования по ключевым словам положено кодирование лексических единиц исходного документа группами байтов фиксированной длины. Примером лексической единицы может служить слово. Результат кодирования сводится в таблицу, которая прикладывается к результирующему коду и представляет собой словарь. Обычно для англоязычных текстов принято использовать двухбайтовую кодировку слов. Образующиеся при этом пары байтов называют токенами.

Эффективность данного метода существенно зависит от длины документа, поскольку из-за необходимости прикладывать к архиву словарь длина кратких документов не только не уменьшается, но даже возрастает.

Данный алгоритм наиболее эффективен для англоязычных текстовых документов и файлов баз данных. Для русскоязычных документов, отличающихся увеличенной длиной слов и большим количеством приставок, суффиксов и окончаний, не всегда удается ограничится двухбайтовыми токенами, и эффективность заметно снижается.

Алгоритм Хаффмана

В основе этого алгоритма лежит кодирование не байтами, а битовыми группами:

перед началом кодирования производится частотный анализ кода документа и выявляется частота повтора каждого из встречающихся символов;
чем чаще встречается тот или иной символ, тем меньшим количеством битов он кодируется;
образующаяся в результате кодирования иерархическая структура прикладывается к сжатому документу в качестве таблицы соответствия.

Пример кодирования символов русского алфавита представлен на рис.1.

1 бит

2 бит

0010

0011

4 бит

000100

000101

000110

000111

6 бит

8 Значений

бит ……………………… ……………………….

16 Значений

0 бит ……………………… ………………………

…………………………………………………………………………………….

128 Значений

16 бит ………………………. ……………………..

Рис..1. Пример побуквенного кодирования русского алфавита по алгоритму Хаффмана

Как видно из схемы, представленной на рис.1, используя 16 бит, можно закодировать до 256 различных символов. Однако ничто не мешает использовать и последовательности длиной до 20 бит – тогда можно закодировать до 1024 лексических единиц (это могут быть не символы, а группы символов, слоги и даже слова).

В связи с тем, что к сжатому архиву необходимо прикладывать таблицу соответствия, на файлах малых размеров алгоритм Хаффмана малоэффективен. В среднем, наиболее эффективными оказываются архивы с размером словаря от 512 до 1024 единиц (длина кода до 18-20 бит).

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 3132 / 3832 33 34 35 36 37 38 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
25.03.2016195.58 Кб36Lektsia_4.doc
#
29.05.20153.77 Mб9Lektsia_Benziny.pdf
#
29.05.20151.83 Mб18Lektsia_Zubchatye_peredachi_i_kolesa.pdf
#
25.03.2016434.69 Кб12Lektsii_1_chast.doc
#
25.03.20161.19 Mб19Lektsii_2_chast.doc
#
29.05.20152.42 Mб23Lektsii_po_Informatike.doc
#
29.05.20151.07 Mб88Lektsii_SPIiVT.doc
#
29.05.20151.25 Mб15Lek_1_ELEKTROSTATIKA.pdf
#
29.05.2015474.86 Кб16Lek_2_DIELEKTRIKI_V_ELEKTRIChESKOM_POLE.pdf
#
29.05.2015426.06 Кб14Lek_3_PROVODNIKI_V_ELEKTRIChESKOM_POLE.pdf
#
29.05.2015644.51 Кб13Lek_4_ELEKTROEMKOST.pdf