Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекция Понятие архивации.doc
Скачиваний:
4
Добавлен:
22.11.2019
Размер:
135.68 Кб
Скачать

9

Понятие архивации данных и работа с архивами

Архивация - это сжатие (упаковка) файла или группы файлов с целью уменьшения их объема.

Архивация проводится в следующих случаях:

  1. Когда необходимо создать резервные копии наиболее ценных  файлов

  2. Когда необходимо освободить место на диске

  3. Когда необходимо передать файлы по E-mail

Сжатые папки занимают меньше места на диске и быстрее переносятся на другие компьютеры. Пользователи могут работать с содержащимися в сжатых папках файлами и программами так же, как и с содержащимися в обычных папках

Объекты сжатия

В зависимости от того, в каком объекте размещены данные, подвергаемые сжатию, различают:

  1. уплотнение (архивацию) файлов;

  2. уплотнение (архивацию) папок;

  3. уплотнение дисков.

Уплотнение файлов применяют для уменьшения их размеров при подготовке к передаче по каналам электронных сетей или к транспортировке на внешнем носителе малой емкости, например на гибком диске.

Уплотнение папок используют как средство архивации данных перед длительным хранением, в частности, при резервном копировании.

Уплотнение дисков служит целям повышения эффективности использования их рабочего пространства и, как правило, применяется к дискам, имеющим недостаточную емкость.

Основные понятия

Исходный файл. Файл, подвергаемый сжатию.

Архивный файл представляет собой набор из нескольких файлов (одного файла), помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде.

Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве. В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:

  • Имя файла

  • Размер файла на диске и в архиве

  • Сведения о местонахождения файла на диске

  • Дата и время последней модификации файла

  • Код циклического контроля для файла, используемый для проверки целостности архива

  • Степень сжатия

Основными техническими характеристиками процессов сжатия и результатов их работы являются:

* степень сжатия.

* скорость сжатия,

* качество сжатия.

Коэффициент сжатия характеризует степень сжатия информации, а именно процентное отношение сжатого (архивного) файла по отношению к исходному.

Непрерывные архивы

Непрерывный архив — это архив, упакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных (Непрерывная архивация поддерживается только в формате RAR, для формата ZIP такого типа архива не существует).

Непрерывная архивация значительно увеличивает степень сжатия, особенно при добавлении в архив значительного количества небольших файлов с похожим содержимым.

Однако следует иметь в виду, что у непрерывной архивации есть и некоторые недостатки:

  • обновление непрерывных архивов (т.е. добавление файлов в уже существующий архив или их удаление) происходит медленнее, чем обычных;

  • чтобы извлечь один файл из непрерывного архива, приходится анализировать все предыдущие заархивированные файлы, поэтому извлечение отдельных файлов из середины непрерывного архива происходит медленнее, чем извлечение из обычного архива;

  • если в непрерывном архиве какой-либо файл окажется поврежденным, то не удастся извлечь и все файлы, следующие после него. Поэтому при сохранении непрерывного архива на ненадежном носителе (например, на дискете) рекомендуется добавлять информацию для восстановления.

Непрерывные архивы предпочтительнее использовать в тех случаях, когда:

  • архив предполагается редко обновлять;

  • планируете чаще распаковывать весь архив, нежели извлекать из него один или несколько файлов;

  • нужно достичь более плотной степени сжатия, даже в ущерб скорости упаковки.

Непрерывными могут быть также многотомные и самораспаковывающиеся архивы.

Архивный том. При создании архивной копии на носителях малой емкости архивный файл может «нарезаться» на фрагменты, равные емкости отдельных носителей. Каждый из таких фрагментов называется архивным томом. Все тома одного архивного файла обычно имеют одинаковые имена.

(Непрерывная архивация поддерживается только в формате RAR, для формата ZIP такого типа архива не существует).

Самораспаковывающиеся архивы

Самораспаковывающийся архив (SFX, от англ. SelF-eXtracting) - это архив, к которому присоединен исполняемый модуль. Этот модуль позволяет извлекать файлы простым запуском архива как обычной программы. Таким образом, для извлечения содержимого SFX-архива не требуется дополнительных внешних программ. Достаточно запустить исполнение файла .ЕХЕ, и архив автоматически распакуется в выбранную папку.

SFX-архивы удобны в тех случаях, когда нужно передать кому-то архив, но вы не уверены, что у адресата есть соответствующий архиватор для его распаковки.

Теоретические основы сжатия данных

Характерной особенностью большинства «классических» типов данных, с которыми традиционно работают люди, является определенная избыточность. Степень избыточности зависит от типа данных. Например, у видеоданных степень избыточности обычно в несколько раз больше, чем у графических данных, а степень избыточности графических данных в несколько раз больше, чем текстовых. Кроме того, степень избыточности данных зависит от принятой системы кодирования. Так, например, можно сказать, что кодирование текстовой информации средствами русского языка (с использованием русской азбуки) дает в среднем избыточность на 20-30% больше, чем кодирование адекватной информации средствами английского языка.