Архивация данных



 

@ Архивация данных – это слияние нескольких файлов и даже каталогов в единый файл – архив.

@ Сжатие данных представляет собой сокращение объема исходных файлов путем устранения избыточной информации.

Существуют различные алгоритмы архивации данных без потери информации.

Самый простой алгоритм сжатия данных основан на замене повторяющихся битов (в тексте может иметься последовательность одинаковых символов, в графическом файле – закрашенная одним цветом область и т.д.). Алгоритм кодирования одинаковых последовательностей символов ищет в текстовых файлах одинаковые слова, а в графических - одинаковые «узоры». Каждый такой фрагмент файла представляется определенным кодом (последовательностью бит) и в процессе архивации при повторных появлениях заменяется ссылкой на первичный код.

Задачи архивации данных

1. Уменьшение объема файлов. Эта задача выполняется с помощью рассмотренных выше методов сжатия.

2. Резервное копирование. В процессе эксплуатации компьютера не исключены ситуации, которые грозят необратимой потерей информации (неисправность устройства накопителя).

3. Архивация данных при шифровании. Эта операция выполняется с целью уменьшить вероятность взлома криптосистемы.

Архиваторы

@ Архиваторы – это  программы, позволяющие создавать, за счет специальных методов сжатия, копии файлов меньшего размера и объединять копии нескольких файлов в один архивный файл, а также распаковывать архивы (извлекать файлы из архива).

Наиболее популярные форматы архивов

ZIP - еще со времен ОС DOS один из самых популярных и распространенных архивных форматов, основанный на алгоритмах сжатия предложенных в 80-х годах прошлого столетия израильскими математиками Лемпелем и Зивом. Он отличается приемлемой степенью сжатия информации и достаточно высоким быстродействием. Сегодня он является стандартом де-факто в Интернете, и его поддерживают практически все программы-архиваторы.

RAR - разработан российским программистом Евгением Рошалем и позволяет получить размер сжатого файла гораздо меньший, чем ZIP, но ценой этому является более продолжительный процесс обработки архива. В целом формат RAR значительно лучше других оптимизирован для решения сложных задач с использованием большого количества файлов и гигабайтных дисковых пространств.

CAB - применяется в продуктах Microsoft как стандартный для упаковки файлов, причем его алгоритм, нигде не опубликованный, представляет собой достаточно совершенный продукт, имеющий высокий коэффициент сжатия.

GZIP, TAR - получили наибольшее распространение в системах на базе Unix и ее самой популярной разновидности Linux.

ACE - достаточно новый формат с высокой степенью сжатия, завоевывающий все большую популярность.






Комментариев пока нет!

Поделитесь своим мнением

Сумма: код подтверждения