Архивация данных

Автор работы: Пользователь скрыл имя, 23 Апреля 2015 в 22:58, контрольная работа

Описание работы

Целью использования архиваторов является создание резервных копий документов. Создание электронных архивов; Перенос данных из одного ПК на другой. Передача данных по сети.
Для человека избыточность данных часто связана с качеством информации, поскольку избыточность, как правило, улучшает понятность и восприятие информации

Файлы: 1 файл

Информатика. контрольная работа0.doc

— 101.67 Кб (Скачать файл)
file:///C:/A5408E30/file1344.htm

Attachment: Attachment 
Attachment: Attachment 
Attachment: Attachment 
 

 

ИНСТИТУТ ДИСТАНЦИОННОГО ОБУЧЕНИЯ

 

 

 

 

Задание.

 

Архивация данных. Принципы сжатия данных, программное обес­печение и его основные характеристики.

 

 

 

1.     Введение

 

2.     Основная часть

 

3.     Заключение.

 

4.     Введение должно содержать актуальность темы, цели и задачи работы. Заключение – основные выводы работы. Объем работы не менее 10 страниц.

 

Реферат должен обязательно включать следующие элементы: списки, сноски.

 

Все когда-нибудь кончается, в том числе и компьютерная память. Каким бы  большим ни был ваш жесткий диск, придет момент, когда вы не сможете записать на него новую программу или данные. Так что рано или поздно может случиться неприятная ситуация, в результате которой операционная система станет неработоспособной или будут утрачены важные данные. Один из способов экономии памяти на диска х - это использование программ-архиваторов, которые «сжимают» (пакуют) файлы. Целью использования архиваторов является создание резервных копий документов. Создание электронных архивов; Перенос данных из одного ПК на другой. Передача данных по сети.

 

Для человека избыточность данных часто связана с качеством информации, поскольку избыточность, как правило, улучшает понятность и восприятие информации. Однако, когда речь идет о хранении и передаче информации средствами компьютерной техники, то избыточность играет отрицательную роль, поскольку она приводит к возрастанию стоимости хранения и передачи информации. Особенно актуальной эта проблема стает в случае обработки огромных объемов информации при незначительных объемах носителей данных. В связи с этим, постоянно возникает проблема уменьшения избыточности или сжатия данных. Если методы сжатия данных применяются к готовым файлам, то часто вместо термина "сжатие данных" употребляют термин "архивация данных", сжатый вариант данных называют архивом, а программные средства, которые реализуют методы сжатия называются архиваторами.

 

Архивация – это создание архивного файла, в который включены все исходные файлы и папки с одновременным сжатием информации (упаковкой) для сокращения занимаемого места на диске. При этом следует четко представлять различие в архивации и упаковке (сжатии) данных. Архивация – это объединение нескольких файлов в единый архивный файл, а упаковка (сжатие) – это сокращение объема исходных файлов без потерь информации и возможностью точного восстановления оригинала.

 

Для архивирования используются программы-архиваторы.

 

Архиваторы – это программы для создания архивов. Архивы предназначены для хранения данных в удобном компактном виде. В качестве данных обычно выступают файлы и папки. Как правило, данные предварительно подвергаются процедуре сжатия или упаковки. Поэтому почти каждый архиватор одновременно является программой для сжатия данных. С другой стороны, любая программа для сжатия данных может рассматриваться как архиватор. Эффективность сжатия является важнейшей характеристикой архиваторов. От нее зависит размер создаваемых архивов. Чем меньше архив, тем меньше места требуется для его хранения. Для передачи нужна меньшая пропускная способность канала передачи или затрачивается меньшее время. Преимущества архивов очевидны, если учесть, что данные уменьшаются в размере и в 2 раза, и в 5 раз.

 

Архивные файлы – это документы, рисунки и др. файлы, которые специально сжаты (упакованы) с целью более рационального размещения на дискете или для передачи по электронной почте через интернет. При этом архивный файл занимает в несколько раз меньше места (иногда в 10 - 100 раз!) и может быть свободно размещен на дискете или более быстро отправлен по электронной почте (вместо 10мин. – 1-2 мин.)

 

Сжатие данных используется очень широко. Можно сказать, почти везде. Например, документы PDF , как правило, содержат сжатую информацию. Довольно много исполняемых файлов EXE сжаты специальными упаковщиками. Всевозможные мультимедийные файлы ( GIF , JPG , MP 3, MPG ) являются своеобразными архивами.

 

Основным недостатком архивов является невозможность прямого доступа к данным. Их сначала необходимо извлечь из архива или распаковать. Операция распаковки, впрочем, как и упаковки, требует некоторых системных ресурсов. Это не мгновенная операция. Поэтому архивы в основном применяют со сравнительно редко используемыми данными. Например, для хранения резервных копий или установочных файлов.

 

Существует два основных метода архивации:

 

Алгоритм Хаффмана.В основе алгоритма Хаффмана лежит идея кодирования битовыми группами. Сначала проводится частотный анализ входной последовательности данных, то есть устанавливается частота вхождения каждого символа, встречащегося в ней. После этого, символы сортируются по уменьшению частоты вхождения.  Основная идея состоит в следующем: чем чаще встречается символ, тем меньшим количеством бит он кодируется. Результат кодирования заносится в словарь, необходимый для декодирования. Рассмотрим простой пример, иллюстрирующий работу алгоритма Хаффмана.

 

Пусть задан текст, в котором бурва 'А' входит 10 раз, буква 'В' — 8 раз, 'С'— 6 раз , 'D' — 5 раз, 'Е' и 'F' — по 4 раза. Тогда один из возможных вариантов кодирования по алгоритму Хаффмана приведен в таблицы 1.

 

Символ

 

Частота вхождения

 

Битовый код

 

A

 

10

 

00

 

B

 

8

 

01

 

C

 

6

 

100

 

D

 

5

 

101

 

E

 

4

 

110

 

F

 

4

 

111

 


 

Как видно из таблицы 1, размер входного текста до сжатия равен 37 байт, тогда как после сжатия — 93 бит, то есть около 12 байт (без учета длины словаря). Коэффициент сжатия равен 32%. Алгоритм Хаффмана универсальный, его можно применять для сжатия данных любых типов, но он малоэффективен для файлов маленьких размеров (за счет необходимости сохранение словаря).

 

 

 

На практике программные средства сжатия данных синтезируют эти три "чистых" алгоритмы, поскольку их эффективность зависит от типа и объема данных. В таблице 2 приведены распространенные форматы сжатия и соответствующие им программы и—архиваторы, использующиеся на практике.

 

 

 

Операционная система MS DOS

 

 

Операционная система Windows

 

 

Формат сжатия

 

Программа архивации

 

Программа разархивации

 

Программа архивации

 

Программа разархивации

 

ARJ

 

Arj.exe

 

Arj.exe

 

WinArj.exe

 

WinArj.exe

 

RAR

 

Rar.exe

 

Unrar.exe

 

WinRar.exe

 

WinRar.exe

 

ZIP

 

Pkzip.exe

 

Pkunzip.exe

 

WinZip.exe

 

WinZip.exe

 


 

Кроме того, современные архиваторы предоставляют пользователю полный спекр услуг для работы с архивами, основными из которых являются:

 

1.       создание нового архива;

 

2.       добавление файлов в существующий архив;

 

3.       распаковывание файлов из архива;

 

4.       создание самораспаковающихся архивов (self—extractor archive);

 

5.   создание распределенных архивов фиксированного размера для носителей маленькой емкости;

 

6.       защита архивов паролями от несанкционированного доступа;

 

7.       просмотр содержимого файлов разных форматов без предварительного распаковывания;

 

8.       поиск файлов и данных внутри архива;

 

9.       проверка на вирусы в архиве к распаковыванию;

 

10.   выбор и настройка коэффициента сжатия

 

Алгоритм Лемпеля-Зива. Классический алгоритм Лемпеля-Зива – LZ77, названный так по году своего опубликования. Он формулируется следующим образом : «если в более раннем тексте уже встречалась подобная последовательность байт, то в архивный файл записывается только ссылка на эту последовательность (смещение, длина), а не сам текст». Так фраза «КОЛОКОЛ_ОКОЛО_КОЛОКОЛЬНИ» [24] закодируется в последовательность «КОЛО(-4,3)_О(-6,4)_(-7,7)ЬНИ» [13]. Коэффициент сжатие - 54%. Аналогично сжимается изображение. Большие области одного цвета заменяются на ссылку: (цвет, длина) Графические файлы сжимаются очень хорошо– в 100–200 раз

 

Типы архивных файлов

 

В файловой системе компьютера архивные файлы имеют строго заданный тип (расширение). Так, наиболее часто встречающиеся архивы имеют тип: ZIP, RAR, ARJ. Кроме них на компьютерах используются архивы: CAB, LZH, TAR, GZ, UUE, BZ2, ISO…

 

Архивный файл

 

Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержаться в архиве. В оглавлении архива для каждого содержащегося в нем файла храниться следующая информация:

 

- имя файла;

 

- сведения о каталоге, в котором содержится файл;

 

- дата и время последней модификации файла;

 

- размер файла на диске и в архиве;

 

- код циклического контроля для каждого файла, используемый для проверки целостности архива;

 

Определить с помощью, какой программы был заархивирован тот или другой архивный файл, можно при помощи расширения. Например:

 

- game.rar – заархивирован при помощи архиватора WinRAR;

 

- game.arj – заархивирован при помощи архиватора ARJ;

 

- game.zip - заархивирован при помощи архиватора ZIP.

 

Разные программы отличаются форматом архивных файлов, скоростью работы, степенью сжатия файлов при помещении в архив, удобством использования.

 

Архиваторы MS DOS

 

С развитием компьютера стали увеличиваться и объемы информации хранимой в нем, что в свою очередь привело к развитию технологий по хранению этой информации в сжатом виде, то есть в архивах. Для этого было придумано множество программ осуществляющих архивацию информации.

 

Наиболее известные программы-архиваторы для MS-DOS: ARJ (разработчик - Robert K. Jung), PKZIP(компания PKWARE Inc.), IHA (Haruyasu Yoshizaki), ZOO (Rahul Dhesi). Безусловным лидером во всем мире за последние 5 лет стал архиватор RAR. В настоящее время RAR активно вытесняет ZIP как основную утилиту сжатия FTP архивов в сети INTERNET. RAR является единственной всемирно используемой программой, созданной русским программистом (за исключением TETRIS). Все архиваторы отличаются используемыми алгоритмами сжатия, форматами архивных файлов, скоростью работы и т.д.

 

ARJ

 

Программа ARJ (разработчик - Robert K. Jung) относится к числу наиболее известных продуктов своего класса. Она выполняет все функции по обслуживанию своих, архивов, может помещать файлы в архив, извлекать файлы из архива, и делать «саморизвлекающиеся» файлы и так далее.

 

 

 

Назначение архиватора ARJ

 

Программа ARJ позволяет:

 

- создавать архивные файлы из отдельных или всех файлов текущего каталога и его подкаталогов, загружая в один архив до 32000 файлов;

 

- добавлять и заменять файлы в архиве;

 

- извлекать и удалять файлы из архива;

 

- просматривать содержимое архива;

 

- создавать многотомный архив;

 

- защищать каждый из помещенных в архив файлов 32-битовым циклическим кодом, тестировать архив, проверяя сохранность в нем информации;

 

- получать помощь по работе на 3 международных языках;

 

- вводить в архив комментарии к файлам;

 

- запоминать в архиве пути к файлам;

 

- сохранять в архиве несколько поколений (версий) одного и того же файла;

 

- переупорядочивать архивный файл по размерам файлов, именам, расширениям, дате и времени модификации, коэффициенту сжатия и др.;

 

- осуществлять поиск строк в архивированных файлах;

Информация о работе Архивация данных