Сжатие информации

Автор работы: Пользователь скрыл имя, 15 Июня 2013 в 09:36, реферат

Краткое описание

Во многих стадиях информация, содержащаяся в файлах, избыточна. Для устранения избыточности используются специальные методы сжатия данных, основанные на поиске в файле избыточной информации и последующем ее кодировании с целью получения минимального объема.
Сжатие информации – это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения; процесс сокращения количества битов, необходимых для хранения и передачи некоторого объема информации.

Прикрепленные файлы: 1 файл

Сжатие информации. docx

— 3.17 Мб (Скачать документ)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Реферат по информатике

На тему: Сжатие информации.

 

 

1. Основные  понятия и методы сжатия данных

Во многих стадиях  информация, содержащаяся в файлах, избыточна. Для устранения избыточности используются специальные методы сжатия данных, основанные на поиске в файле  избыточной информации и последующем  ее кодировании с целью получения  минимального объема.

Сжатие информации – это процесс преобразования информации, хранящейся в файле, к  виду, при котором уменьшается  избыточность в ее представлении  и соответственно требуется меньший  объем памяти для хранения; процесс  сокращения количества битов, необходимых  для хранения и передачи некоторого объема информации. [3],[стр. 418]

Существует сжатие без потерь, когда информация, восстановленная  из сжатого сообщения, в точности соответствует исходной (применяется  при обработке текстов, записанных на естественном или искусственном  языках), и сжатие с потерями (необратимое), когда восстановленная информация только частично соответствует исходной (применяется при обработке изображений  и звука, для цифровой записи аналоговых сигналов).

Основные способы  сжатия: статистический и словарный.

При первом каждому  символу присваивается код, основанный на вероятности его появления  в тексте. Высоко вероятные символы  получают короткие коды и наоборот. Одним из самых ранних и широко известных статистических методов  является алгоритм Хаффмана, при котором  символы заменяются кодом, состоящим  из целого количества битов. Позднее  он был вытеснен арифметическим кодированием, имеющим схожую с кодом Хаффмана функцию и основанным на идее кодирования  символов дробным числом битов. Арифметическое сжатие может быть использовано в  тех случаях, когда степень сжатия важнее, чем временные затраты  на сжатие информации.

При словарном способе группы последовательных символов или "фраз" заменяются кодом. Замененная фраза может быть найдена в некотором словаре. В 1977 году Лемпель и Зив предложили свою модификацию словарного метода, отличающуюся от Хаффмановского и арифметического методов в которой сжатие основано на свойстве "потока символов" иметь повторяющиеся участки. Поток символов - это исходные данные для сжатия (например текстовый файл, массив). Основная идея алгоритма Лемпеля и Зива состоит в том, что второе и последующие вхождения некоторой строки символов в сообщении заменяются ссылкой на ее первое появление в сообщении.

В последнее время  было показано, что любая практическая схема словарного сжатия может быть сведена к соответствующей статистической схеме сжатия, и найден общий алгоритм преобразования словарного метода в статистический. По этому при поиске лучшего сжатия статистическое кодирование обещает быть наиболее плодотворным, хотя словарные методы отличаются быстротой.

Одним из наиболее простых и наглядных является метод сжатия последовательностей  одинаковых символов, не относящийся  к названным основным методам.

Метод основан на представлении последовательности одинаковых символов в виде двух величин K и S, где K - количество повторяющихся  символов, S - код этого символа. Основным недостатком данного метода является то, что он обеспечивает сжатие лишь в случае, когда в исходном файле  основную часть составляют повторяющиеся  символы. В противном случае сжатый файл может занимать больше места, чем  исходный неуплотненный файл. Наиболее эффективно метод сжатия последовательностей  одинаковых символов работает в случае двоичных файлов.

Синтетические алгоритмы.

Рассмотренные выше алгоритмы в «чистом виде»  на практике не применяются из-за того, что эффективность каждого из них сильно зависит от начальных  условий. В связи с этим, современные  средства архивации, используют более  сложные алгоритмы, основанные на комбинации нескольких теоретических методов. Общим принципом в работе таких  «синтетических» алгоритмов является предварительный просмотр и анализ исходных данных для индивидуальной настройки алгоритма на особенности  обрабатываемого материала.

 

2. Программы-архиваторы

На основе методов  сжатия данных созданы различные  программы, называемые архиваторами или  упаковщиками. Существует много программ-архиваторов, имеющих различные показатели по степени и времени сжатия. Среди  самых известных и часто используемых программ выделяются следующие: ARJ, PKZIP, RAR, НА и т. д. для DOS и WinARJ, WinZip, WinRAR, Zip Magic для Windows. Обычно упаковщики осуществляют сжатие сразу несколькими способами.

Как правило, программы  для архивации файлов позволяют  помещать копии файлов на диске в  сжатом виде в архивный файл, извлекать  файлы из архива, просматривать оглавление архива и др. В настоящее время  архиваторы, работающие под Windows, вытесняют конкурентов в основном за счет использования 32-х битной шины данных, более удобного и интеллектуального интерфейса, расширенных возможностей и более совершенных алгоритмов сжатия. А также эти программы поддерживают не один, как раньше, а сразу несколько различных форматов архивных файлов.

Программы-архиваторы позволяют создавать и такие  архивы, для извлечения из которых  содержащихся в них файлов не требуются  какие-либо программы, так как сами архивные файлы

Могут содержать  программу распаковки. Такие архивные файлы называются самораспаковывающимися.

Самораспаковывающийся архивный файл – это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без  использования программы-архиватора.

К базовым функциям, которые выполняют большинство  современных архиваторов, относятся:

- извлечение файлов  из архивов;

- создание новых  архивов;

- добавление файлов  в имеющийся архив;

- создание самораспаковывающихся  архивов;

- создание распределенных  архивов на носителях малой  емкости;

- тестирование целостности  структуры архивов;

- полное или частичное  восстановление поврежденных архивов;

- защита архивов  от просмотра или несанкционированной модификации.  

 

3. Программа-архиватор  WinRAR

Достоинства и основные возможности WinRAR

WinRAR - 32-битовая версия Windows архиватора RAR - мощное средство, которое позволяет создавать и управлять архивными файлами.

Достоинства WinRAR:

- интеллектуальный  алгоритм сжатия (глубокий анализ  данных, подлежащих сжатию, и др.);

- специальный алгоритм  сжатия для мультимедиа-файлов;

- не архивное  управление RAR;

- плотная архивация,  которая может поднять коэффициент  сжатия на 10 % -50 % по сравнению  с общими методами, особенно при  упаковке большого количества  небольших аналогичных файлов (при  этом файлы представляются как  непрерывный поток данных).

Возможности WinRAR:

- создание архивов  с различной степенью уплотнения;

- просмотр как  архивных, так и обычных файлов;

- создание многотомных  архивов;

- создание самораспаковывающихся  архивов (в том числе и многотомных);

- восстановление  физически поврежденных архивов.

- возможность работы  в двух режимах: полноэкранного  интерактивного интерфейса и  интерфейса командной строки;

- поддержка других  типов архивов, просмотра их  содержимого, изменения и преобразования;

- защита архивов  паролем. [3],[стр. 427-428]

Кроме того, WinRAR обладает рядом других возможностей, таких, например, как шифрование, архивные комментарии, регистрация ошибок и т.п.

Работа  с программой-архиватором WinRAR

Меню WinRAR содержит следующие пункты: 

"Файл", "Команды", "Операции", "Избранное", "Параметры" и "Справка". Щёлкните на интересующей вас ссылке, чтобы показать информацию о соответствующем меню.

Ещё один элемент интерфейса панель инструментов. Она находится  ниже меню и выше списка файлов. Кнопки на панели инструментов повторяют пункты из меню "Команды" (обратите внимание, что у всех пунктов в этом меню есть "горячие клавиши" для быстрого доступа). Во время просмотра содержимого архива некоторые кнопки могут быть отключены, если их функции неприменимы к архиву. При желании вы можете выбрать отображаемые кнопки, убрать текст с кнопок или уменьшить их размер, вызвав диалог общих параметров программы или щёлкнув правой кнопкой мыши на панели инструментов.

Под панелью инструментов находится маленькая кнопка со стрелкой вверх и строка списка дисков. При  нажатии этой кнопки происходит переход  в родительскую папку. Список дисков служит для выбора текущего диска  или, скажем, сети. Этот список также  можно открыть нажатием клавиши <F4>. При желании кнопку "Вверх" и список дисков можно перетащить в правый угол панели инструментов. Текущий диск также можно изменить нажатием сочетания клавиш <Ctrl+D> или щелчком мыши на маленьком значке диска в строке состояния.

Ниже панели инструментов расположено файловое окно. В нём  отображается содержимое текущей папки  или, если в WinRAR открыт архив, содержимое архива. Эти режимы называются режимом управления файлами и режимом управления архивами. Для каждого файла выводится следующая информация: имя, размер, тип и дата изменения. Для файлов в архиве показываются ещё два параметра значение CRC32 и упакованный размер. CRC32 это особая контрольная сумма, вычисляемая на основании данных файла, с её помощью можно сразу определить, одинаковы ли упакованные в архиве файлы, не прибегая к их распаковке. Файлы с одинаковым содержимым всегда имеют одинаковые CRC32. Все параметры представлены в виде колонок. Порядок сортировки файлов можно поменять щелчком на заголовке колонки (там же синей стрелкой указывается направление сортировки). Кроме того, можно изменить ширину колонок, перетаскивая мышью разделители заголовков колонок. Несколько дополнительных параметров списка можно изменить в диалоге "Список файлов".

Если находящийся в  архиве файл зашифрован, то после его  имени будет стоять звёздочка ( * ). Если файл продолжается в следующем томе, то после его имени будут стоять символы "-->". Если файл продолжается из предыдущего тома, то после имени будут стоять символы "<--". А если файл продолжается из предыдущего и переходит на следующий том, то после его имени будут стоять символы "<->".

Перед обработкой файлов их необходимо выделить. Помимо стандартных  способов выделения Windows в WinRAR для той же цели служат несколько дополнительных клавиш: <Пробел>, <Insert>, а также <+> и <-> на цифровой клавиатуре. Более подробно это описано в разделе "Выделение файлов".

Следующие комбинации клавиш можно использовать для навигации  по списку файлов. Чтобы перейти  в родительскую папку, нажмите клавиши <Backspace>, <Ctrl+PgUp> или дважды щёлкните мышью на папке ".." в списке файлов. Если вы сделаете это в корневой папке архива, то этим закроете архив и перейдёте в ту папку на диске, где он находится. Для перехода в другую папку можно нажать <Enter>,<Ctrl+PgDn> или дважды щёлкнуть левой кнопкой мыши на этой папке. То же действие на файле архива приведёт к открытию архива. Для перехода в корневую папку служит комбинация клавиш <Ctrl+\>.

Если щёлкнуть правой кнопкой  мыши на списке файлов, то появится меню с командами интерфейса и управления файлами. Эти команды доступны также  из обычных меню WinRAR, с панели инструментов и с помощью сочетаний клавиш, поэтому вы можете использовать наиболее удобный для себя способ.

В левой части окна WinRAR может отображаться панель с деревом папок, если это включено в подменю "Дерево папок" в меню "Параметры". Дерево папок удобно использовать для быстрой навигации по папкам на диске и в архиве. Ширину панели с деревом можно изменять, перетаскивая мышью её правую границу.

Если включён параметр "Показывать комментарий" в диалоге общих параметров, а в открытом архиве есть комментарий, он будет показан в специальном окне справа от списка файлов. Ширину окна комментария можно изменять, перетаскивая мышью его левый край.

Внизу окна WinRAR (под списком файлов) находится строка состояния. В её левой части расположены два маленьких значка: "накопитель" и "ключ". Щелчком по значку "накопитель" можно изменить текущий диск, а щелчком по "ключу" текущий пароль. Две соответствующие команды также есть в меню "Файл". По умолчанию значок "ключ" жёлтого цвета, но если введён пароль, то он становится красным. В средней части строки состояния выводится информация об общем размере выделенных файлов или о текущем состоянии. В правой части строки состояния отображаются общее количество файлов в текущей папке и их размер.

Информация о работе Сжатие информации