Глава
6.
Сжатие
данных
Степень
сжатия
определяется затратами для передачи или хра-
нения
информации без сжатия fco
и
затратами с использованием
некоторого метода сжатия к
т
КО — К
т
.
G (6.1)
fco
Степень сжатия зависит от используемого алгоритма и свойств ис-
точника. Приведем некоторые численные примеры степеней сжатия,
достигаемых на практике :
-до 80 % для текстовых данных (в формате редактора
Word
97 с
помощью программы сжатия ZIP);
-87,5 % при переходе от РСМ-телефонии со скоростью 64 кбит/сек
к
передаче информации по рекомендации ITU G.725 со скоростью 8
кбит/сек;
-90 % при кодировании информации стереофоничских аудио ком-
пакт дисков со скоростью 2-16 бит-44 кГц = 1408 кбит/сек методом,
использующим стандарт сжатия MPEG (Advanced
Audio
Coding) со
скоростью 112 кбит/сек и почти равнозначным качеством речи.
Следующим примером является энтропия немецкого литератур-
ного текста. Результаты частотного анализа представлены на рис.
6.1.
Если рассматривать буквы изолированно, то получим энтропию,
приблизительно равную 4,7 бит/букву. Объединяя буквы в блоки,
мы используем уже такие очевидные связи, как слоги, слова и т.д.,
поэтому, для блоков очень большой длины асимптотически дости-
жимая граница равна Г, 6 бит/букву.
Энтропия
O—rj
4,7 бит/символ-
1,6 бит/символ-——
•+-*•
п в 1 Длина блок л = 10
Рис.
6.1. Энтропия немецкого литературного языка как
функция
длины блока
Алгоритмы сжатияданных можно разделить на три группы:
1. Статические алгоритмы, например,
кодирование
Хаффмана.
Сжатие немецкого литературного текста методом Хаффмана,
по
сравнению с сжатием информации, состоящей из произволь-