
8. ОСНОВЫ ТЕОРИИ ИНФОРМАЦИИ
включающего 26 латинских букв и знаки препинания, достаточно
пятиразрядного кода Бодо). При передаче сообщений неравномер-
ным кодом говорят о средней длине кодового слова (усреднение
длин кодовых слов производится по соответствующему распреде-
лению вероятностей).
Шеннону принадлежит следующая теорема (доказательство
см., например, в [10]), называемая основной теоремой о кодирова-
нии в отсутствие шумов.
ТЕОРЕМА. Среднюю длину кодовых слов для передачи симво-
лов источника при помощи кода с основанием
можно как
угодно приблизить к величине
.
Смысл теоремы состоит в том, что она определяет нижнюю
границу длины кодовых слов и устанавливает принципиальную
возможность достичь этой границы, однако она не указывает спо-
собов достижения.
Пример 8.4. Если источник имеет объем алфавита 32, то при
равновероятных символах его энтропия равна 5 битам. Тогда для
двоичного кода наименьшая средняя длина составляет 5, следова-
тельно, пятизначный код Бодо является оптимальным кодом. Од-
нако при неравных вероятностях символов энтропия источника
меньше чем 5 бит (избыточность источника отлична от нуля), сле-
довательно, можно найти код со средней длиной кодового слова
меньше пяти и таким образом повысить скорость передачи ин-
формации. Текст на русском языке, например, имеет энтропию
около 2,5 бит, поэтому путем соответствующего кодирования
можно увеличить скорость передачи информации вдвое против
пятиразрядного равномерного кода Бодо (чтобы использовать код
Бодо для передачи русского текста, можно отождествить буквы «е»
и «ѐ», а также «ь» и «ъ»). ◄
Практическое значение теоремы Шеннона заключается в воз-
можности повышать эффективность систем передачи информации
(систем связи) путем применения экономного кодирования (коди-
рования источника).
Очевидно, что экономный код должен быть в общем случае не-
равномерным. Общее правило кодирования источника (без памяти)
состоит в том, что более вероятным символам источника ставят-
ся в соответствие менее длинные кодовые слова (последователь-
ности канальных символов).
Пример 8.5. Известный код Морзе служит примером неравно-
мерного кода. Кодовые слова состоят из трех различных символов:
точки (передается короткой посылкой), тире ― (передается отно-
сительно длинной посылкой) и пробела (паузы). Наиболее частой