Play IT

Энтропия информации

Интерактивное демо «Энтропия информации» — раздел Энциклопедия · Данные и разметка.

data-markupencyclopedia

Энтропия Шеннона

Средняя неопределённость символа — нижняя граница сжатия без потерь

H (на символ)
3.893 бит
Макс. для алфавита
4.248 бит
Уникальных символов
19
Мин. объём (оценка)
254 бит
и
14% · 0.39
а
12% · 0.37
11% · 0.35
р
9% · 0.32
о
8% · 0.28
м
8% · 0.28
т
6% · 0.25
н
5% · 0.20
я
5% · 0.20
п
3% · 0.15
г
3% · 0.15
е
3% · 0.15

Язык снижает энтропию: частые буквы и слоги — основа словарного сжатия.