Отношение количества семантической информации к объему данных принято называть относительной мерой количества семантической информации.
Прагматическая мера информации определяет ее ценность для конкретного пользователя.
Кодирование текстовой информации
Чтобы эффективно накапливать, передавать и использовать информацию, ее надо представить в виде цифровых кодов, т.е. различающихся чисел, каждое из которых имеет значение некоторого «кванта» информации (т. е. ее неделимого значения). Эта операция называется кодированием информации.
Рассмотрим кодирование текстовой информации. Как известно, любой текст состоит из отдельных знаков - прежде всего букв и цифр. Совокупность таких знаков образует алфавит языка, а правила применения - синтаксисязыка. Для работы с большинством языков (за исключением, возможно, китайского и японского) вполне достаточно двух-трех сотен знаков. Из этих знаков строятся слова, предложения, абзацы и главы текстовых документов.
В цифровых информационных системах и компьютерах каждый знак часто кодируется некоторым кодом - обычно целым числом (байтом) со значением от 0 до 255. Таким образом, задается 256 знаков (2 в степени 8). Этого вполне достаточно. 2 в степени 7 даст 128 значений - этого мало, а вот 2 в степени 9 - уже 512 значений. Этого уже много для большинства языков! К тому же число 8 кратно двум, вот почему именно единица памяти байт (28 состояний) стала основной.
Дата добавления: 2015-05-08; просмотров: 1145;