Кодирование текстовой информации
Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью.
Один символ из такого алфавита несет 8 бит информации, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ.
При помощи формулы, которая связывает между собой количество возможных событий К и количество информации n, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):
К = 2n = 28 = 256,
т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.
Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.
Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой.
Основным отображением кодирования символов является код ASCII - American Standard Code for Information Interchange- американский стандартный код обмена информацией.
Примеры
1). Если вариант теста в среднем имеет объем 20 килобайт (на каждой странице теста 40 строк по 64 символа в каждой , 1 символ занимает 8 бит), то количество страниц в тесте равно 10; 16; 8; 4; 12.
На странице 40*64 =22 *10*26=10*28 байт.
20К = 10*2*210=10*211 байт.
10*211 /(10*28)= 23 = 8страниц.
2). Емкость текста равна 160Кбайт (1 символ занимает 8 бит), скорость печати - 32 символа в секунду(25 байт в секунду). Для распечатки текста на принтере потребуется минут (ответ округлить до целого числа):
256; 90; 120; 9; 86.
ü Емкость текста : 10 * 24 * 210 байт;
ü (10*24*210)байт/25байт/сек=10*29сек=10*512сек;
ü 5120/60=86 минут.
Дата добавления: 2014-11-29; просмотров: 1355;