Представление чисел в упакованном десятичном формате
При обработке текстовой информации каждому символу ставится в соответствие определенное число. Соответствие между набором символов и числами называется кодировкойсимволов. При вводе в компьютер информация кодируется, а при выводе декодируется.
Существует много различных кодировок. В большинстве символы кодируются восьмибитовыми (или однобайтными) числами. В одном байте можно записать 256 различных целых чисел. Этого достаточно для кодирования всех букв русского и латинского алфавитов, арабских цифр, знаков препинания и некоторых других необходимых символов. Для наглядности кодируемые символы располагаются в таблице. Код символа составляется из номеров столбца и строки, на пересечении которых он находится. Этим двоичным числам соответствуют десятичные числа от 0 до 255.
До появления операционной системы MS Windows основной являлась кодовая таблица символов ASCII (American Standard Code for Information Interchange — американский стандартный код обмена информацией).
Фирмой Microsoft была разработана новая кодовая таблица ANSI. Для представления кириллицы на основе кодировки ANSI построена кодовая страница СР12565. Символам кириллицы в ней соответствуют шестнадцатеричные коды от С0 до FF, или в десятичной системе счисления — от 192 до 255.
В настоящее время широко используется двухбайтная кодировка Unicode. Поскольку в 16 двоичных разрядах (2 байтах) можно записать 65 536 различных целых чисел, эта таблица кодов включает в себя все существующие алфавиты мира, а также множество математических, химических, музыкальных и декоративных символов. Кодировка Unicode используется в программах MS Word и MS Excel.
Дата добавления: 2015-09-18; просмотров: 666;