Кодирование текстовой информации. С точки зрения ЭВМ текст состоит из отдельных символов
С точки зрения ЭВМ текст состоит из отдельных символов. К символам принадлежат буквы (заглавные или строчные, латинские или русские), цифры, знаки препинания, спецсимволы типа "=", "(", "&" и т.п. и пробел. Человек различает символы по начертанию, а компьютер - по их коду. При вводе текста происходит его преобразование в двоичный код. При выводе на экран или принтер происходит обратное действие.
Кодирование текстовой информации заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Для кодирования одного символа используется 1 байт памяти, то есть 8 бит. Таким образом, 1 байтом можно закодировать 256 символов. Следовательно, текст целиком занимает столько байт памяти машины, из скольких символов он состоит.
Важно понять, что присвоение символу конкретного кода (числа) - это вопрос соглашения, которое фиксируется в кодовой таблице.
Для разных типов ЭВМ используются различные таблицы кодировки.
Международным стандартом для ПК стала таблица ASCII (American Standart Code for Information Interchange - Американский стандартный код для информационного обмена). В таблицу входят коды строчных и заглавных латинских букв, коды для цифр, знаков препинания, различных математических символов. Коды заглавных и строчных букв различны.
Таблица кодов ASCII делится на две части: стандартная и расширенная. Международным стандартом является лишь первая половина таблицы (стандартная), т.е. символы с кодами от 0 (00000000) до 127 (01111111).
Первые 33 кода (с 0 по 32) называются управляющими. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста, перевод строки, ввод пробела и т.п. Символ 32 - пробел, т.е. пустая позиция в тексте.
Коды с 33 по 127 соответствуют символам латинского алфавита, цифрам, знакам препинания, арифметическим действиям, всевозможным скобкам, к и другим символам.
В расширенной части таблицы содержатся символы (коды 128-255) национальных алфавитов, символы псевдографики, научные символы.
Дата добавления: 2015-10-19; просмотров: 912;