Кодирование символов
Если каждому символу алфавита поставить в соответствие целое число (порядковый номер), то можно с помощью двоичного кода кодировать любую текстовую информацию. Мы знаем уже, что 8 разрядов достаточно для кодирования 255 символов. Но пронумеровать символы можно по-разному, значит, для разных кодов необходимо применять различные стандарты.
На сегодняшний день наиболее часто используется система кодирования, разработанная институтом стандартизации США (ANSI – American National Standard Institute), которая называется ASCII (American Standard Code for Information Interchange). В этом стандарте две таблицы с номерами от 0 до 127 (базовая) и от 128 до 255 символов (расширенная). В базовой таблице – первые 32 кода – управляющие (не соответствующие никаким символам), затем с 32 по127 – символы английскому алфавита, знаков препинания и т.д.
По существу ASCII – международный стандарт, хотя в СССР действовала система кодирования КОИ – 7 (Код Обмена Информацией, семизначный). Во второй, расширенной части системы кодирования, находятся коды национальных систем кодирования. Отсутствие единого стандарта здесь привело к множественности одновременно действующих кодировок. Так, известна кодировка русского алфавита:
1) Windows-1251 (форма Microsoft), которая используется для большинства локальных компьютеров;
2) КОИ-8 – используется в компьютерных сетях в российском секторе Интернета;
3) международный стандарт ISO – используется редко.
В перспективе, мы перейдем на систему 16-разрядного кодирования, которая получила название UNICODE и которая позволяет обеспечить универсальные коды для 65536 различных символов. В этом случае потребуется только одна таблица для кодирования большинства языков планеты.
Дата добавления: 2015-08-08; просмотров: 1491;