Кодирование символов

Если каждому символу алфавита поставить в соответствие целое число (порядковый номер), то можно с помощью двоичного кода кодировать любую текстовую информацию. Мы знаем уже, что 8 разрядов достаточно для кодирования 255 символов. Но пронумеровать символы можно по-разному, значит, для разных кодов необходимо применять различные стандарты.

На сегодняшний день наиболее часто используется система кодирования, разработанная институтом стандартизации США (ANSI – American National Standard Institute), которая называется ASCII (American Standard Code for Information Interchange). В этом стандарте две таблицы с номерами от 0 до 127 (базовая) и от 128 до 255 символов (расширенная). В базовой таблице – первые 32 кода – управляющие (не соответствующие никаким символам), затем с 32 по127 – символы английскому алфавита, знаков препинания и т.д.

По существу ASCII – международный стандарт, хотя в СССР действовала система кодирования КОИ – 7 (Код Обмена Информацией, семизначный). Во второй, расширенной части системы кодирования, находятся коды национальных систем кодирования. Отсутствие единого стандарта здесь привело к множественности одновременно действующих кодировок. Так, известна кодировка русского алфавита:

1) Windows-1251 (форма Microsoft), которая используется для большинства локальных компьютеров;

2) КОИ-8 – используется в компьютерных сетях в российском секторе Интернета;

3) международный стандарт ISO – используется редко.

В перспективе, мы перейдем на систему 16-разрядного кодирования, которая получила название UNICODE и которая позволяет обеспечить универсальные коды для 65536 различных символов. В этом случае потребуется только одна таблица для кодирования большинства языков планеты.

<1 234 5 6 7 >

Дата добавления: 2015-08-08; просмотров: 1645;