Особенности представления информации в ПК
Числовая информация внутри ПК кодируется в двоичной или в двоично-десятичной системах счисления; при вводе и выводе любой информации используются специальные коды представления информации — коды ASCII, эти же коды применяются для кодирования буквенной и символьной информациивнутри ПК.
Для удобства работы введены следующие термины для обозначения совокупностей двоичных разрядов (см. табл. 4.2). Эти термины обычно используются в качестве единиц измерения объемов информации, хранимой или обрабатываемой в компьютере.
Таблица 4.2. Двоичные совокупности
Количество двоичных разрядов в группе | Наименование единицы измерения |
Бит | |
Байт | |
Параграф | |
8 · 1024 | Кбайт (килобайт) |
8 · 10242 | Мбайт (мегабайт) |
8 · 10243 | Гбайт (гигабайт) |
8 · 10244 | Тбайт (терабайт) |
8 · 10245 | Пбайт (пентабайт) |
Последовательность нескольких битов или байтов часто называютполем данных.
Биты в числе (в слове, в поле и т. п.) нумеруются справа налево, начиная с 0-го разряда. В ПК могут обрабатываться поля постоянной и переменной длины.
Поля постоянной длины:
l слово — 2 байта;
l двойное слово — 4 байта;
l полуслово — 1 байт;
l расширенное слово — 8 байтов.
Числа с фиксированной запятой чаще всего имеют формат слова и полуслова; числа с плавающей запятой — формат двойного и расширенного слова (математические сопроцессоры IBM PC могут работать с 10-байтными словами).
Поля переменной длинымогут иметь любой размер от 0 до 255 байтов, но обязательно равный целому числу байтов.
Пример
Структурно запись двоичного числа –11000001(2), равного десятичному –193(10) в разрядной сетке ПК, выглядят следующим образом (рис. 4.1, 4.2).
Рис. 4.1. Число с фиксированной запятой формата слово со знаком
Рис. 4.2. Число с плавающей запятой формата двойное слово
Двоично-кодированные десятичные числа могут быть представлены в ПК полями переменной длины в так называемыхупакованном(рис. 4.3) ираспакованном(рис.4.4)форматах. В упакованном формате для каждой десятичной цифры отводится по 4 двоичных разряда (полбайта), при этом знак числа кодируется в крайнем правом полубайте числа (1100 — знак «+» и 1101 — знак «–»).
Рис. 4.3. Структура поля упакованного формата
Здесь и далее: Цф — цифра, Знак — знак числа. Упакованный формат используется в ПК обычно при выполнении операций сложения и вычитания двоично-десятичных чисел.
В распакованном формате (рис. 4.4) для каждой десятичной цифры выделяется по целому байту, при этом старшие полубайты (зона) каждого байта (кроме самого младшего) в ПК заполняются кодом 0011 (в соответствии с ASCII-кодом), а в младших (левых) полубайтах обычным образом кодируются десятичные цифры. Старший полубайт (зона) самого младшего (правого) байта используется для кодирования знака числа.
Рис. 4.4. Структура поля распакованного формата
Распакованный формат используется в ПК при вводе-выводе информации, а также при выполнении операций умножения и деления двоично-десятичных чисел.
Например, число –193(10) = –000110010011(2-10) в ПК будет представлено:
l в упакованном формате:
l в распакованном формате:
Код ASСII (American Standard Code for Information Interchange — американский стандартный код для обмена информацией) имеет основной стандарт и его расширение (рис. 4.5). Основной стандарт для кодирования символов использует шестнадцатеричные коды 00–7F, расширение стандарта — 80–FF.
Рис. 4.5. Таблица кодов ASCII[2]
Основной стандарт является международным и применяется для кодирования управляющих символов, цифр, знаков пунктуации, букв латинского алфавита и других символов; в расширении стандарта кодируются символы псевдографики и буквы национального алфавита (естественно, в разных странах разные). Пользоваться таблицей достаточно просто. Следует приписать шестнадцатеричную цифру номера строки справа к шестнадцатеричной цифре номера столбца. Так получится шестнадцатеричный код символа.
ПРИМЕЧАНИЕ
Любой символ, представленный в таблице на рис. 4.5, при работе в DOS может быть введен в ПК с клавиатуры набором его десятичного кода (соответствующего шестнадцатеричному ASCII-коду) на малой цифровой клавиатуре при нажатой клавише Alt.
Наряду с кодом ASCII в ВС, в частности в сети Интернет, используется общий для всех стран мира универсальный код — Unicode. Этот код основан на паре байтов — машинном слове. Шестнадцати битов хватает для отображения 65 535 знаков. Такого количества достаточно для всех существующих алфавитов (то есть алфавиты большинства стран мира размещаются в основном стандарте этого кода).
Дата добавления: 2016-04-02; просмотров: 844;