Форматы представления и преобразования информации

При работе с информацией всегда и идет речь о ее представлении в виде определенных символических структур. Наиболее распространены одномерные представления информации, при которых сообщения имеют вид последовательности символов. Так информация представляется в письменных текстах, при передаче ее по каналам связи, в памяти ЭВМ. Однако широко используется многомерное представление информации, например, в виде рисунков, видеоизображений и т.п.

Формирование представления информации называется ее кодированием. В более узком смысле под кодированием понимается переход от исходного представления информации, удобного для восприятия человеком, к представлению, удобному для хранения, передачи и обработки. В этом случае обратный переход к исходному представлению называется декодированием.

При кодировании ставятся следующие цели:

· удобство физической реализации;

· удобство восприятия;

· высокая скорость передачи и обработки;

· экономичность, т.е. уменьшение избыточности сообщения;

· надежность, т.е. защита от случайных искажений;

· сохранность, т.е. защита от нежелательного доступа к информации.

Эти цели противоречат друг другу. На разных этапах обработки информации достигаются разные цели, и поэтому информация неоднократно перекодируется, преобразуется из вида, удобного для восприятия человеком, к виду, удобному для обработки автоматическими средствами, и наоборот. Такое представление происходит, например, при передаче телеграмм, при программировании ЭВМ.

Рассмотрим способы представления информации в ЭВМ. Для записи, хранения и выдачи по запросу информации, обрабатываемой с помощью ЭВМ, предназначено ЗУ (память) ЭВМ. Напоминаем, что памяти ЭВМ информация записывается в виде цифрового двоичного кода. Это объясняется тем, что электронные схемы ЗУ строятся из элементов, которые могут находиться только в одном из двух устойчивых состояний, которые можно интерпретировать как 0 или 1. Ячейки, хранящие по одному биту информации, объединяются в группы, называемый машинными словами.

Представление числовой информации в ЭВМ. Так как память ЭВМ состоит из конечной последовательности слов, а слова – из конечной последовательности бит, то числовая информация может быть представлена только с определенной точностью, зависящей от архитектуры ЭВМ.

Для записи каждого числа в ЭВМ отводится фиксированное число двоичных разрядов (разрядная сетка). Это приводит к тому, что, во-первых, существуют минимальное и максимальное числа М_мин и М_макс, которые можно записать в ЭВМ; во-вторых, числа в диапазоне (М_мин, М_макс) могут быть представлены в ЭВМ не все, а лишь некоторые (в случае вещественных чисел). Например, пусть для хранения числа с плавающей запятой отводится 32 двоичных разрядов, из которых один двоичный разряд хранит знак числа, 8 разрядов отводятся под порядок и 23 под мантиссу. Тогда возможный допустимый диапазон значений 3.4*10^-38… 3.4*10⁺³⁸.

Представление символьной информации в ЭВМ. Символьная информация в памяти ЭВМ также представлена в двоичном коде. Например, можно обозначить каждую букву числом, соответствующим ее порядковому номеру в алфавите: А – 01, Б – 02 и т.д. В алфавит можно включить другие символы, например, знаки препинания, спецсимволы и также присвоить им какие-либо номера. При таком кодировании любое слово можно представить в виде двоичной последовательности.

При преобразовании символов (знаков) в цифровой код между множеством символов и кодов должно иметь место взаимнооднозначное соответствие, т.е. разным символам должны быть назначены разные цифровые коды. Это условие является единственным необходимым требованием при построении схемы преобразования символов в числа. Однако существует ряд практических соглашений, принимаемых при построении схемы преобразования исходя из соображений наглядности, эффективности, стандартизации. Другой важный момент – эффективное использование оперативной памяти ЭВМ при организации кодировки символьной информации.

В настоящее время существует несколько широко распространенных схем кодировки, например код BCD и его модификация EBCDIC, код ASCII и его отечественная модификация КОИ-8R, дополненная буквами русского алфавита, кодировка ANSI, принятая в операционной системе Windows.

<14 15 161718 19 20 >

Дата добавления: 2015-08-08; просмотров: 938;