Форматы представления и преобразования информации
При работе с информацией всегда и идет речь о ее представлении в виде определенных символических структур. Наиболее распространены одномерные представления информации, при которых сообщения имеют вид последовательности символов. Так информация представляется в письменных текстах, при передаче ее по каналам связи, в памяти ЭВМ. Однако широко используется многомерное представление информации, например, в виде рисунков, видеоизображений и т.п.
Формирование представления информации называется ее кодированием. В более узком смысле под кодированием понимается переход от исходного представления информации, удобного для восприятия человеком, к представлению, удобному для хранения, передачи и обработки. В этом случае обратный переход к исходному представлению называется декодированием.
При кодировании ставятся следующие цели:
· удобство физической реализации;
· удобство восприятия;
· высокая скорость передачи и обработки;
· экономичность, т.е. уменьшение избыточности сообщения;
· надежность, т.е. защита от случайных искажений;
· сохранность, т.е. защита от нежелательного доступа к информации.
Эти цели противоречат друг другу. На разных этапах обработки информации достигаются разные цели, и поэтому информация неоднократно перекодируется, преобразуется из вида, удобного для восприятия человеком, к виду, удобному для обработки автоматическими средствами, и наоборот. Такое представление происходит, например, при передаче телеграмм, при программировании ЭВМ.
Рассмотрим способы представления информации в ЭВМ. Для записи, хранения и выдачи по запросу информации, обрабатываемой с помощью ЭВМ, предназначено ЗУ (память) ЭВМ. Напоминаем, что памяти ЭВМ информация записывается в виде цифрового двоичного кода. Это объясняется тем, что электронные схемы ЗУ строятся из элементов, которые могут находиться только в одном из двух устойчивых состояний, которые можно интерпретировать как 0 или 1. Ячейки, хранящие по одному биту информации, объединяются в группы, называемый машинными словами.
Представление числовой информации в ЭВМ. Так как память ЭВМ состоит из конечной последовательности слов, а слова – из конечной последовательности бит, то числовая информация может быть представлена только с определенной точностью, зависящей от архитектуры ЭВМ.
Для записи каждого числа в ЭВМ отводится фиксированное число двоичных разрядов (разрядная сетка). Это приводит к тому, что, во-первых, существуют минимальное и максимальное числа Ммин и Ммакс, которые можно записать в ЭВМ; во-вторых, числа в диапазоне (Ммин, Ммакс) могут быть представлены в ЭВМ не все, а лишь некоторые (в случае вещественных чисел). Например, пусть для хранения числа с плавающей запятой отводится 32 двоичных разрядов, из которых один двоичный разряд хранит знак числа, 8 разрядов отводятся под порядок и 23 под мантиссу. Тогда возможный допустимый диапазон значений 3.4*10-38… 3.4*10+38.
Представление символьной информации в ЭВМ. Символьная информация в памяти ЭВМ также представлена в двоичном коде. Например, можно обозначить каждую букву числом, соответствующим ее порядковому номеру в алфавите: А – 01, Б – 02 и т.д. В алфавит можно включить другие символы, например, знаки препинания, спецсимволы и также присвоить им какие-либо номера. При таком кодировании любое слово можно представить в виде двоичной последовательности.
При преобразовании символов (знаков) в цифровой код между множеством символов и кодов должно иметь место взаимнооднозначное соответствие, т.е. разным символам должны быть назначены разные цифровые коды. Это условие является единственным необходимым требованием при построении схемы преобразования символов в числа. Однако существует ряд практических соглашений, принимаемых при построении схемы преобразования исходя из соображений наглядности, эффективности, стандартизации. Другой важный момент – эффективное использование оперативной памяти ЭВМ при организации кодировки символьной информации.
В настоящее время существует несколько широко распространенных схем кодировки, например код BCD и его модификация EBCDIC, код ASCII и его отечественная модификация КОИ-8R, дополненная буквами русского алфавита, кодировка ANSI, принятая в операционной системе Windows.
Дата добавления: 2015-08-08; просмотров: 809;