Информация и информационные процессы. 3 страница

- задания во время чтения

- задания после чтения

Решите задачу 1: На ферме живут 16 цыплят, 7 кур, 1 петух и 5 гусей. Определить количество информации в зрительном сообщении: «На рождество зажарили цыпленка». Решите задачу 2: Мама попросила дочку сходить в магазин и купить фрукты. В магазине в наличии было 4 кг. яблок, 5 кг. груш и 10 кг. апельсинов. Определить количество информации, полученной мамой в зрительном сообщении о покупке, сделанной дочкой. Можно ли решить данную задачу таким же способом, как и предыдущую? Почему?

Прочитайте текст. Во время чтения делайте пометки на полях: «!» - важно, «?» - не понятно, есть вопросы

В статистической теории информации Шеннона вводится более общая мера количества информации, в соответствии с которой рассматривается не само событие, а информация о нем. Любое сообщение, несущее информацию, всегда представляет собой совокупность сведений о какой-то физической системе. Например, на вход автоматизированной системы управления производственным цехом может быть подано сообщение о химическом составе сырья, температуре в печи, нормальном или повышенном проценте брака. Каждое из таких сообщений описывает состояние той или иной физической системы. Так же обстоит дело, когда передается сводка погоды или когда на адрес городского эпидемиолога поступает сообщение о числе заболеваний за сутки. Во всех случаях сообщение описывает состояние физической системы. Очевидно, если бы состояние этой системы было известно заранее, то не имело бы смысла передавать сообщение: оно не имело бы никакой информации. Сообщение приобретает смысл только тогда, когда состояние системы заранее неизвестно, обладает какой-то степенью неопределенности. Очевидно, сообщение, выясняющее для нас состояние такой системы, будет тем богаче и содержательнее, чем больше была неопределенность системы до этого сообщения. Возникает естественный вопрос: что значит "большая" или "меньшая" степень неопределенности и как ее можно измерить? Чтобы уяснить себе этот вопрос, сравним между собой две физические системы, каждой из которых присуща некоторая неопределенность. В качестве первой системы (обозначим ее А) возьмем монету, которая подбрасывается и может случайным образом выпасть той или иной стороной, то есть оказаться в одном из двух состояний:

А₁ - "орел"; А₂ - "решка".

В качестве второй системы (пусть будет В) возьмем игральный кубик, который тоже подбрасывается и может оказаться в одном из шести состояний:

В₁ - выпала единица; В₂ - выпала двойка; . . . В₆ - выпала шестерка.

Какая из этих систем обладает большей неопределенностью? Очевидно, вторая, так как она отличается большим разнообразием возможных состояний. С первого взгляда может показаться, что все дело в числе состояний: у первой системы их два, а у второй - шесть. Однако степень неопределенности зависит не только от числа состояний, но и от их вероятностей.

Чтобы убедиться в том, что степень неопределенности зависит от вероятности появления события, рассмотрим третью систему С, у которой, как и у системы А, два возможных состояния. Пусть системой С будет техническое устройство, которое имеет два возможных состояния:

С₁ - устройство исправно; С₂ - устройство отказало.

Если вероятности этих двух состояний одинаковы (по 0,5 или 50%), то степень неопределенности системы С такая же, как системы А (монета).

Теперь представим себе, что состояния С₁ и С₂ неравновероятны, например, вероятность первого - 0,99 (99%), а вероятность второго - 0,01 (1%).

Очевидно, степень неопределенности такой системы будет гораздо меньше, чем в первом случае: ведь мы почти уверены, что устройство будет исправно. А если состояние С₁ будет совершенно достоверно (то есть иметь вероятность 1), то, очевидно, система С вообще никакой неопределенностью обладать не будет.

Таким образом, мы убедились, что степень неопределенности физической системы зависит не только от числа состояний, но и от того, как распределены вероятности между состояниями.

В теории информации в качестве меры неопределенности системы принята так называемая энтропия.

Если система А имеет n возможных состояний

А₁, А₂ , . . ., А_n,

причем вероятности этих состояний равны соответственно

p₁, p₂, ..., p_n; p₁ + p₂ + ... + p_n = 1,

то энтропией системы А называется величина:

H(A) = -(p₁ · log₂ p₁ + p₂ · log p₂ + ... + p_n · log p_n),

(1)

или

H(A) = -

p_i · log q,

(2)

то есть сумма произведений вероятностей состояний на логарифмы этих вероятностей, взятая с обратным знаком (обратный знак берется просто для того, чтобы энтропия была неотрицательной). Логарифм в формуле (2) может быть взят при любом основании. Обычно логарифм берется по основанию 2. Тогда говорят, что энтропия измеряется в двоичных единицах (битах):

Один бит - это энтропия простейшей физической системы, которая может быть только в одном из двух состояний, причем эти состояния равновероятны.

Действительно, пусть система А обладает двумя состояниями А₁ и А₂ с вероятностями p₁ = 0,5 и p₂ = 0,5. Согласно формуле (2), энтропия такой системы равна

H(A) = - (0,5·log₂ 0,5 + 0,5·log₂ 0,5) = 1,

то есть одному биту.

За единицу информации можно было бы выбрать количество информации, необходимое для различения, например, десяти равновероятных сообщений. Это будет не двоичная (бит), а десятичная (дит) единица информации.

В классической теории информации количество информации, заключенной в сообщении, измеряется уменьшением энтропии системы под действием этого сообщения. Пусть, например, до поступления сообщения энтропия системы была равна двум битам, а после него стала равной одному биту. Из этого мы заключаем, что информация, заключенная в сообщении, равна одному биту.

Понятию "информация в битах" можно дать очень наглядное истолкование: она равна числу ответов "да" и "нет" на разумно поставленные вопросы, с помощью которых можно получить ту же информацию.

Пусть, например, система А может иметь два равновероятных состояния: А₁ и А₂. Тогда полное выяснение состояния этой системы несет информацию один бит, и, значит, можно ее получить в результате ответа на один вопрос. Действительно, задав один-единственный вопрос: "Находится ли система в состоянии А₁?" и получив на него ответ "да" или "нет", мы полностью выясним состояние системы.

Энтропия обладает следующими свойствами:

а) энтропия всегда неотрицательна, так как значения вероятностей выражаются величинами, не превосходящими единицу, а их логарифмы - отрицательными числами или нулем, так что члены суммы (2.7) неотрицательны;

б) если p_i = 1 (а все остальные p_j = 0, j = 1, ..., (n-1)), то Н(А) = 0. Это тот случай, когда об опыте или величине все известно заранее и результат не дает новую информацию;

в) H(A) = H_max при p₁ = p₂ = ... = p_n = 1 / n,

при этом

;

г) энтропия системы, состоящей из двух подсистем А и В (состояния системы образуются совместной реализацией объектов А и В), то есть:

Н(АВ) = Н(А) + Н(В).

Если события равновероятны и статистически независимы, то оценки количества информации, по Хартли и Шеннону, совпадают. Это свидетельствует о полном использовании информационной емкости системы. В случае неравных вероятностей количество информации, по Шеннону, меньше информационной емкости системы.

Количество информации тогда и только тогда равно энтропии, когда неопределенность ситуации снимается полностью. В общем случае нужно считать, что количество информации есть уменьшение энтропии вследствие опыта или какого-либо другого акта познания. Если неопределенность снимается полностью, то информация равна энтропии:

I = H.

В случае неполного разрешения имеет место частичная информация, являющаяся разностью между начальной (H₀) и конечной (H₁) энтропией:

I = H₀ - H₁.

Задача 1.

Вероятность первого события составляет 0,5, а второго и третьего — 0,25. Какое количество информации мы получим после реализации одного из них?

Решение.

Р₁=0,5; Р₂=Р₃=0,25 Þ бита.

Ответ: 1,5 бита.

Задача 2.

За контрольную работу по информатике получено 8 пятерок, 13 четверок, 6 троек и 2 двойки. Какое количество информации получил Васечкин при получении тетради с оценкой?

Решение.

Краткая запись условия	Решение
К₅=8 К₄=13 К₃=6 К₂=2	Основная формула: , р_к= . , , , Подставляем полученные вероятности:
I - ?

Ответ: 1,77 бит.

Задача 3.

Добрый экзаменатор никогда не ставит двоек по информатике. По причине своей доброты он заранее определил количество отметок каждого вида и произвольно расставил их абитуриентам. Количество информации, содержащееся в сообщении "Абитуриент Иванов не сдал экзамен на отлично", равно 3-log₂7 бит. Информационный объем сообщения "Абитуриент Сидоров получил четверку" равен двум битам. Определите информационный объем зрительного сообщения о полученной оценки абитуриентом Сидоровым.

Решение.

Из условия видно, что количество оценок, распределенных экзаменатором различное и вопрос задачи указывает на одну из всех возможных оценок, поэтому воспользуемся подходом к определению количества информации для неравновероятных событий, а именно формулой Шеннона.

Обозначим i₄ – количество информации в сообщении "Абитуриент Сидоров получил четверку", i_4или3 – количество информации в сообщении "Абитуриент Иванов не сдал экзамен на отлично", I - информационный объем зрительного сообщения о полученной оценки абитуриентом Сидоровым, к – показатель определенной оценки, р₃, р₄, р₅ – вероятности выставления троек, четверок и пятерок соответственно, р_4или3 – вероятность выставления оценки не отлично

Краткая запись условия	Решение
i_4или3=3-log₂7 бита i₄=2 бита	Основные формулы: , , р_к= , () . Найдем вероятности р₅ и р₄: 3-log₂7= Þ Þ Þ , аналогично Þ . Подставляем полученные вероятности в формулу ()
I - ?

Ответ: 1,3 бит.

Таковы в самых общих чертах принципиальные основы классической теории информации. Она дает полезный аппарат, позволяющий решать ряд важных практических задач (например в теории связи при кодировании речи или изображений). Однако этот аппарат не универсальный, и множество ситуаций не укладывается в шенноновскую модель.

Отметим, что далеко не всегда можно заранее (до сообщения) установить перечень возможных состояний системы и вычислить их вероятности. Например, вряд ли можно численно оценить вероятность того, что в нашей солнечной системе существует еще одна - десятая - планета. Тем не менее, с точки зрения обычного здравого смысла (а не нарушать его - естественное требование к теории) ясно, что сообщение об открытии новой планеты должно нести очень большую информацию, но оценить ее в битах не удается.

Другой пример. Допустим, что система радиолокационных станций ведет наблюдение за воздушным пространством с целью обнаружения самолета противника. Система А, за которой ведется наблюдение, может быть в одном из двух состояний:

А₁ - противник есть; А₂ - противника нет.

Выяснение, в каком из них именно она находится, в рамках классической теории в лучшем случае принесло бы нам информацию один бит, равную информации о том, какой стороной вверх упала монета. Совершенно ясно, что по своей важности первое сообщение несравненно больше второго, но оценить его в рамках классической теории невозможно.

Таким образом, основным недостатком классической теории информации, ограничивающим ее применение, является то, что она, занимаясь только формальной ("знаковой" или "буквенной") стороной сообщений, оставляет в стороне их ценность и важность, вообще - содержание.

Заполните таблицу:

«!»	«?»

Обсудите заполненную таблицу с другими студентами группы. Внесите в нее необходимые исправления и дополнения.

Рассмотрите следующую ситуацию: Имеется шахматная доска, на одну из клеток которой поставлена фигура (слон). Предположим, что все клетки выбираются с одинаковой вероятностью. Определим информацию, заключенную в сообщении о том, где стоит слон. У системы А (слон) 64 равновероятных состояния; ее энтропия равна:

Значит, сообщение, полностью устраняющее неопределенность состояния системы (указание, где стоит слон), должно содержать ровно шесть битов информации. А из этого следует, что положение слона можно точно выяснить с помощью не более чем шести вопросов. Попробуйте их сформулировать.

Решите следующие задачи:

Известно, что в ящике лежат 20 шаров. Из них 10 — черных, 4 — белых, 4 — желтых и 2 — красных. Какое количество информации несёт сообщения о цвете вынутого шара?
У скупого рыцаря в сундуке золотые, серебряные и медные монеты. Каждый вечер он извлекает из сундука одну из монет, любуется ею, и кладет обратно в сундук. Информационный объем сообщения "Из сундука извлечена золотая монета" равен трем битам. Количество информации, содержащееся в сообщении "Из сундука извлечена серебряная монета", равно двум битам. Определите информационный объем зрительного сообщения о достоинстве вынутой монеты.
В сейфе банкира Богатеева лежат банкноты достоинством 1, 10 или 100 талеров каждая. Банкир раскрыл свой сейф и наугад вытащил из него одну банкноту. Информационный объем сообщения "Из сейфа взята банкнота достоинством в 10 талеров" равен 3 бита. Количество информации, содержащееся в сообщении "Из сейфа взята банкнота достоинством не в 100 талеров", равно 3-log₂5 бит. Определите информационный объем зрительного сообщения о достоинстве вынутой банкноты.

Модуль 3.

Системы счисления

Тема 3.1 Системы счисления. Представление чисел в различных системах счисления.

Основные понятия: позиционные и непозиционные системы счисления, алфавит, базис, основание системы счисления, порядок.

Условные обозначения:

- задания до чтения текста

- задания во время чтения

- задания после чтения

Используя данные ключевые слова, составьте рассказ из трех-четырех предложений. Ключевые слова: алфавит, цифра, позиция, запись, число. Познакомьтесь с рассказами других студентов вашей группы, сравните их: что в них общего и в чем различие? Придумайте название к вашим рассказам.

Прочитайте текст. Во время чтения делайте пометки на полях: «V» - уже знал; «+» - новая информация; «-» - думал иначе, «?» - не понятно, есть вопросы

Система счисления - совокупность приемов и правил для записи чисел цифровыми знаками. Способов записи чисел цифровыми знаками существует бесчисленное множество. Любая система счисления должна давать возможность представления любого числа в рассматриваемом диапазоне; это представление должно быть единственным, удобным для оперирования с ним. Непозиционная система счисления - система, для которой значение символа не зависит от его положения в числе. Принципы построения таких систем не сложны. Для их образования используют в основном операции сложения и вычитания. Например, система с единым символом - палочкой - встречалась у многих народов. Для изображения какого-то числа в этой системе нужно записать количество палочек, равное данному числу. Эта система не эффективна, так как запись числа получается длинной. Другим примером непозиционной системы счисления является римская система, использующая набор следующих символов: I, X, V, L, C, D, M и т.д. В этой системе существует отклонение от правила независимости значения цифры от положения в числе. В числах LX и XL символ X принимает два различных значения : +10 - в первом случае и -10 - во втором. Позиционная система счисления - система изображения чисел, в которой значение символа зависит от его позиции (местоположения) в числе. В дальнейшем изложении будем рассматривать только позиционные системы. Наибольшее распространение получила десятичная система счисления, в которой для записи чисел используются цифры 0, 1, ..., 9. Самыми распространенными в вычислительной технике являются двоичная, восьмеричная, десятичная и шестнадцатеричная системы счисления. Двоичная система наиболее применима в компьютерной технике. Ее преимущества:

а) простота арифметических и логических операций;
б) возможность применения аппарата алгебры логики для анализа и синтеза различных функциональных модулей.

Десятичная система имеет широкое применение в повседневной жизни. Восьмеричная и шестнадцатеричная системы счисления используются, в основном, для более компактной записи чисел. Символы, при помощи которых записываются числа, называются цифрами, а их совокупность — алфавитом системы счисления. Количество цифр, составляющих алфавит, называется его размерностью. Система счисления называется позиционной, если количественный эквивалент цифры зависит от ее положения в записи числа. В привычной нам десятичной системе значение числа образуется следующим образом: значения цифр умножаются на «веса» соответствующих разрядов и все полученные значения складываются. Например, 2150 = 2*1000 + 1*100 + 5*10 + 0*1. Такой способ образования значения числа называется аддитивно-мультипликативным. Последовательность чисел, каждое из которых задает «вес» соответствующего разряда, называется базисом позиционной системы счисления. Основное достоинство практически любой позиционной системы счисления — возможность записи произвольного числа при помощи ограниченного количества символов. Позиционную систему счисления называют традиционной, если ее базис образуют члены геометрической прогрессии, а значения цифр есть целые неотрицательные числа. Так, базисы десятичной, двоичной, восьмеричной и шестнадцатеричной систем счисления образуют геометрические прогрессии со знаменателями 10, 2, 8 и 16 соответственно. В общем виде базис традиционной системы счисления можно записать так: … q^-3, q^-2, q^-1, q^-0, q, q², q³, …, qⁿ, … Знаменатель q геометрической прогрессии, члены которой образуют базис традиционной системы счисления, называется основанием этой системы счисления. Традиционные системы счисления с основанием q иначе называют q-ичными. В q-ичных системах размерность алфавита равна основанию системы счисления. Так, алфавит десятичной системы составляют цифры 0, 1, 2, 3, 4, 5, б, 7, 8, 9. Алфавитом произвольной системы счисления с основанием q служат числа 0, 1, ... , q-1, каждое из которых должно быть записано с помощью одного уникального символа, младшей цифрой всегда является 0. В класс позиционных систем счисления входят также системы, в которых либо базис не является геометрической прогрессией, а цифры есть целые неотрицательные числа, либо базис является геометрической прогрессией, но цифры не являются целыми неотрицательными числами. К первым можно отнести факториалъную и фибоначчиеву системы счисления, ко вторым — уравновешенные системы счисления. Такие системы будем называть нетрадиционными. Алфавитом фибоначчиевой системы являются цифры 0 и 1, а ее базисом — последовательность чисел Фибоначчи 1,2, 3, 5, 8, 13, 21, 34, 55, 89 ... . Базисом факториальной системы счисления является последовательность 1!, 2!, ... , п!, .... В отношении алфавита этой системы можно сделать замечание: количество цифр, используемых в разряде, увеличивается с ростом номера разряда. В общем случае, если система счисления устроена таким образом, что основание как таковое в ней отсутствует, а базис представляет собой последовательность чисел ..., q_о, q_v ..., q_п, ..., то количество N_k цифр, используемых в k-м разряде, определяется так:

Пример 1.Приведем сводную таблицу, характеризующую некоторые позиционные системы счисления.

Система счисления	Основание	Размерность алфавита	Цифры
Двоичная			0, 1
Троичная			0, 1,2
Восьмеричная			0, 1,2,3,4, 5,6,7
Шестнадцате-ричная			0,1,2,3,4,5,6,7, 8, 9, А, В, С, D, E, F
Факториальная	Нет	Увеличивается с ростом номера разряда	1-й разряд: 0, 1 2-й разряд: 0, 1, 2 3-й разряд: 0, 1, 2, 3
Фибоначчиева	Нет		0,1
Уравновешенная троичная			1,0,1

Основанием Р-ичной системы счисления может быть любое натуральное число, большее единицы. Системой счисления с минимальным основанием является двоичная система, все числа в которой записываются с помощью 0и 1.

Пример 2.Приведем запись некоторых десятичных чисел в различных нетрадиционных позиционных системах счисления.

Десятичная система счисления	Факториальная система счисления	Фибоначчиева система счисления	Уравновешенная троичная система счисления

Мы видим, что для описания системы счисления используются понятия «базис», «алфавит», «основание».

Для однозначного определения позиционной системы счисления, у которой в качестве цифр используются натуральные числа и 0, необходимо и достаточно указать только ее базис: последовательность чисел ..., q_о, q_v ..., q_п, .... Все остальные компоненты системы являются производными от базиса.

Последовательность чисел может являться базисом позиционной системы счисления только тогда, когда в соответствующей этому базису системе может быть представлено любое число (если система предназначена только для нумерации целых чисел, то любое целое число).

В качестве цифр систем счисления могут быть использованы любые символы, это наглядно демонстрируют нам ученые, занимающиеся историей математики: вавилоняне использовали клиновидные цифры (у них не было бумаги, и «писали» они на мягких глиняных дощечках); китайцы использовали иероглифы; мы используем арабские цифры. Однако в математике придерживаются следующих договоренностей в отношении вида используемых цифр.

Если основание системы счисления Р меньше 10, то для символьного представления цифр в ней, как правило, используются первые Р десятичных цифр (от 0 до Р - 1). Например, в пятеричной системе счисления будут использоваться пять цифр: 0, 1, 2, 3, 4.

Для 10 < Р < 37 в качестве первых десяти цифр также обычно используют их десятичное представление, а для остальных цифр — буквы латинского алфавита.

Для систем счисления с основаниями, большими 36, единых правил для формы записи цифр не существует.

Для двоичной, восьмеричной, десятичной и шестнадцатеричной систем счисления приведем обозначения цифр:

q = 10 :	a_i = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
q = 8 :	a_i = 0, 1, 2, 3, 4, 5, 6, 7;
q = 2 :	a_i = 0, 1;
q = 16 :	a_i = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,	A, , C, D, E, F;
Десятичное значение:	10, 11, 12, 13, 14, 15

Любое десятичное число можно представить в любой позиционной системе счисления, а для целых чисел в большинстве систем это можно сделать единственным способом.

Пусть q — произвольное натуральное число, большее единицы. Существует и единственно представление любого натурального числа A в виде степенного ряда:

<1 234 5 6 7 >

Дата добавления: 2016-09-20; просмотров: 1494;

helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.025 сек.