Методы воспроизведения и обработки данных
Воспроизведение и обработка данных
Поскольку все сигналы имеют энергетическую, то есть материальную, природу, то и данные — тоже объекты материальной природы. Данные всегда объективны. Их можно посмотреть, потрогать, услышать. Что именно можно сделать с конкретными данными, зависит от их физической природы, но в любом случае данные можно каким-то образом воспроизвести. Это вытекает из определения данных как зарегистрированных сигналов. Если у нас есть средства, чтобы зафиксировать факт регистрации сигнала, значит, у нас непременно есть и средства для воспроизведения данных, образовавшихся в момент такой регистрации.
Для обычного человека текст, который он видит в документе, — это данные. Но для эксперта-криминалиста данными может быть текст, которого в документе нет (удален в результате подчистки). Разумеется, обычный наблюдатель и эксперт-криминалист получат в этом случае разную информацию из одного и того же документа. Это различие связано с тем, что они пользуются разными методами доступа к данным.
Для того чтобы данные стали информацией, обычно требуется не один, а множество взаимосвязанных методов. Вот пример для обычного текста, напечатанного темными буквами на светлом фоне.
1. Чтобы рассмотреть текст, наблюдатель должен обладать
методом зрения. Хотя зрение — это естественный метод,
присущий большинству людей, но не все люди им обла
дают.
2. Необходимо достаточное освещение, то есть нужен ме
тод для его обеспечения. Освещение — это физический
метод, основанный на использовании естественного или
искусственного света.
3. Необходимо знать азбуку (систему кодирования звуков)
того языка, на котором написан текст.
■
4. Надо знать язык, на котором написан текст.
5. Надо понимать термины и понятия, использованные в со
общении.
Последние три метода — логические. Они связаны с мышлением человека и не доступны от рождения, а приобретаются в результате обучения. Кстати, обратим внимание на то, что если бы текст был напечатан черными буквами на черном фоне, то количество методов в цепочке стало бы больше. К естественным и логическим методам потребовалось бы добавить технические, например, исследование текста в ультрафиолетовых лучах.
Группы методов воспроизведения и обработки данных
Естественные методы
Естественные методы воспроизведения данных присущи человеку и другим организмам живой природы. Если мы говорим о человеке, то прежде всего к естественным методам относим все методы, основанные на его органах чувств (зрение, осязание, обоняние, слух и вкус).
Вам, конечно, знакома разница между внимательным и невнимательным наблюдением. И в том и в другом случае на сетчатке глаза образуются совершенно одинаковые данные, но информацию мы получаем разную. Это связано с тем, что при вниматель-
ном наблюдении мозг применяет более сложные методы обработки данных.
Хороший пример того, как из одних и тех же данных образуется разная информация, представляют собой стереограммы. Их следует рассматривать так, чтобы левый и правый глаз фокусировались в разных точках рисунка. В этом случае мозг обрабатывает данные иным методом, и вместо регулярного узора мы можем наблюдать скрытое объемное изображение.
Кроме методов, основанных на органах чувств, человек обладает и другими методами обработки данных. К ним относится, например, логическое мышление. Оно позволяет работать с данными, не имеющими объективных аналогов в материальном мире. К прочим естественным методам, присущим человеку и основанным на особенностях его мышления, можно отнести воображение, сравнение, сопоставление, анализ, прогнозирование и другие.
■ . |
Аппаратные методы
До последнего времени методы обработки данных можно было разделить на естественные и технические. Однако в связи с бурным развитием вычислительной техники в последние годы в классе технических методов четко выделились два направления: аппаратные и программные методы, способные во многих случаях подменять или дополнять друг друга.
Аппаратные методы взаимодействия с данными используют в тех случаях, когда физическая природа данных не позволяет применять для их воспроизведения и обработки естественные методы, основанные на органах чувств. Простейший пример — радиосигналы и другие сигналы электромагнитной природы. Человек не имеет органов чувств для их регистрации и потому вынужден использовать аппаратные методы. С примерами таких методов вы знакомы: они представлены приборами, например, телеприемниками и радиоприемниками.
Аппаратные методы — это всегда устройства (приборы). Широко известны такие устройства воспроизведения данных, как магнитофоны, видеомагнитофоны, телефоны, рентгеновские
аппараты, телескопы, микроскопы и многие другие. С точки зрения физики все эти устройства обладают разными принципами действия и выполняют разные функции. С точки зрения информатики эти устройства (приборы) выполняют общую функцию — преобразуют данные из формы, недоступной для естественных методов человека, в форму, доступную для них.
В отдельных случаях данные должны проходить через достаточно длинные цепочки преобразования аппаратными средствами, прежде чем станут доступны для восприятия человеком и из них образуется информация. Поскольку разные приборы выпускаются разными предприятиями, между различными устройствами возможны проблемы совместимости. Не всегда одни устройства могут обрабатывать данные, созданные другими приборами. В таких случаях применяют специальные устройства преобразования данных, но уже говорят не о преобразовании формы данных, а о преобразовании их формата. Например, видеозапись, выполненную с помощью любительской видеокамеры, нельзя передать по каналам телевизионного вещания без предварительного преобразования. В таких случаях данные из формата, в котором работают бытовые видеокамеры, преобразуют в формат, с которым работают профессиональные средства телевещания и видеотехники.
,.Программные методы
Широкое внедрение средств вычислительной техники позволяет автоматизировать обработку самых разных видов данных с помощью компьютеров. Компьютер — это прибор особого типа, в котором одновременно сочетаются аппаратные и программные методы обработки и представления информации. Эти методы составляют предметную область информатики, и мы познакомимся с ними более подробно в последующих главах, а сейчас приведем лишь несколько примеров того, как программные методы влияют на содержание информации, представленной в данных.
Два изображения, представленные ниже, получены в результате обработки одних и тех же данных разными программными средствами.
2x2 = 4 |
2x2 = 4
Эти данные различаются только форматированием, по-разному выполненным компьютерной программой. Ниже представлен противоположный пример, когда данные, совпадающие с точностью до символа, в результате применения программного метода форматирования представляют противоположную информацию.
казнить нельзя, ПОМИЛОВАТЬ |
КАЗНИТЬ,
нельзя помиловать
1.1.3. Понятие информации
Научное определение информации дается достаточно просто, если предположить, что информация — это динамический (богатый действием, движением) объект, не существующий в природе сам по себе, а образующийся в ходе взаимодействия данных и методов. Он существует ровно столько, сколько длится это взаимодействие, а все остальное время пребывает в виде
данных.
Информация — это продукт взаимодействия данных и методов, рассмотренный в контексте этого взаимодействия.
В этом определении ничего не говорится о форме, в которой представлены данные, а она может быть абсолютно любой. Если данные графические, а метод взаимодействия — наблюдение, то образуется визуальная информация. Если данные текстовые или речевые, а метод их потребления — чтение или прослушивание, образуется текстовая информация. А могут ли текстовые данные быть графической информацией? Разумеется, да, если к ним применен не метод чтения, а метод наблюдения.
В нашем определении важным является пояснение «...рассмотренный в контексте этого взаимодействия». Приведем примеры, почему это действительно важно. Известно, что книги — это хранилища данных. Они предназначены для получения информации методом чтения. Но если попробовать разные
книги на ощупь или на вкус, то тоже можно получить информацию. Такие методы позволят различить книги, выполненные в кожаных, картонных и бумажных переплетах. Разумеется, это не те методы, которые предполагались авторами книг, но они тоже дают информацию, хотя и не полную.
Известны примеры того, что не только текст или состав бумаги письма, но и его запах может давать информацию об авторе. Пользуясь этим методом, можно отправлять в конверте даже чистый лист. Получателю он даст информацию о том, кто помнит и думает о нем. Возможно, в некоторых случаях она будет недостоверной (ложной), но это все-таки будет информация.
Анализируя информационную ценность газет, журналов, телепередач, мы можем прийти к выводу, что она зависит как от данных, так и от методов, которыми выполняется их потребление. Одно дело — внимательно просматривать телефильм, вслушиваясь в каждое слово, и совсем другое — смотреть его, одновременно разговаривая по телефону.
Попробуйте проанализировать свое участие в учебных занятиях. Вы заметите, что фактор внимательности влияет на содержание информации, полученной из данных, которые излагает преподаватель. Проявляя внимательность, мы расширяем возможности естественных методов, основанных на органах чувств, за счет методов логического мышления. Правда, при этом мы быстрее утомляемся и потому стараемся делать это как можно реже. Преподаватели об этом знают и применяют свои методы, позволяющие нам время от времени переключать, рассеивать, а потом вновь концентрировать внимание.
■ ' •■ ' . '
1.1.4. Понятие контекстного метода
и особенности информационного процесса
в вычислительной технике
' ■
В быту мы часто считаем, что книги, газеты, журналы, радио и телевидение — это источники информации. Если строго подходить с позиций информатики, то это не совсем так. Все это
источники данных. Станут ли данные информацией или нет и, если станут, то какой именно, зависит от того, какой метод будет применен к их потреблению и в каких условиях это произойдет.
Тем не менее мы все-таки привыкли говорить не о передаче данных, а о передаче информации, не о преобразовании и шифровании данных, а о преобразовании и шифровании информации, а также об ее автоматической обработке с помощью компьютеров. Нет ли здесь противоречия?
Такое противоречие действительно есть, но оно разрешается, если ввести понятие контекстного метода. Контекстным считается тот метод, который является общепринятым для работы с данными определенного типа. Этот метод должен быть известен как создателю данных, так и потребителю информации.
Для иллюстраций (графических данных) контекстным является метод наблюдения, основанный на зрении. Для текстовых данных подразумевается контекстный метод чтения, основанный на зрении и знании языка и азбуки.
Есть свои особенности и у компьютерной информации. Для данных, представленных в числовой форме и хранящихся на магнитных носителях, контекстными являются аппаратные и программные методы вычислительной техники. Их еще называют средствами информационных технологий.
В вычислительной технике информационный процесс протекает в ходе взаимодействий данных и методов. Однако он имеет особенность, связанную с тем, что некоторые этапы происходят автоматически, без участия человека. В ходе этих этапов данные взаимодействуют как с аппаратными (компьютерами и другими устройствами), так и с программными методами (компьютерными программами). При этом важной особенностью компьютерных программ является их двойственная природа. С одной стороны, они проявляют себя как методы, а с другой — как данные.
Компьютерные программы могут существовать в двух фазах: активной и пассивной. В активной фазе программа работает совместно с оборудованием, ее команды управляют процессором, который под их воздействием обрабатывает данные и взаимо-
действует с другим оборудованием. В пассивной фазе компьютерная программа ничем от данных не отличается. Ее точно так же можно хранить, транспортировать по каналам связи, воспроизводить в виде печатного текста или экранного изображения. Ее можно даже обрабатывать другими программами. Программу, представленную как данные, можно редактировать, т.е. изменять ее содержание.
■
■ 1.1.5. Свойства информации
Итак, информация является динамическим объектом, образующимся в момент взаимодействия объективных данных и субъективных методов. Как и всякий объект, она обладает свойствами (объекты различимы по своим свойствам). Характерной особенностью информации, отличающей ее от других объектов природы и общества, является отмеченный выше дуализм: на свойства информации влияют как свойства данных, составляющих ее содержательную часть, так и свойства методов, взаимодействующих с данными в ходе информационного процесса. По окончании процесса свойства информации переносятся на свойства новых данных, т.е. свойства методов могут переходить на свойства данных. Это очень важное обстоятельство. Необходимо помнить о том, что объективные и достоверные на первый взгляд данные могут таковыми не оказаться из-за того, что на отдельных этапах информационного процесса к ним были применены необъективные или неадекватные методы.
Адекватность информации
Под адекватностью понимают степень соответствия информации, полученной потребителем, тому, что автор вложил в ее содержание (т.е. в данные). Поскольку информация является продуктом взаимодействия данных и методов, то на ее свойства, в том числе и на адекватность, влияют как адекватность данных, так и адекватность методов.
Рассмотрим два примера.
1) II + II = IIII
2) II + II = IV
В первом случае мы имеем адекватные данные. Применив к ним естественный метод наблюдения и логический метод счета, мы получим адекватную информацию о том, что 2 + 2 = 4. Именно это и имел в виду автор.
Во втором случае данные не выглядят адекватными, и метод счета не позволит получить адекватную информацию. Однако если мы знаем правила записи римских цифр (обладаем адекватным методом), то мы все равно получим адекватную информацию о том, что II + II = IV, или (что то же самое) 2 + 2 = 4.
Адекватность информации иногда ошибочно путают с ее достоверностью. Это совершенно разные свойства. В литературе и искусстве имеются такие понятия, как авторский вымысел и авторский домысел. Если произведение научной фантастики соответствует своему жанру и выполняет свои функции, то оно несет адекватную информацию, а вопрос о ее достоверности не поднимается.
Достоверность информации
Под достоверностью информации понимается ее соответствие объективной реальности (как текущей, так и прошедшей) окружающего мира. На достоверность информации влияет как достоверность данных, так и адекватность методов, использованных при ее получении.
Недостоверность информации может быть связана с тем, что данные изначально были подготовлены как ложные (например, оставление на месте преступления объектов с отпечатками пальцев посторонних лиц) в результате модификации данных (удаление отпечатков пальцев с объекта) или в результате того, что данные трудно выделить на фоне регистрации посторонних сигналов (объект с отпечатками пальцев преступника несет многочисленные отпечатки пальцев посторонних лиц).
Полнота информации
Под полнотой информации понимается ее достаточность для принятия решения. Она зависит как от полноты данных, так и от наличия необходимых методов. С понятием полноты данных сталкиваются все, кому приходится выполнять служебные задания. Если исходные данные неполны, принять верное решение непросто. Однако бывают случаи, когда данные полны, а верное решение мы все равно получить не можем. Это свидетельствует о том, что мы не располагаем какими-то методами. И в том и в другом случае можно говорить, что необходимой информации недостаточно. То, что мы не можем расшифровать данные, не значит, что они недоступны вообще. Нужно найти метод для их расшифровки.
Избыточность информации
Избыточность информации — это свойство, полезность которого мы ощущаем очень часто. Нередко избыточность информации человек чисто психологически воспринимает как ее качество, потому что она позволяет ему меньше напрягать свое внимание и меньше утомляться.
Обычный текст, напечатанный на русском языке, имеет избыточность порядка 20—25%. Попробуйте отбросить каждую пятую букву, и вы увидите, что получить информацию из печатного текста все же можно, хотя читать его будет очень утомительно. Нам нередко приходится иметь дело с небрежным рукописным почерком. Избыточность информации, заключенной в тексте, оказывает добрую службу, позволяя догадываться о значении неразборчивых символов.
Визуальная информация, которую мы получаем органами зрения, имеет очень большую избыточность — более 90%. Это означает, что, даже потеряв значительную часть визуальной информации, мы все-таки можем понимать ее содержание, хотя и не без концентрации внимания. Люди, лишенные большой доли зрения, продолжают оставаться полноценными членами общества, но испытывают повышенное утомление.
Еще большую избыточность имеет видеоинформация (до 98— 99%). Эта избыточность позволяет нам рассеивать внимание,
что часто воспринимается как отдых при просмотре кинофильма. Кстати, избыточность в мультипликационных фильмах намного меньше, и потому они быстрее утомляют. Оптимальная продолжительность просмотра мультипликационного фильма в несколько раз меньше, чем художественного.
С избыточностью информации связаны и другие свойства. Чем выше избыточность данных, тем шире диапазон методов, с помощью которых из них можно получить адекватную информацию. Расшифровка шумерской клинописи не могла произойти до тех пор, пока в результате археологических раскопок не был накоплен достаточный объем (более 5000) глиняных табличек. Избыточность информации позволяет повышать ее достоверность за счет применения специальных методов, в том числе и основанных на теории вероятностей и математической статистике. Общий принцип здесь такой: в результате отсева объем данных сокращается, но их достоверность увеличивается.
Особое значение избыточность информации имеет в информационных технологиях, ориентированных на автоматическую обработку данных. С одной стороны, это свойство рассматривается как негативное, потому что если информация занимает больший объем, чем могла бы, то это ведет к прямым затратам на ее хранение и, главное, на транспортировку. Можем рассмотреть две картинки, полученные из Интернета. Они различаются по объему данных в 8 раз. Соответственно, затраты на прием и хранение первой картинки в 8 раз больше. Если беглый просмотр — единственный метод, который мы собираемся к ним применить, избыточность информации бесполезна. В таких случаях ее уменьшают. Для этого есть специальные программные методы сжатия данных.
Всякое сокращение избыточности данных непременно влечет за собой сокращение диапазона возможных методов для их использования. В информационных технологиях вопрос избыточности данных и достаточности методов — это всегда вопрос тонкого и непростого баланса. При изучении информатики мы постоянно будем заниматься вопросами создания, хранения, преобразования и транспортировки данных. Подбор и освоение необходимых для этого аппаратных и программных средств и
методов —одна из основных задач, решаемых информатикой. При этом основное внимание уделяется не просто решению задач, а методам наиболее эффективного их решения с минимальными затратами материальных, финансовых и трудовых ресурсов.
Объективность и субъективность информации
Понятие объективности информации является относительным, поскольку методы являются субъективными. Более объективной принято считать ту информацию, в которую методы вносят меньший субъективный элемент. Так, например, принято считать, что в результате наблюдения фотоснимка объекта образуется более объективная информация, чем в результате наблюдения рисунка того же объекта, выполненного человеком.
Доступность информации
Доступность информации — это мера возможности получить ту или иную информацию. На степень доступности информации влияют одновременно как доступность данных, так и доступность адекватных методов для их интерпретации. Отсутствие доступа к данным или отсутствие адекватных методов обработки данных приводят к одинаковому результату: информация оказывается недоступной. Отсутствие адекватных методов для работы с данными во многих случаях приводит к применению неадекватных методов, в результате чего образуется неполная, неадекватная или недостоверная информация.
Актуальность информации
Актуальность — это степень соответствия информации текущему моменту времени. Нередко с актуальностью, как и с полнотой, связывают коммерческую ценность информации. Лица, не владеющие ключом (методом) для чтения данных, могут заняться поиском ключа, поскольку алгоритм метода обычно доступен, но продолжительность этого поиска столь велика, что за время работы информация теряет актуальность и, соответственно, связанную с ней практическую ценность.
ДАННЫЕ
■ |
Дата добавления: 2015-04-25; просмотров: 1347;