ВИРТУАЛЬНАЯ РЕАЛЬНОСТЬ И ПРИНЦИП ИНТЕРАКТИВНОСТИ

Два понятия сегодня полностью определяют все те существенные перемены, которые произошли в области отечественного телевизионного вещания за последние десять лет, – интерактивность и виртуальная реальность. Слова эти приобрели почти ритуальный смысл, заменяющий сколь-нибудь рациональное их содержание. Стоит ли доказывать, что всякий термин, прежде чем стать общеупотребительным, должен пройти сложный путь лексической адаптации, порой вовсе не связанный с его содержательным научным анализом. Любой лингвист знает, что частота употребления той или иной словоформы в определённом контексте может с лёгкостью заменить истинное её смысловое значение. В век, когда средства массовой коммуникации тиражируют понятия, повторяя их миллионы раз, и приучают таким образом аудиторию не только к звучанию, но и к навязываемому (порой искажённому) их смыслу, трудно сопротивляться процессу стремительной адаптации самых специфических понятий в обычной, повседневной речи. По сути дела, слово «интерактивность» постигла судьба другого, столь же знакового, слова – «компьютер». На вопрос, что такое компьютер, мы, наверника, получим самый пёстрый спектр мнений, но общим здесь, будет, пожалуй, мнение, что компьютер – это нечто, делающее за человека всё, что угодно, заменяющее ему всё, что угодно, вплоть до окружающей действительности, позволяющее человеку связаться с кем угодно и где угодно. Причём эмоциональная оценка самого этого понятия окажется столь разнообразной, что может сложиться впечатление, будто речь идёт о тысяче различных артефактов, а не об одном и том же достаточно объяснимом в техническом отношении средстве обработки информации. Перекочевавший со страниц фантастических романов на газетные полосы термин «компьютер» из средств массовой информации термин компьютер оброс ореолом неправдоподобных, домысленных, придуманных, истинных и полуистинных свойств, частью которых он не обладал никогда, частью – мог бы обладать при определённых условиях, а частью – обладал изначально. Ныне в общеупотребительном смысле, слово «компьютер» означает не электронный прибор, быстро обрабатывающий информацию, а прибор, совместно с человеком решающий его информационные проблемы, то есть тандем человек – компьютер декларируется априори, при этом два понятия «машина» и «интеллект» становятся неуловимо неразделимыми. Здравый смысл говорит о том, что пока интеллект управляет машиной, всё подконтрольно и управляемо. Но если интеллект и машина сольются?.. Здесь и начинается зона прогнозов, далекая от науки. В системе машина, обрабатывающая информацию, и интеллект, её порождающий (или порождающий правила её действия – алгоритм), явно выделяются три функциональных блока, которые обеспечиваются совершенно различными механизмами. Компьютер в таком понимании является не просто неделимым артефактом, как, например, колесо или ложка, но составным объектом, собранным из «деталей» различной природы. Природа одной – суть электронная начинка, которая «умеет» быстро передавать электронные импульсы из одной ячейки в другую, запоминать, то есть накапливать и хранить некоторые из них и при определённых условиях изменять содержание части ячеек на противоположное. Это – электронное сердце компьютера как очеловеченной, имеющей эмоциональную окраску и социальное значение системы. Вторая часть – алгоритм – изначально сконструирована человеком. Алгоритм – то самое условие, по которому ячейки изменяют своё содержимое. Он – сложнейший комплекс правил, на основе которых бегут и изменяются электронные импульсы в микроскопических электронных блоках. Алгоритм бестелесен, он – чистое порождение разума, отражение мысли человека. Он подобен нравственной норме, категорическому императиву, непреложному закону. Он диктует норму движения электронных частиц, но несёт на себе отпечаток личности, создавшей его. Алгоритм – это рафинированное, доведенное до абстрактной бестелесности отражение неповторимого человеческого «Я». Третья часть имеет визуальную форму. Она – зримое выражение взаимодействия алгоритма и электронной основы, условный код столкновения мысли и технологии – алгоритма и его результата. По сути дела, двумерная плоская поверхность экрана (а ведь до сих пор многие считают, что компьютер и монитор это одно и то же) является неким символом договоренности между создателями алгоритмов и теми, кто ими пользуется, «юзерами», о том, что тот или иной символ (комбинация электронных импульсов, и не более) означает то или иное понятие. Семиотика знаков, отображаемых монитором, с абсолютной точностью вписывается в законы общей семиотики: знак, безусловно указывающий на некоторый объект, – указатель; знак, символизирующий понятие на основе принятых всеобщих соглашений, – символ; знак, изображающий объект или понятие, – грамма, икона.

То, что мы непосредственно видим, слышим или воспринимаем тактильно с помощью сложных электронных посредников в результате сложнейшего взаимодействия алгоритма и электронной схемы компьютера, в наибольшей степени и ассоциируется с ним. Именно на этом уровне мы говорим о том, что компьютер «разговаривает», «понимает», «тормозит», «рисует» и «распознает», только на этом, верхнем, уровне взаимодействия семиотики экрана (или иного устройства) и нашего сознания мы взаимодействуем со сложным электронным «нутром» компьютера. Этот системообразующий фактор, являющийся частью алгоритма, называется интерфейсом. Идеология интерфейса – ключевой вопрос взаимодействия человека и компьютера, так как именно на его уровне строится их «взаимопонимание», которое принято обозначать термином «интеракция». Рассматривая принципы коммуникативной идентификации субъектов Юрген Хабермас определяет суть интеракции как «действия не связанных между собой и самодостаточных субъектов, из которых каждый должен действовать так, как если бы он был единственным существующим сознанием, и все же одновременно мог обладать уверенностью, что все его действия при моральных законах с необходимостью и изначально совпадают с моральными действиями (поступками) всех возможных других субъектов»(1).
При этом взаимодействие в ходе коммуникативной интеракции не следует смешивать с понятием социального взаимодействия в условиях определенной морально-этической, нравственной предсубпозиции, которое тот же Хабермас называет стратегическим действием.

Он пишет, что активное стратегическое действие есть «позитивное отношение воли одного субъекта к воле другого», которое «не содержит потенциальной потребности в коммуникации и замещено трансцендентально необходимым совпадением локальных целей деятельностей при абстрактно всеобщих законах». Иными словами, стратегическое действие, в отличие от коммуникативной интеракции, стремится к сочетанию целеустановок равноправно и равноудаленно существующих сторон, каждая из которых (в идеале) самодостаточна и самоценна и не нуждается в иной стороне, кроме как для реализации данной целедеятельности. При этом «решение между альтернативными возможностями может и должно быть принято как принципиально монологичное, то есть без предварительного согласования, поскольку обязательные для каждого партнера правила предпочтения и максимы согласованы заранее» на уровне социальных и нравственных норм. Итак, следует предположить, что коммуникативная интеракция предусматривает не монологическое, а диалогическое начало по некоему предварительному согласованию условий, которые не установлены единожды и навсегда, а могут меняться по ходу взаимодействия, согласовываясь в процессе самого взаимодействия.Логично было бы предположить, что условия сторон подобного общения не могут быть абсолютно идентичны, так как одна из них обязательно реализует некоторую потребность, вызвавшую коммуникативную интенцию, другая – определяет условия взаимодействия. Таким образом, изначальная ролевая неидентичность участников интеракции априори определяет их взаимную зависимость и подчинённость, при которой одна сторона является источником коммуникативной потребности и удовлетворяет её за счёт другой, последняя формирует условия, при которых интеракция реализуема. Следовательно, принцип интеракции оставляет право на сколь угодно полную ролевую реверсию участников коммуникации, которые могут произвольно менять свое место в качестве таковых. Подобно тому, как в философском смысле интеракция является общим понятием взаимодействия, взаимообщения между неидентичными и наделенными самодостаточным сознанием субъектами реальной действительности, интеракция между человеком и компьютером определяет процесс взаимодействия между ними, а если говорить более точно, то между человеком-пользователем и человеком-программистом, личность которого отображена в электронной форме в виде алгоритма, заложенного в электронную память машины. А поскольку компьютер есть инструмент, при помощи которого человек получает удовлетворение некоторых информационных потребностей, то интеракция есть процесс управления человеком процессами обработки информации и способами её кодировки, то есть превращения в понятную и желаемую для него знаковую систему. В любом случае, как бы ни канонизировалось само понятие интерактивности на странницах популярных СМИ и в устах популярных деятелей информационного бизнеса, понятие интерактивности требует серьезнейшего научного осмысления как с философской и социологической, так и с коммуникативной точки зрения. Другой многократно растиражированный сегодня термин, в отношении которого существует некоторая путаница, – «виртуальная реальность». Явление, принятое так называть, имеет столь сложные гносеологические (отчасти метафизические) корни, что осмысление процессов виртуализации всех сторон жизнедеятельности человечества – если таковое в принципе возможно – дело далекого будущего. В самом деле, обобщённый мир выдуманных героев, существующий в совокупном пространстве литературных произведений, едва ли менее реален, нежели то, что существует в действительности, но отделено от конкретного индивидуума пространством или временем. Художественное осмысление действительности порождает огромные пласты эмоционально-чувственного и рационально-понятийного нематериального бытия, которое существует только в проекции на сознание индивидуума. Подобная же визуализированная псевдодействительность, созданная на базе приближенных к реальности моделей, виртуальная реальность, теперь уже сосуществует с реальностью объективной на равных правах как в духовной сфере искусства, так и в предметной сфере науки и образования. Необходимо принципиально разграничить трактовку терминов «виртуальная реальность» и «компьютерная мультипликация», которые зачастую путают друг с другом в силу схожести их внешней, визуальной атрибутики.

Виртуальную реальность не следует понимать как своего рода универсальное средство анимации героев, процессов (или анимации в широком смысле), что, по существу, делает её одним из методов создания зрелища некоей совершенной электронной кистью. Можно трактовать виртуальную реальность как модель реально не существующего пространства, но обладающую всеми необходимыми законами взаимодействия и взаимоотношения элементов, определяющими его существование и развитие. В рамках данной модели с заложенными в неё законами существования каждого включённого элемента и системой их взаимодействия мы можем говорить о новом – смоделированном – пространстве-времени, существующем не в материальном, а в информационном воплощении(аудиовизуальном, графическом, акустическом, текстовом, знаковом, математическом). Одним из способов взаимодействия виртуальной реальности с человеческим сознанием и органами чувств является визуализация той псевдореальной действительности, с моделью которой мы имеем дело. При этом когда человек вторгается в данное виртуальное пространство, то он вынужден существовать в нём, подчиняясь его виртуальным законам, которые он не в состоянии изменить, становясь тем самым элементом нового виртуального мира, обретая в нём форму своего информационного двойника.

Виртуальные ядерные катаклизмы, заменяющие в качестве модели взрывы настоящие, имеют высочайшее научное и познавательное значение. Смоделированные виртуальные биологические механизмы раскрывают тайны живых организмов, а воссозданная в виртуальном мире визуализированная реальность заставляет плакать и смеяться миллионы зрителей в невиртуальных кинозалах. То, что еще вчера требовало гигантских затрат, сегодня переходит в реальность из мира виртуального и начинает собственное, отдельное существование в виде произведения искусства. Причем дискуссии о правомерности подобного сосуществования не возникают в силу априорной условности любого вида искусства, которое вправе использовать различные способы отображения образного видения мира. Компьютерная графика – отображение виртуального мира моделей в визуальном, доступном восприятию органами чувств (зрением) воплощении – появилась в качестве утилитарного средства моделирования в военных лабораториях США и быстро нашла потребителя за пределами военного ведомства. С самого начала она поражала воображение, казалось бы, запредельными возможностями изобразить то, что еще не существует (в 1986 году на ежегодном форме компьютерной анимации в Монте-Карло американские аниматоры продемонстрировали ролик, в котором еще не созданные истребители с вертикальным взлетом совершают посадку на лесную дорогу для дозаправки горючим), или то, что нельзя увидеть по разным причинам (например, воссоздание последних секунд гибели пассажирского авиалайнера, смоделированное по показаниям «чёрного ящика»). Виртуальная реальность и компьютерная мультипликация, выйдя за рамки подобных секретных проектов, стали инструментом познания и средством воплощения самых смелых творческих замыслов.

Виртуальный герой, в отличие от мультипликационного, не связан жёсткими рамками авторского замысла, он существует как в пространстве – разумеется, виртуальном, так и во времени – но уже настоящем. Именно время существования зрителя по эту сторону экрана и героя внутри него объединяет их и делает возможным взаимодействие между ними.

Проводя аналогию, мы можем говорить о мультипликации, как об отпечатке виртуальной реальности на действительность, воплощенную в изображение, видеозапись, отображенную одномоментно на экране во время трансляции действия и существующую только в тот временной интервал, когда эта трансляция происходит, тогда как виртуальная реальность (по аналогии) существует вне времени демонстрации, в другом пространственном или псевдопространственном измерении.

Виртуальный герой взаимодействует с аудиторией подобно герою реальному, являясь самостоятельной моделью или моделью реально существующего человека, сканированного, превращенного в модель посредством технических ухищрений и совершенных компьютерных программ. Поэтому виртуальный герой представляется более естественным для трансляционного и интерактивного телевидения, нежели мультипликационный, что доказывает практика использования анимационных персонажей в телепрограммах, а анимационный герой более предпочтителен для телевидения художественного. Можно также сравнить виртуального героя с куклой, управляемой кукловодом в реальном времени и потому способной вести полноценный диалог с телевизионной аудиторией. С точки зрения пространства художественного она тоже является неким виртуальным объектом на момент собственного существования. Но, развивая данную аналогию, мы неминуемо вторгнемся в область дискуссий о сущности искусства в виртуальном пространстве: будучи отделенным от человеческого мышления, оно едва ли может трактоваться как искусство в общепринятом понимании. Так, легко себе представить некое действие, воплощенное в виртуальной среде с помощью живых, но «оцифрованных» персонажей, действующих, по замыслу драматурга и режиссера, в реальном времени. Возможен ли при подобном подходе акт возникновения искусства или это принципиально иное явление? Пожалуй, данная дилемма требует перехода на другой уровень осмысления, в иную «систему координат», когда следует говорить о самой возможности воплощения авторского замысла в форме виртуального действия и когда об искусстве как таковом можно будет говорить лишь в том случае, если этот замысел осуществится. Следовательно, опасения творцов относительно рождения суррогатного виртуального, кибернетического искусства лежат не в сфере сущности искусства как производного человеческого мышления, а в области коммерциализации – того, что именуют массовой культурой.
Виртуальная реальность в потенциале способна создавать «продукты», имеющие признаки художественности и без участия творца, а лишь по заданной модели (или группе моделей), однако к искусству это отношения иметь не будет. Вторжение виртуальных методик в телевидение качественно изменяет его с точки зрения формы, но не контента, содержания, прерогатива на которое не может быть отделена от человека, автора, создателя и социальной в нем потребности. Достаточно упомянуть всё более широкое использование в практике телевидения так называемых виртуальных студий, все отличие которых от традиционных рир-проекционных технологий заключается в том, что фон живет по собственным «непространственным» и нефизическим законам, а связан с реальным изображением героя неразрывными оптическими законами перспективы и геометрическим единством. Другими словами, для зрителя виртуальная студия предоставляет сложнейший комплекс визуальных впечатлений, где первый план, то есть герой, вполне реален и действует в рамках привычных пространственных и физических закономерностей, но второй план существует по собственным законам, где не имеют силы законы физики, сколь угодно растянуто или сжато и время, и пространство, причинно-следственные взаимодействия расколоты, мир динамичен и замыкается на некую собственную, этому миру присущую, логику.

Сложные виртуальные студии достигают вполне реалистичного изображения окружающего героя пространства и даже позволяют создавать иллюзию взаимодействия с ним, когда объекты, выглядящие хрупкими, при падении бьются на части, а жидкими – расплываются, когда прикосновение к предмету виртуального мира дает мгновенную, похожую на истинную реакцию, когда виртуальный герой и герой реальный существуют в гармонии как визуальной, так и коммуникационной: разговаривают, пожимают друг другу руки, похлопывают друг друга по плечу. Разумеется, на какой-то стадии достижения эффекта полного реализма начинает стираться грань между реальным и виртуальным, между документальным отображением существующего объекта и визуализированной виртуальной моделью. Такие методики создания виртуального мира могут привести к весьма серьезным последствиям в области искусства, так как дают художнику столь неограниченные перспективы создания собственных вымышленных миров, не отличимых от настоящих, что, по существу, следует говорить о предпосылках рождения нового вида искусства, если для этого будут необходимые условия эстетического и социального характера. «Независимая ценность художественного артефакта тем выше, чем больший пучок внеэстетических ценностей сумеет привлечь к себе артефакт и чем сильнее он сумеет динамизировать их взаимоотношения»(2). В этом смысле статическое понимание ценности произведения искусства представляется абсолютно неправомерным, правильнее было бы рассматривать его в комплексе характеристик аудитории, индивидуума, воспринимающего артефакт, социального контекста коммуникативного акта, а также того средства, которое зрелище создаёт. Методики создания виртуального мира в корне отличаются от традиционных технологий искусства, теперь между сознанием, создающим образ, и этим образом, воплощенным в визуальной форме, не существует посредника в виде камеры или, если угодно, кисти и карандаша. Мы вправе говорить о новом витке эволюции визуальных искусств – если не о эволюции искусства вообще. Первый этап был ознаменован опосредованием образа в изображении или объекте как принцип «эстетизации» утилитарного объекта. Второй – техническим опосредованием искусства (появление камеры-обскуры, отделившей изображение от органа зрения). И, наконец, теперь мы можем говорить об отделении искусства от объектов реальной действительности, в наличии которых новое искусство более не нуждается, так как способно, минуя стадию его отражения в объективе или ином приборе, создавать изображение прямой и непосредственной его репрезентацией. Созданный в воображении этот искусственный мир, существующий только как отпечаток на мониторе или телеэкране, может стать ареной сколь угодно драматических действ, а значит даст искусству новое пространство для реализации авторских замыслов. Фильмы «Парк Юрского периода» Спилберга, «Форест Гамп» Земекиса и, разумеется, «Титаник» Камерона – пионеры виртуальных киномиров и виртуальных киногероев – открыли новую эру создания кино и видеоизображения, которые уже не столь неразрывно связаны с реальным пространством и его состоянием на момент производства. При этом внедрение виртуальных методик в творчество ни в коей мере не сделало его вторичным, оно сумело реализовать себя посредством совершеннейшей компьютерной техники, и это ставит точку в споре по поводу «губительной для искусства» виртуализации. Приведем достаточно пространную цитату, иллюстрирующую сказанное нами. «Компьютеры давно превратились в неотъемлемую часть технического оснащения киностудий. Всем, конечно, памятны захватывающие эпизоды из популярных картин, создание которых было бы немыслимо без применения сверхмощных ЭВМ. Однако работа их до сих пор сводилась в основном к созданию спецэффектов и анимационных компонентов. Пожалуй, еще ни разу компьютеры не были «допущены» к главным действующим лицам. Первый опыт производства фильма, героев которого «оживляют» при помощи вычислительных машин, предприняла компания Pixar, руководимая основателем Apple Computer Стивом Джобсом. Не будет преувеличением сказать, что лента «Toy Story»… стала настоящей сенсацией. Сюжет «Toy Story» незамысловат и напоминает обычную детскую сказку… Этот фильм, по сути, ничем не выделялся бы среди сотен других, если бы не одно обстоятельство: компьютерная анимация кукольных персонажей заставляет зрителя поверить в то, что они и в самом деле живые. По словам создателей фильма, расчёт динамики трехмерных объектов, включающей движения, пластику и деформации, потребовал привлечения огромных вычислительных ресурсов... Долгий по традиционным меркам срок создания ленты объясняется по меньшей мере двумя причинами. Во-первых, Pixar разрабатывала технологию практически с нуля, решая попутно огромное количество проблем технического характера, а во-вторых, группе из 27 художников-мультипликаторов, привыкших к обычной покадровой съемке рисованных сцен, пришлось переучиваться на ходу. В основе методики, предложенной Pixar, лежит условное разбиение произвольных движений и деформаций объекта на элементарные составляющие, описываемые числовыми параметрами. Общее количество этих параметров – более 700, причем законы их изменения столь сложны, что любое, даже самое незначительное движение персонажа приходится просчитывать несколько часов, а иногда и дней. Один из авторов проекта признался, что при выборе материала, из которого по сценарию должны быть изготовлены куклы – герои фильма, специалисты Pixar руководствовались в первую очередь техническими, а не художественными соображениями. В итоге остановились на таком материале, как жесткий, не допускающий деформаций пластик: иначе машины попросту захлебнулись бы в потоке вычислений. Студия Pixar уже имеет один «Оскар» за компьютерную систему создания фильмов». Подобные тенденции действительно ложатся в основу глубинных изменений телевидения с точки зрения самих принципов создания зрелища. Уже сегодня наряду с адекватно отображенными событиями действительности на экране равноправно существует виртуально созданная компьютерная графика – от чисто декоративного элемента заставки до вполне очеловеченного, наделенного личностными характеристиками героя, действующего в самых разнообразных виртуальных пространствах, реализованных с помощью компьютера. Эти первые шаги телевидения по адаптации тех, поистине неограниченных перспектив, которые дают ему новые технологии, существенно меняют облик современного телевидения, которое в корне отличается от того, каким оно было всего лишь десятилетие назад.

3. Критерии качества передачи и обработки изображения и звука. Рассмотрим представление графической информации в ЭВМ. Побитовые изображения Обработка графической информации требует своего способа кодирования. Любое изображение представляется в виде огромного числа отдельных мельчайших точек. Обычная картинка на экране может содержать до миллиона таких точек. Простейшим изображением является чёрно-белое. В этом случае одна точка изображения может кодироваться одним битом, например 0 - чёрная точка, 1 - белая. Для запоминания изображения из 1 миллиона точек в этом случае потребуется около 100.000 байт. Цветное изображение требует большего числа байтов, причём, чем больше используется цветов, тем больше требуется байтов. При работе с 16-цветными изображениями одна точка требует 4 бита, т.е. один байт содержит информацию о двух точках изображения. Работа с 256-цветными изображениями требует уже целого байта для одной точки и около 1 миллиона байт для всего изображения. Наиболее реалистичные изображения используют 2 или даже 3 байта на одну точку, что позволяет выводить 65536 или более 16 млн. цветовых оттенков соответственно, но требует все больших затрат памяти. Все это говорит о том, что обработка графической информации для компьютера является гораздо более сложной задачей по сравнению с обработкой числовой и текстовой информации. Векторная графика Используются готовые графические примитивы (линии, прямоугольники, овалы и др.). Они описываются в координатной форме с указанием цвета их элементов. Чтобы закодировать целый рисунок, его необходимо разбить на точки. Чем больше будет точек и чем меньше они будут, тем точнее будет передача рисунка. Когда рисунок разбит на точки, то начиная с левого верхнего угла и двигаясь по строкам слева направо, кодируется цвет каждой точки. Когда все точки рисунка закодированы, получается последовательность байтов. (например: 175, 176, 128, 65, 65, 80, 55, 80, 80, 214, 210, ...) Закодировать рисунок несложно, а вот как его раскодировать, чтобы опять получилось то, что было? Если раскодировать байты по одному слева направо, то никогда не узнаешь, где кончается одна строка и начинается другая. Это говорит о том, что чего-то не хватает. Если бы перед группой байтов приписать еще небольшой заголовок, из которого было бы ясно, как надо эти байты раскодировать, то все стало бы на свои места. Этот заголовок может быть, например таким: {8х8}. По нему можно догадаться, что рисунок должен состоять из 8-ми строк по 8 строчек в каждой строке. Заголовок можно сделать еще подробнее, например, так: {8х8х3} - тогда можно догадаться, что это рисунок цветной, в котором на кодирование цвета каждой точки использовано 3 байта. Представление видеоинформации в ЭВМ Видеоинформация может быть как статической, так и динамической. Статическая видеоинформация включает текст, рисунки, графики, чертежи, таблицы и др. Рисунки делятся также на плоские - двухмерные и объёмные - трёхмерные. Динамическая видеоинформация - это видео-, мульт- и слайд- фильмы. В их основе лежит последовательное экспонирование на экране в реальном масштабе времени отдельных кадров в соответствии со сценарием. Динамическая видеоинформация используется либо для передачи движущихся изображений (анимация), либо для последовательной демонстрации отдельных кадров вывода (слайд-фильмы). Для демонстрации анимационных и слайд-фильмов используются различные принципы. Анимационные фильмы демонстрируются так, чтобы зрительный аппарат человека не мог зафиксировать отдельных кадров. В современных высококачественных мониторах и в телевизорах с цифровым управлением электронно-лучевой трубкой кадры сменяются до 70 раз в секунду, что позволяет высококачественно передавать движение объектов. При демонстрации слайд-фильмов каждый кадр экспонируется на экране столько времени, сколько необходимо для восприятия его человеком (обычно от 30 с до 1 мин). Слайд-фильмы можно отнести к статической видеоинформации. Способы представления информации в ЭВМ, кодирование и преобразование кодов в значительной степени зависят от принципа действия устройств, в которых эта информация формируется, накапливается, обрабатывается и отображается. Непосредственная дискретизация (оцифровка) побитовых изображений, сменяющихся со скоростью 30 кадров в секунду + цифровой звук. При разрешении 640*480 и глубине цвета 24 бита для хранения одного кадра требуется 900К. Одна секунда – 26,4М, что требует сжатия данных. Современные проблемы представления информации В настоящее время компьютерам приходится передавать, хранить и обрабатывать всё большие объемы информации различных типов. Например, это могут быть большие архивы изображений, коллекции аудио треков или видеофильмов. Все эти типы информации занимают много места на диске (особенно, если это *.bmp, *.wav и *.avi файлы) и требуют довольно больших вычислительных мощностей. С другой стороны растут потребности пользователей. Им надо не только хранить и просматривать подобную информацию у себя на компьютере, но и передавать её по сети. Это всё накладывает определённые требования как на виды представления информации, так и на аппаратное обеспечение. Относительно представления информации можно выделить следующие требования: 1. Информация должна быть компактной, то есть занимать немного места на диске и не должна требовать много времени для передачи её по сети. Это требует мощных алгоритмов сжатия информации. 2. При сжатии информации потери должны быть небольшими, то есть при сжатии графических изображений, звуковой или видеоинформации не должно страдать качество информации (качество картинки, звука и т.д.). Это требует применение алгоритмов сжатия без потери, либо, если применение таких алгоритмов невозможно, тщательный подбор коэффициентов сжатия в алгоритмах сжатия с потерей. 3. Алгоритмы сжатия должны быть симметричны, то есть время, потраченное на компрессию информации, должно быть примерно равно времени, потраченному на декомпрессию этой информации. В отношении хранения и обработки различных видов информации уже достигнуты определенные успехи. Существующие на сегодняшний день аудио форматы mp3 и mp3 pro, а также видео форматы mpeg4 или divX плотно вошли в нашу жизнь и успешно используются разными пользователями. Эти форматы позволяют уменьшить размеры исходной информации в 5-6 раз и без потери качества. Но, несмотря на это, эти форматы не очень удобны для передачи информации по сети, хотя формат mp3 очень популярен в Internet’e, но все же он не позволяет прослушать музыку Online. Лишь графический формат jpeg помимо всего прочего активно используется для передачи графической информации по сети. Вследствие всего этого, появляется задача разработать такие форматы для аудио и видеоинформации, которые позволили бы не только хранить подобную информации у себя на компьютере, но и быстро передавать её по сети. И подобные наработки уже есть. Были разработаны форматы потокового аудио и видео (real audio & real video). Но у подобных форматов качество звука и изображения очень низкое даже на быстрых выделенных каналах связи. Поэтому развитие форматов потокового аудио и видео, позволяющих быстро передавать звук и изображение по сети, но без потери качества – есть одна из основных проблем и задач сегодняшнего дня. Алгоритмы сжатия изображений Общие положения алгоритмов сжатия изображений В течение последних 10 лет в рамках компьютерной графики бурно развивается совершенно новая область — алгоритмы архивации изображений. Появление этой области обусловлено тем, что изображения — это своеобразный тип данных, характеризуемый тремя особенностями: 1. Изображения (как и видео) занимают намного больше места в памяти, чем текст.Так, скромная, не очень качественная иллюстрация на обложке книги размером 500x800 точек, занимает 1.2 Мб — столько же, сколько художественная книга из 400 страниц (60 знаков в строке, 42 строки на странице). В качестве примера можно рассмотреть также, сколько тысяч страниц текста мы сможем поместить на CD-ROM, и как мало там поместится качественных несжатых фотографий. Эта особенность изображений определяет актуальность алгоритмов архивации графики. 2. Второй особенностью изображений является то, что человеческое зрение при анализе изображения оперирует контурами, общим переходом цветов и сравнительно нечувствительно к малым изменениям в изображении. Таким образом, мы можем создать эффективные алгоритмы архивации изображений, в которых декомпрессированное изображение не будет совпадать с оригиналом, однако человек этого не заметит. Данная особенность человеческого зрения позволила создать специальные алгоритмы сжатия, ориентированные только на изображения. Эти алгоритмы обладают очень высокими характеристиками. Мы можем легко заметить, что изображение, в отличие, например, от текста, обладает избыточностью в 2-х измерениях. Т.е. как правило, соседние точки, как по горизонтали, так и по вертикали, в изображении близки по цвету. Кроме того, мы можем использовать подобие между цветовыми плоскостями R, G и B в наших алгоритмах, что даёт возможность создать ещё более эффективные алгоритмы. Таким образом, при создании алгоритма компрессии графики мы используем особенности структуры изображения. Всего на данный момент известно минимум три семейства алгоритмов, которые разработаны исключительно для сжатия изображений, и применяемые в них методы практически невозможно применить к архивации ещё каких-либо видов данных. Для того, чтобы говорить об алгоритмах сжатия изображений, мы должны определиться с несколькими важными вопросами: · Какие критерии мы можем предложить для сравнения различных алгоритмов? · Какие классы изображений существуют? · Какие классы приложений, использующие алгоритмы компрессии графики, существуют, и какие требования они предъявляют к алгоритмам? Рассмотрим эти вопросы подробнее. Классы изображений Статические растровые изображения представляют собой двумерный массив чисел. Элементы этого массива называют пикселами (от английского pixel — picture element). Все изображения можно подразделить на две группы — с палитрой и без нее. У изображений с палитрой в пикселе хранится число — индекс в некотором одномерном векторе цветов, называемом палитрой. Чаще всего встречаются палитры из 16 и 256 цветов. Изображения без палитры бывают в какой-либо системе цветопредставления и в градациях серого (grayscale). Для последних значение каждого пиксела интерпретируется как яркость соответствующей точки. Встречаются изображения с 2, 16 и 256 уровнями серого. Одна из интересных практических задач заключается в приведении цветного или чёрно-белого изображения к двум градациям яркости, например, для печати на лазерном принтере. При использовании некой системы цветопредставления каждый пиксел представляет собой запись (структуру), полями которой являются компоненты цвета. Самой распространенной является система RGB, в которой цвет представлен значениями интенсивности красной (R), зеленой (G) и синей (B) компонент. Существуют и другие системы цветопредставления, такие, как CMYK, CIE XYZccir60-1 и т.п. Ниже мы увидим, как используются цветовые модели при сжатии изображений с потерями. Для того, чтобы корректнее оценивать степень сжатия, нужно ввести понятие класса изображений. Под классом понимается некая совокупность изображений, применение к которым алгоритма архивации даёт качественно одинаковые результаты. Например, для одного класса алгоритм даёт очень высокую степень сжатия, для другого — почти не сжимает, для третьего — увеличивает файл в размере. (Известно, что многие алгоритмы в худшем случае увеличивают файл.) Рассмотрим следующие примеры неформального определения классов изображений: Класс 1. Изображения с небольшим количеством цветов (4-16) и большими областями, заполненными одним цветом. Плавные переходы цветов отсутствуют. Примеры: деловая графика — гистограммы, диаграммы, графики и т.п. Класс 2. Изображения, с плавными переходами цветов, построенные на компьютере. Примеры: графика презентаций, эскизные модели в САПР, изображения, построенные по методу Гуро. Класс 3. Фотореалистичные изображения. Пример: отсканированные фотографии. Класс 4. Фотореалистичные изображения с наложением деловой графики. Пример: реклама. Развивая данную классификацию, в качестве отдельных классов могут быть предложены некачественно отсканированные в 256 градаций серого цвета страницы книг или растровые изображения топографических карт. (Заметим, что этот класс не тождественен классу 4). Формально являясь 8- или 24-битными, они несут даже не растровую, а чисто векторную информацию. Отдельные классы могут образовывать и совсем специфичные изображения: рентгеновские снимки или фотографии в профиль и фас из электронного досье. Достаточно сложной и интересной задачей является поиск наилучшего алгоритма для конкретного класса изображений. Итог: Нет смысла говорить о том, что какой-то алгоритм сжатия лучше другого, если мы не обозначили классы изображений, на которых сравниваются наши алгоритмы. Классы приложений Рассмотрим следующую простую классификацию приложений, использующих алгоритмы компрессии: Примеры: Издательские системы в широком смысле этого слова. Причём как готовящие качественные публикации (журналы) с заведомо высоким качеством изображений и использованием алгоритмов архивации без потерь, так и готовящие газеты, и информационные узлы в WWW, где есть возможность оперировать изображениями меньшего качества и использовать алгоритмы сжатия с потерями. В подобных системах приходится иметь дело с полноцветными изображениями самого разного размера (от 640х480 — формат цифрового фотоаппарата, до 3000х2000) и с большими двуцветными изображениями. Поскольку иллюстрации занимают львиную долю от общего объёма материала в документе, проблема хранения стоит очень остро. Проблемы также создает большая разнородность иллюстраций (приходится использовать универсальные алгоритмы). Единственное, что можно сказать заранее, это то, что будут преобладать фотореалистичные изображения и деловая графика. Пример: Справочники и энциклопедии на CD-ROM. С появлением большого количества компьютеров, оснащенных этим приводом (в США — у 50% машин), достаточно быстро сформировался рынок программ, выпускаемых на лазерных дисках. Несмотря на то, что ёмкость одного диска довольно велика (примерно 650 Мб), её, как правило, не хватает. При создании энциклопедий и игр большую часть диска занимают статические изображения и видео. Таким образом, для этого класса приложений актуальность приобретают существенно асимметричные по времени алгоритмы (симметричность по времени — отношение времени компрессии ко времени декомпрессии). Пример: “Всемирная информационная паутина” — WWW. В этой Класс 1. Характеризуются высокими требованиями ко времени архивации и разархивации. Нередко требуется просмотр уменьшенной копии изображения и поиск в базе данных изображений. Класс 2. Характеризуется высокими требованиями к степени архивации и времени разархивации. Время архивации роли не играет. Иногда подобные приложения также требуют от алгоритма компрессии легкости масштабирования изображения под конкретное разрешение монитора у пользователя. Класс 3. Характеризуется очень высокими требованиями к степени архивации. Приложение клиента получает от сервера информацию по сети. гипертекстовой системе достаточно активно используются иллюстрации. При оформлении информационных или рекламных страниц хочется сделать их более яркими и красочными, что естественно сказывается на размере изображений. Больше всего при этом страдают пользователи, подключенные к сети с помощью медленных каналов связи. Если страница WWW перенасыщена графикой, то ожидание её полного появления на экране может затянуться. Поскольку при этом нагрузка на процессор мала, то здесь могут найти применение эффективно сжимающие сложные алгоритмы со сравнительно большим временем разархивации. Кроме того, мы можем видоизменить алгоритм и формат данных так, чтобы просматривать огрубленное изображение файла до его полного получения. Можно привести множество более узких классов приложений. Так, свое применение машинная графика находит и в различных информационных системах. Например, уже становится привычным исследовать ультразвуковые и рентгеновские снимки не на бумаге, а на экране монитора. Постепенно в электронный вид переводят и истории болезней. Понятно, что хранить эти материалы логичнее в единой картотеке. При этом без использования специальных алгоритмов большую часть архивов займут фотографии. Поэтому при создании эффективных алгоритмов решения этой задачи нужно учесть специфику рентгеновских снимков — преобладание размытых участков. В геоинформационных системах — при хранении аэрофотоснимков местности — специфическими проблемами являются большой размер изображения и необходимость выборки лишь части изображения по требованию. Кроме того, может потребоваться масштабирование. Это неизбежно накладывает свои ограничения на алгоритм компрессии. В электронных картотеках и досье различных служб для изображений характерно подобие между фотографиями в профиль, и подобие между фотографиями в фас, которое также необходимо учитывать при создании алгоритма архивации. Подобие между фотографиями наблюдается и в любых других специализированных справочниках. В качестве примера можно привести энциклопедии птиц или цветов. Итог: Нет смысла говорить о том, что какой-то конкретный алгоритм компрессии лучше другого, если мы не обозначили класс приложений, для которого мы эти алгоритмы собираемся сравнивать. Требования приложений к алгоритмам компрессии В предыдущем разделе мы определили, какие приложения являются потребителями алгоритмов архивации изображений. Однако заметим, что приложение определяет характер использования изображений (либо большое количество изображений хранится и используется, либо изображения скачиваются по сети, либо изображения велики по размерам, и нам необходима возможность получения лишь части...). Характер использования изображений задает степень важности следующих ниже противоречивых требований к алгоритму: Высокая степень компрессии. Заметим, что далеко не для всех приложений актуальна высокая степень компрессии. Кроме того, некоторые алгоритмы дают лучшее соотношение качества к размеру файла при высоких степенях компрессии, однако проигрывают другим алгоритмам при низких степенях. Высокое качество изображений. Выполнение этого требования напрямую противоречит выполнению предыдущего... Высокая скорость компрессии. Это требование для некоторых алгоритмов с потерей информации является взаимоисключающим с первыми двумя. Интуитивно понятно, что чем больше времени мы будем анализировать изображение, пытаясь получить наивысшую степень компрессии, тем лучше будет результат. И, соответственно, чем меньше мы времени потратим на компрессию (анализ), тем ниже будет качество изображения и больше его размер. Высокая скорость декомпрессии. Достаточно универсальное требование, актуальное для многих приложений. Однако можно привести примеры приложений, где время декомпрессии далеко не критично. Масштабирование изображений. Данное требование подразумевает легкость изменения размеров изображения до размеров окна активного приложения. Дело в том, что одни алгоритмы позволяют легко масштабировать изображение прямо во время декомпрессии, в то время как другие не только не позволяют легко масштабировать, но и увеличивают вероятность появления неприятных артефактов после применения стандартных алгоритмов масштабирования к декомпрессированному изображению. Например, можно привести пример “плохого” изображения для алгоритма JPEG — это изображение с достаточно мелким регулярным рисунком (пиджак в мелкую клетку). Характер вносимых алгоритмом JPEG искажений таков, что уменьшение или увеличение изображения может дать неприятные эффекты. Возможность показать огрубленное изображение (низкого разрешения), используя только начало файла. Данная возможность актуальна для различного рода сетевых приложений, где перекачивание изображений может занять достаточно большое время, и желательно, получив начало файла, корректно показать preview. Заметим, что примитивная реализация указанного требования путем записывания в начало изображения его уменьшенной копии заметно ухудшит степень компрессии. Устойчивость к ошибкам. Данное требование означает локальность нарушений в изображении при порче или потере фрагмента передаваемого файла. Данная возможность используется при широковещании (broadcasting — передача по многим адресам) изображений по сети, то есть в тех случаях, когда невозможно использовать протокол передачи, повторно запрашивающий данные у сервера при ошибках. Например, если передается видеоряд, то было бы неправильно использовать алгоритм, у которого сбой приводил бы к прекращению правильного показа всех последующих кадров. Данное требование противоречит высокой степени архивации, поскольку интуитивно понятно, что мы должны вводить в поток избыточную информацию. Однако для разных алгоритмов объем этой избыточной информации может существенно отличаться. Учёт специфики изображения. Более высокая степень архивации для класса изображений, которые статистически чаще будут применяться в нашем приложении. В предыдущих разделах это требование уже обсуждалось. Редактируемость. Под редактируемостью понимается минимальная степень ухудшения качества изображения при его повторном сохранении после редактирования. Многие алгоритмы с потерей информации могут существенно испортить изображение за несколько итераций редактирования. Небольшая стоимость аппаратной реализации. Эффективность программной реализации. Данные требования к алгоритму реально предъявляют не только производители игровых приставок, но и производители многих информационных систем. Так, декомпрессор фрактального алгоритма очень эффективно и коротко реализуется с использованием технологии MMX и распараллеливания вычислений, а сжатие по стандарту CCITT Group 3 легко реализуется аппаратно. Очевидно, что для конкретной задачи нам будут очень важны одни требования и менее важны (и даже абсолютно безразличны) другие. Итог: На практике для каждой задачи мы можем сформулировать набор приоритетов из требований, изложенных выше, который и определит наиболее подходящий в наших условиях алгоритм (либо набор алгоритмов) для её решения. Критерии сравнения алгоритмов Заметим, что характеристики алгоритма относительно некоторых требований приложений, сформулированные выше, зависят от конкретных условий, в которые будет поставлен алгоритм. Так, степень компрессии зависит от того, на каком классе изображений алгоритм тестируется. Аналогично, скорость компрессии нередко зависит от того, на какой платформе реализован алгоритм. Преимущество одному алгоритму перед другим может дать, например, возможность использования в вычислениях алгоритма технологий нижнего уровня, типа MMX, а это возможно далеко не для всех алгоритмов. Так, JPEG существенно выигрывает от применения технологии MMX, а LZW нет. Кроме того, нам придется учитывать, что некоторые алгоритмы распараллеливаются легко, а некоторые нет. Таким образом, невозможно составить универсальное сравнительное описание известных алгоритмов. Это можно сделать только для типовых классов приложений при условии использования типовых алгоритмов на типовых платформах. Однако такие данные необычайно быстро устаревают. Так, например, еще три года назад, в 1994, интерес к показу огрубленного изображения, используя только начало файла (требование 6), был чисто абстрактным. Реально эта возможность практически нигде не требовалась и класс приложений, использующих данную технологию, был крайне невелик. С взрывным распространением Internet, который характеризуется передачей изображений по сравнительно медленным каналам связи, использование Interlaced GIF (алгоритм LZW) и Progressive JPEG (вариант алгоритма JPEG), реализующих эту возможность, резко возросло. То, что новый алгоритм (например, wavelet) поддерживает такую возможность, существеннейший плюс для него сегодня. В то же время мы можем рассмотреть такое редкое на сегодня требование, как устойчивость к ошибкам. Можно предположить, что в скором времени (через 5-10 лет) с распространением широковещания в сети Internet для его обеспечения будут использоваться именно алгоритмы, устойчивые к ошибкам, даже не рассматриваемые в сегодняшних статьях и обзорах. Со всеми сделанными выше оговорками, выделим несколько наиболее важных для нас критериев сравнения алгоритмов компрессии, которые и будем использовать в дальнейшем. Как легко заметить, мы будем обсуждать меньше критериев, чем было сформулировано выше. Это позволит избежать лишних деталей при кратком изложении данного курса. Худший, средний и лучший коэффициенты сжатия. То есть доля, на которую возрастет изображение, если исходные данные будут наихудшими; некий среднестатистический коэффициент для того класса изображений, на который ориентирован алгоритм; и, наконец, лучший коэффициент. Последний необходим лишь теоретически, поскольку показывает степень сжатия наилучшего (как правило, абсолютно черного) изображения, иногда фиксированного размера. Класс изображений, на который ориентирован алгоритм. Иногда указано также, почему на других классах изображений получаются худшие результаты. Симметричность. Отношение характеристики алгоритма кодирования к аналогичной характеристике при декодировании. Характеризует ресурсоемкость процессов кодирования и декодирования. Для нас наиболее важной является симметричность по времени: отношение времени кодирования ко времени декодирования. Иногда нам потребуется симметричность по памяти. Есть ли потери качества? И если есть, то за счет чего изменяется коэффициент архивации? Дело в том, что у большинства алгоритмов сжатия с потерей информации существует возможность изменения коэффициента сжатия. Характерные особенности алгоритма и изображений, к которым его применяют.Здесь могут указываться наиболее важные для алгоритма свойства, которые могут стать определяющими при его выборе. Один и тот же алгоритм часто можно реализовать разными способами. Многие известные алгоритмы, такие как RLE, LZW или JPEG, имеют десятки различающихся реализаций. Кроме того, у алгоритмов бывает несколько явных параметров, варьируя которые, можно изменять характеристики процессов архивации и разархивации. При конкретной реализации эти параметры фиксируются, исходя из наиболее вероятных характеристик входных изображений, требований на экономию памяти, требований на время архивации и т.д. Поэтому у алгоритмов одного семейства лучший и худший коэффициенты могут отличаться, но качественно картина не изменится.

Дата добавления: 2015-10-09; просмотров: 1157;