Понятие текстовой информации, текстового документа и обработки текстовой информации

Наиболее наглядно понятие информации отражается в определе­нии информационных данных. Информационные данные — это всякие сведения, сообщения, знания, которые могут храниться, перерабаты­ваться, передаваться, но характер информации приобретают лишь то­гда, когда получают содержание и форму, пригодную для управления, и используются в управлении.

Информация обладает свойством структурированности, которое наглядно проявляется в тексте, написанном на естественном языке. Текст представляет собой цепочку знаков, расположенных в опреде­ленном порядке, а элемент цепочки — знак — принимает одно из воз­можных значений некоторого известного набора — алфавита. Знако­вая форма, которой является любой естественный язык, составляет формальную структуру информации, передающую ее содержание. По­скольку информация носит семантический (смысловой) характер, то ее содержание составляют понятия, выраженные в знаковой (языко­вой) форме. Из этого вытекает другое важное свойство информации: большинство ее видов имеют языковую природу.

Текстовая информация является одним из видов информации. Любой текст, произнесенный, записанный или отпечатанный на лю­бом естественном языке, представляет собой сообщение. Сообщение — это конкретная форма, содержащая информацию, иными словами, информация передается посредством конкретного сообщения.

Сообщение представляется на некотором языке. Языковые сооб­щения могут передаваться различными способами: устной речью, письмом, печатным текстом и т.п. Языковые сообщения дискретны (прерывисты) и строятся последовательной записью знаков (и проме­жутков между ними), т.е. являются последовательностями знаков.

Знак — это элемент некоторого конечного множества отличных друг от друга элементов. Такое множество элементов называют набо­ром знаков. Набор знаков, в котором определен линейный порядок, на­зывают алфавитом (например, алфавит латинских букв, алфавит гре­ческих букв, алфавит десятичных цифр).

Таким образом, любой текст представляет собой некоторое дис­кретное сообщение, имеющее форму последовательности знаков од­ного или нескольких алфавитов, отделенных друг от друга промежут­ками и дополнительными вспомогательными знаками, и содержащее определенную информацию.

Текст (кроме устного) фиксируется тем или иным образом в знако­вой форме на некотором материальном носителе и является в этом виде источником информации.

Документальный источник (документ) — средство закрепления на материальном носителе информации о фактах, событиях, явлениях ре­ального мира и мыслительной деятельности человека.

Документы, знаками которых являются алфавиты естественных языков, называют текстовыми. Это произведения письменности, пе­чати, книги, журналы и т.п.

Среди технологий воспроизведения текстовых документов наибо­лее распространенными на сегодняшний день являются:

— издательско-полиграфическая (конечный продукт является ре­зультатом печатания (печати) вообще и полиграфии в частности);

— мультимедиа (объединенное использование в рамках компью­терной технологии видео-, аудиоинформации, текста, графики и ани­мации);

— Web- публикация.

С технической точки зрения в процессе воспроизведения тексто­вого документа осуществляется размножение информации в виде за­писанных (в том числе в кодированном виде) и хранящихся на матери­альном носителе оптических сигналов, воспринимаемых органами зрения. Рассматривая этот процесс как часть информационного, т.е. как процесс передачи информации от источника к потребителю по­средством знаков и знаковых систем, можно считать воспроизведение текстового документа в целом каналом переработки информации (ин­формационным каналом), а оборудование и процессы — информаци­онным сервисом, функционирующим в соответствии с алгоритмами и методами переработки информации.

Исходным объектом для воспроизведения текстового документа является информация в виде рукописей и изобразительных оригина­лов (текстовые документы в значительном числе случаев содержат изо­бражения, уточняющие, дополняющие, иллюстрирующие содержание передаваемой информации).

Конечным продуктом воспроизведения является информация в виде отпечатанной продукции (средства информации — книги, бро­шюры, газеты, журналы, буклеты и т.п., средства организации — ка­лендари, ежедневники, справочники и т.п., средства упаковки), про­дукты мультимедиа, в том числе электронные издания, Web-публикации. В этом случае материальные объекты на разных этапах обработки информации в технологии воспроизведения играют роль лишь мате­риальных носителей информации.

Текстовая информация имеет знаковую (символьную) форму, и ее содержательная, т.е. смысловая (семантическая), часть не зависит от конкретной графической формы (рисунок, начертание, размер) шрифта.

При изготовлении текстового (текстовой части) документа вход­ным сигналом служит текстовой авторский оригинал для набора.
В нем заложено только смысловое содержание информации. Внешняя
же форма (т.е. собственно рисунок шрифта и в целом текста, его ком­
позиционное расположение на странице) еще только должна быть создана, но она, как уже отмечалось, не повлияет на смысловое содержание информации.

Таким образом, под обработкой текстовой информации в процессе воспроизведения текстового документа подразумевают смысловую композиционную и графическую организацию текста в документе в целом, в его отдельной части (разделе), на отдельной странице и в пределах ее структурно-композиционных элементов.

Смысловая организация текстового документа достигается по­средством соответствующей содержанию компоновке подразделов ос­новного текста, дополнительных и вспомогательных текстов докумен­та (редакционно-издательская, в том числе дизайнерская, подготовка публикации). Композиционная организация реализуется посредством надлежащего взаимного расположения текстовых и нетекстовых эле­ментов на отдельных страницах и в документе в целом (верстка), гра­фическая — за счет использования соответствующих шрифтов и гра­фических оформительских элементов (набор и верстка).

Под набором понимают процесс получения (формирования) строк текстового документа. Этот термин используют также для обозначения набранного тем или иным способом текста (т.е. результата наборного процесса).

Верстка — это процесс получения (формирование) полосы (стра­ницы) текстового документа.

Страницу документа, являющуюся одной из его структурно-ком­позиционных единиц, можно представить как некоторую графиче­скую композицию. Такая графическая композиция содержит в соот­ветствии с установленными правилами определенным образом распо­ложенные (организованные) знаки и изображения. В то же время стра­ница — это некоторая часть содержания документа (издания). Иными словами, графическая композиция знаков и изображений является но­сителем информации, передаваемой потребителю (читателю) посред­ством понятий (языковыми средствами — текстом и условными обо­значениями — идеограммами) и зрительных образов, возникающих при восприятии.

Процесс обработки текстовой и иллюстрационной информации, несмотря на большое разнообразие способов, воспроизведения сво­дится к трем основным технологическим операциям:

1) к набору и верстке текста,

2) репродуцированию (воспроизведению) иллюстраций,

3) верстке полос (страниц).

Все перечисленные операции представляют собой подготовку текстового документа к публикации — PreMedia. В случае подготовки пе­чатной публикации к перечисленным операциям добавляется опция изготовления печатной формы (если таковая предусмотрена технологией печати). Допечатную подготовку называют также PrePress.


В дальнейшем файл текстового документа размещают на сервере Web-публикация), записывают на компакт- или DVD-диск (элек­тронное издание, мультимедиа-продукт), тиражируют (печатная пуб­ликация).








Дата добавления: 2015-01-13; просмотров: 3299;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.005 сек.