Понятие текстовой информации, текстового документа и обработки текстовой информации
Наиболее наглядно понятие информации отражается в определении информационных данных. Информационные данные — это всякие сведения, сообщения, знания, которые могут храниться, перерабатываться, передаваться, но характер информации приобретают лишь тогда, когда получают содержание и форму, пригодную для управления, и используются в управлении.
Информация обладает свойством структурированности, которое наглядно проявляется в тексте, написанном на естественном языке. Текст представляет собой цепочку знаков, расположенных в определенном порядке, а элемент цепочки — знак — принимает одно из возможных значений некоторого известного набора — алфавита. Знаковая форма, которой является любой естественный язык, составляет формальную структуру информации, передающую ее содержание. Поскольку информация носит семантический (смысловой) характер, то ее содержание составляют понятия, выраженные в знаковой (языковой) форме. Из этого вытекает другое важное свойство информации: большинство ее видов имеют языковую природу.
Текстовая информация является одним из видов информации. Любой текст, произнесенный, записанный или отпечатанный на любом естественном языке, представляет собой сообщение. Сообщение — это конкретная форма, содержащая информацию, иными словами, информация передается посредством конкретного сообщения.
Сообщение представляется на некотором языке. Языковые сообщения могут передаваться различными способами: устной речью, письмом, печатным текстом и т.п. Языковые сообщения дискретны (прерывисты) и строятся последовательной записью знаков (и промежутков между ними), т.е. являются последовательностями знаков.
Знак — это элемент некоторого конечного множества отличных друг от друга элементов. Такое множество элементов называют набором знаков. Набор знаков, в котором определен линейный порядок, называют алфавитом (например, алфавит латинских букв, алфавит греческих букв, алфавит десятичных цифр).
Таким образом, любой текст представляет собой некоторое дискретное сообщение, имеющее форму последовательности знаков одного или нескольких алфавитов, отделенных друг от друга промежутками и дополнительными вспомогательными знаками, и содержащее определенную информацию.
Текст (кроме устного) фиксируется тем или иным образом в знаковой форме на некотором материальном носителе и является в этом виде источником информации.
Документальный источник (документ) — средство закрепления на материальном носителе информации о фактах, событиях, явлениях реального мира и мыслительной деятельности человека.
Документы, знаками которых являются алфавиты естественных языков, называют текстовыми. Это произведения письменности, печати, книги, журналы и т.п.
Среди технологий воспроизведения текстовых документов наиболее распространенными на сегодняшний день являются:
— издательско-полиграфическая (конечный продукт является результатом печатания (печати) вообще и полиграфии в частности);
— мультимедиа (объединенное использование в рамках компьютерной технологии видео-, аудиоинформации, текста, графики и анимации);
— Web- публикация.
С технической точки зрения в процессе воспроизведения текстового документа осуществляется размножение информации в виде записанных (в том числе в кодированном виде) и хранящихся на материальном носителе оптических сигналов, воспринимаемых органами зрения. Рассматривая этот процесс как часть информационного, т.е. как процесс передачи информации от источника к потребителю посредством знаков и знаковых систем, можно считать воспроизведение текстового документа в целом каналом переработки информации (информационным каналом), а оборудование и процессы — информационным сервисом, функционирующим в соответствии с алгоритмами и методами переработки информации.
Исходным объектом для воспроизведения текстового документа является информация в виде рукописей и изобразительных оригиналов (текстовые документы в значительном числе случаев содержат изображения, уточняющие, дополняющие, иллюстрирующие содержание передаваемой информации).
Конечным продуктом воспроизведения является информация в виде отпечатанной продукции (средства информации — книги, брошюры, газеты, журналы, буклеты и т.п., средства организации — календари, ежедневники, справочники и т.п., средства упаковки), продукты мультимедиа, в том числе электронные издания, Web-публикации. В этом случае материальные объекты на разных этапах обработки информации в технологии воспроизведения играют роль лишь материальных носителей информации.
Текстовая информация имеет знаковую (символьную) форму, и ее содержательная, т.е. смысловая (семантическая), часть не зависит от конкретной графической формы (рисунок, начертание, размер) шрифта.
При изготовлении текстового (текстовой части) документа входным сигналом служит текстовой авторский оригинал для набора.
В нем заложено только смысловое содержание информации. Внешняя
же форма (т.е. собственно рисунок шрифта и в целом текста, его ком
позиционное расположение на странице) еще только должна быть создана, но она, как уже отмечалось, не повлияет на смысловое содержание информации.
Таким образом, под обработкой текстовой информации в процессе воспроизведения текстового документа подразумевают смысловую композиционную и графическую организацию текста в документе в целом, в его отдельной части (разделе), на отдельной странице и в пределах ее структурно-композиционных элементов.
Смысловая организация текстового документа достигается посредством соответствующей содержанию компоновке подразделов основного текста, дополнительных и вспомогательных текстов документа (редакционно-издательская, в том числе дизайнерская, подготовка публикации). Композиционная организация реализуется посредством надлежащего взаимного расположения текстовых и нетекстовых элементов на отдельных страницах и в документе в целом (верстка), графическая — за счет использования соответствующих шрифтов и графических оформительских элементов (набор и верстка).
Под набором понимают процесс получения (формирования) строк текстового документа. Этот термин используют также для обозначения набранного тем или иным способом текста (т.е. результата наборного процесса).
Верстка — это процесс получения (формирование) полосы (страницы) текстового документа.
Страницу документа, являющуюся одной из его структурно-композиционных единиц, можно представить как некоторую графическую композицию. Такая графическая композиция содержит в соответствии с установленными правилами определенным образом расположенные (организованные) знаки и изображения. В то же время страница — это некоторая часть содержания документа (издания). Иными словами, графическая композиция знаков и изображений является носителем информации, передаваемой потребителю (читателю) посредством понятий (языковыми средствами — текстом и условными обозначениями — идеограммами) и зрительных образов, возникающих при восприятии.
Процесс обработки текстовой и иллюстрационной информации, несмотря на большое разнообразие способов, воспроизведения сводится к трем основным технологическим операциям:
1) к набору и верстке текста,
2) репродуцированию (воспроизведению) иллюстраций,
3) верстке полос (страниц).
Все перечисленные операции представляют собой подготовку текстового документа к публикации — PreMedia. В случае подготовки печатной публикации к перечисленным операциям добавляется опция изготовления печатной формы (если таковая предусмотрена технологией печати). Допечатную подготовку называют также PrePress.
В дальнейшем файл текстового документа размещают на сервере Web-публикация), записывают на компакт- или DVD-диск (электронное издание, мультимедиа-продукт), тиражируют (печатная публикация).
Дата добавления: 2015-01-13; просмотров: 3299;