Форматы файлов электронных документов

 

Прежде всего, отметим, что у документов различают фор­маты физические и технические. Под физическим форматом имеется в виду форма существования документа в природе: бумажный, электронный и др. Под техническим форматом в случае с электронными документами подразумевается формат файла электронного документа.

Существует множество различных форматов файлов. В це­лом, их можно разделить на «однопрограммные», то есть конт­ролируемые и поддерживаемые только одним программным разработчиком, и «многопрограммные», которые поддержива­ются несколькими разработчиками и могут обрабатываться различными программами.

Перечислим основные форматы (см. таблицу):

1. Текстовые форматы. Они чаще всего создаются при по­мощи текстовых процессоров. Наиболее распространенными текстовыми форматами являются:

однопрограммные форматы MS Word, Word Perfect.; формат RТF (Rich Text Format), который поддерживается различными программными приложениями и при этом со­храняет заданное форматирование текста; формат РDF (Рortable Document Format), который содержит изображение страницы, включающее текст и графику. Фай­лы в формате РDF могут быть прочитаны при помощи раз­личных программ, предназначенных только для чтения фай­лов, однако создаются только при помощи программы Adobe Acrobat.

2. Графические форматы. Они хранят изображение (напри­мер, фотографию, рисунок) и делятся на два основных типа:

• векторные форматы, которые хранят изображение как набор геометрических фигур. Среди них наиболее распространены:

формат DXF, широко приме­няемый в программах компьютерного дизайна, используе­мых инженерами, архитекторами,

формат ЕРS, широко используе­мый в настольных издательских системах,

формат СGМ, широко приме­няемый во многих графических редакторах (например, в редакторе фотошеп).

• растровые форматы, которые хранят изображение как на­бор точек - пикселей. При изменении масштаба изображения растровая графика получает искажения. Среди растровых фор­матов наиболее распространены:

формат ВМР (Bitmap) - относительно низкокачественный формат, чаще всего используемый в текстовых процессорах;

формат ТIFF, широко применяе­мый во многих программных приложениях;

формат GIF, широко исполь­зуемый в программах, предназначенных для Интернета.

3. Форматы баз данных создаются при помощи специаль­ных программных средств - систем управления базами дан­ных (СУБД).

СУБД позволяет устанавливать связи между элементами информации базы данных, выполнять различные операции с информацией базы данных (поиск, индексирование, выполне­ние различных математических операций, генерация отчетов и справок и т.д.). Примерами СУБД являются Microsoft SQL Server, Oracle, MySQL и др.

Например, база данных о покупателях может содержать поля с именами покупателей, адресами и сведениями о покупках. Эти поля могут быть организованы в отдельные таблицы (например, одна таблица для всех полей с именами покупателей).

Базы данных можно конвертировать в текстовый формат, но при этом будут утрачены связи между полями и таблицами (например, может получиться десять страниц имен, десять страниц адресов и тысяча страниц сведений о покупках, то есть бессвязная информация).

4. Форматы электронных таблиц. Файлы в формате элект­ронных таблиц хранят в ячейках числа и взаимосвязи междуэтими числами. Например, одна ячейка может содержать фор­мулу, которая суммирует данные двух других ячеек. Как и файлы баз данных, файлы электронных таблиц обычно имеют фор­мат той программы, при помощи которой созданы. Некоторые программы могут импортировать и экспортировать данные
других источников, в том числе программ, предназначенных для такого обмена данными (например, формат DIF). Файлы электронных таблиц можно преобразовать в текстовые файлы, но значения и взаимосвязи между числами при этом будут утрачены.

5. Видео- и аудио-форматы. Эти форматы содержат дви­жущиеся изображения (например, цифровое видео, анимацию) и звуковые данные, которые чаще всего создаются и просмат­риваются при помощи соответствующих программ и хранятся в однопрограммном формате. Наиболее используемыми из них являются форматы Quick Time и МРЕG .

Языки разметки, также называемые форматами разметки, содержат встроенные инструкции по отображению и понят­ности содержания файла.

Термин «разметка» в области информационных юхпопогий понимает­ся как текст, выражающий информацию о документе*

SGML, который ис­пользуется во многих странах мира в государственных орга­нах и является международным стандартом ;

НТМL, который используется для отображения почти всей информации в сети;

ХМL, относительно простой язык, основанный на SGML и получивший популярность при управлении информацией и обмене ею.

Таблица. Наиболее распространенные форматы файлов

Тип формата Основные форма­ты Примеры файлов Описание
Текстовые форматы PDF, RTF, ТХТ, однопрограммные форматы (на­пример, MS Word Корреспонденция , отчеты, записки, со­общения электрон­ной почты, сохранен­ные в текстовом формате Созданные или сохра­ненные в виде текста (могут содержать и гра­фику)
Векторная графика DXF, ЕРS, СGМ Архитектурные пла­ны, сложные иллюст­рации Хранят изображение в виде геометрических фигур
Растровая графика ВМР, ТIFF, GIF, JPEG Графика веб­страниц, простые иллюстрации, фото­графии Хранят изображение как набор пикселей. При из­менении масштаба изо-
Файлы баз данных Однопрограммные форматы Адресные книги, спи­ски рассылки Создаются в системах управления базами дан-
Форматы электронных таблиц Однопрограммные форматы, DIF Финансовый анализ, статистические каль­куляции Хранят числовые значе­ния и калькуляции
Видео- и аудио-форматы Quick Time и МРЕG Короткие видеозапи­си, показываемые на веб-сайте, записи интервью Содержат движущиеся изображения и звук
Языки разметки SGML , НТМL, ХМL Текст и графика, по­мещенные на веб­сайте Содержат встроенные инструкции по отображе­нию и понятности содер­жания файла или множе­ства файлов

Каждый из форматов файлов имеет свои достоинства и не­достатки при использовании в документационном обеспече­нии управления. Например, текстовые форматы (MS Word Word Perfect.; RТF и др.) удобны для проведения контекстно­го поиска по документам в базе данных, а графические форматы (PDF, ТIFF и др.) позволяют получить при сканировании сражение документа со всеми его внешними особенностя ми, хранить документы в том же виде, что и на бумаге со все­ми подписями и визами.

Формат MS Word, например, весьма удобен при редакти-ании документа и групповой работе с ним, однако файл MS Word хранит много скрытой информации (прежде всего о еде ных в файле изменениях) и, следовательно, весьма удобен с точки зрения утечки служебной информации. В ряде случаев, таких, например, как коммерческое предложение или зкт контракта, скрытая информация позволяет установить вы были исходные предположения, кто оказал на текст наи' льшее влияние. При групповой подготовке документа анализ правки дает возможность узнать не только фамилии лю­дей, ее сделавших, но и кто какой именно вклад внес в итоговый вариант.

Следует отметить, что ни один из форматов файлов элект­ронных документов не может считаться универсальным для длительного архивного хранения, поскольку довольно быстро меняются техника, технологии и программное обеспечение. Уже сегодня непросто воспроизводить документы, созданные в текстовых процессорах Word Perfect на современном оборудовании. Легко ли будет, например, использовать архи­вный документ в формате MS Word 97 лет через 10-15?

Скорее всего, разнообразие форматов будет сохранено. Поэтому архивные службы разрабатывают нормативные усло­вия для архивного хранения электронных документов различных форматов, прежде всего, наиболее распространенных PDF и ХМL.

Тем не менее, в настоящее время большие надежды связываются с использованием формата ХМL в качестве стандар­тного для обмена электронными документами в различных сферах деятельности, особенно, в сфере государственного управления.

 








Дата добавления: 2016-01-29; просмотров: 5077;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.005 сек.