Форматы файлов электронных документов
Прежде всего, отметим, что у документов различают форматы физические и технические. Под физическим форматом имеется в виду форма существования документа в природе: бумажный, электронный и др. Под техническим форматом в случае с электронными документами подразумевается формат файла электронного документа.
Существует множество различных форматов файлов. В целом, их можно разделить на «однопрограммные», то есть контролируемые и поддерживаемые только одним программным разработчиком, и «многопрограммные», которые поддерживаются несколькими разработчиками и могут обрабатываться различными программами.
Перечислим основные форматы (см. таблицу):
1. Текстовые форматы. Они чаще всего создаются при помощи текстовых процессоров. Наиболее распространенными текстовыми форматами являются:
однопрограммные форматы MS Word, Word Perfect.; формат RТF (Rich Text Format), который поддерживается различными программными приложениями и при этом сохраняет заданное форматирование текста; формат РDF (Рortable Document Format), который содержит изображение страницы, включающее текст и графику. Файлы в формате РDF могут быть прочитаны при помощи различных программ, предназначенных только для чтения файлов, однако создаются только при помощи программы Adobe Acrobat.
2. Графические форматы. Они хранят изображение (например, фотографию, рисунок) и делятся на два основных типа:
• векторные форматы, которые хранят изображение как набор геометрических фигур. Среди них наиболее распространены:
формат DXF, широко применяемый в программах компьютерного дизайна, используемых инженерами, архитекторами,
формат ЕРS, широко используемый в настольных издательских системах,
формат СGМ, широко применяемый во многих графических редакторах (например, в редакторе фотошеп).
• растровые форматы, которые хранят изображение как набор точек - пикселей. При изменении масштаба изображения растровая графика получает искажения. Среди растровых форматов наиболее распространены:
формат ВМР (Bitmap) - относительно низкокачественный формат, чаще всего используемый в текстовых процессорах;
формат ТIFF, широко применяемый во многих программных приложениях;
формат GIF, широко используемый в программах, предназначенных для Интернета.
3. Форматы баз данных создаются при помощи специальных программных средств - систем управления базами данных (СУБД).
СУБД позволяет устанавливать связи между элементами информации базы данных, выполнять различные операции с информацией базы данных (поиск, индексирование, выполнение различных математических операций, генерация отчетов и справок и т.д.). Примерами СУБД являются Microsoft SQL Server, Oracle, MySQL и др.
Например, база данных о покупателях может содержать поля с именами покупателей, адресами и сведениями о покупках. Эти поля могут быть организованы в отдельные таблицы (например, одна таблица для всех полей с именами покупателей).
Базы данных можно конвертировать в текстовый формат, но при этом будут утрачены связи между полями и таблицами (например, может получиться десять страниц имен, десять страниц адресов и тысяча страниц сведений о покупках, то есть бессвязная информация).
4. Форматы электронных таблиц. Файлы в формате электронных таблиц хранят в ячейках числа и взаимосвязи междуэтими числами. Например, одна ячейка может содержать формулу, которая суммирует данные двух других ячеек. Как и файлы баз данных, файлы электронных таблиц обычно имеют формат той программы, при помощи которой созданы. Некоторые программы могут импортировать и экспортировать данные
других источников, в том числе программ, предназначенных для такого обмена данными (например, формат DIF). Файлы электронных таблиц можно преобразовать в текстовые файлы, но значения и взаимосвязи между числами при этом будут утрачены.
5. Видео- и аудио-форматы. Эти форматы содержат движущиеся изображения (например, цифровое видео, анимацию) и звуковые данные, которые чаще всего создаются и просматриваются при помощи соответствующих программ и хранятся в однопрограммном формате. Наиболее используемыми из них являются форматы Quick Time и МРЕG .
Языки разметки, также называемые форматами разметки, содержат встроенные инструкции по отображению и понятности содержания файла.
Термин «разметка» в области информационных юхпопогий понимается как текст, выражающий информацию о документе*
SGML, который используется во многих странах мира в государственных органах и является международным стандартом ;
НТМL, который используется для отображения почти всей информации в сети;
ХМL, относительно простой язык, основанный на SGML и получивший популярность при управлении информацией и обмене ею.
Таблица. Наиболее распространенные форматы файлов
Тип формата | Основные форматы | Примеры файлов | Описание |
Текстовые форматы | PDF, RTF, ТХТ, однопрограммные форматы (например, MS Word | Корреспонденция , отчеты, записки, сообщения электронной почты, сохраненные в текстовом формате | Созданные или сохраненные в виде текста (могут содержать и графику) |
Векторная графика | DXF, ЕРS, СGМ | Архитектурные планы, сложные иллюстрации | Хранят изображение в виде геометрических фигур |
Растровая графика | ВМР, ТIFF, GIF, JPEG | Графика вебстраниц, простые иллюстрации, фотографии | Хранят изображение как набор пикселей. При изменении масштаба изо- |
Файлы баз данных | Однопрограммные форматы | Адресные книги, списки рассылки | Создаются в системах управления базами дан- |
Форматы электронных таблиц | Однопрограммные форматы, DIF | Финансовый анализ, статистические калькуляции | Хранят числовые значения и калькуляции |
Видео- и аудио-форматы | Quick Time и МРЕG | Короткие видеозаписи, показываемые на веб-сайте, записи интервью | Содержат движущиеся изображения и звук |
Языки разметки | SGML , НТМL, ХМL | Текст и графика, помещенные на вебсайте | Содержат встроенные инструкции по отображению и понятности содержания файла или множества файлов |
Каждый из форматов файлов имеет свои достоинства и недостатки при использовании в документационном обеспечении управления. Например, текстовые форматы (MS Word Word Perfect.; RТF и др.) удобны для проведения контекстного поиска по документам в базе данных, а графические форматы (PDF, ТIFF и др.) позволяют получить при сканировании сражение документа со всеми его внешними особенностя ми, хранить документы в том же виде, что и на бумаге со всеми подписями и визами.
Формат MS Word, например, весьма удобен при редакти-ании документа и групповой работе с ним, однако файл MS Word хранит много скрытой информации (прежде всего о еде ных в файле изменениях) и, следовательно, весьма удобен с точки зрения утечки служебной информации. В ряде случаев, таких, например, как коммерческое предложение или зкт контракта, скрытая информация позволяет установить вы были исходные предположения, кто оказал на текст наи' льшее влияние. При групповой подготовке документа анализ правки дает возможность узнать не только фамилии людей, ее сделавших, но и кто какой именно вклад внес в итоговый вариант.
Следует отметить, что ни один из форматов файлов электронных документов не может считаться универсальным для длительного архивного хранения, поскольку довольно быстро меняются техника, технологии и программное обеспечение. Уже сегодня непросто воспроизводить документы, созданные в текстовых процессорах Word Perfect на современном оборудовании. Легко ли будет, например, использовать архивный документ в формате MS Word 97 лет через 10-15?
Скорее всего, разнообразие форматов будет сохранено. Поэтому архивные службы разрабатывают нормативные условия для архивного хранения электронных документов различных форматов, прежде всего, наиболее распространенных PDF и ХМL.
Тем не менее, в настоящее время большие надежды связываются с использованием формата ХМL в качестве стандартного для обмена электронными документами в различных сферах деятельности, особенно, в сфере государственного управления.
Дата добавления: 2016-01-29; просмотров: 5077;