Обработка документов XML. Стандартизованный набор элементов и атрибутов HTML позволяет создавать программы просмотра (Web-браузеры) и графические редакторы документов HTML
Стандартизованный набор элементов и атрибутов HTML позволяет создавать программы просмотра (Web-браузеры) и графические редакторы документов HTML, пригодные для обработки любого документа HTML.
В отличие от HTML, для документа какого-либо приложения XML необходимо каким-то образом определить обработку этого документа XML, например, формат вывода документа на экран дисплея или на печать. Самым общим способом решения этой задачи является создания программы для обработки документов данного приложения. Примером такой программы для документов XML, описываемых с помощью DTD для HTML и XHTML, является Web-браузер.
Для подготовки структуры и содержания документа к отображению (на экран или на печать) или к передаче в другое приложение для последующей обработки необходимо выполнить следующие этапы:
1. Создать DTD или схему для документа XML;
2. Создать документ XML в соответствии с DTD или схемой;
3. Проанализировать, является ли документ правильным (well-formed) и действительным (valid);
4. В случае отсутствия ошибок выполнить обработку документа.
Рассмотрим прикладные и инструментальные программные средства, используемые в приведенных выше этапах.
На первом и втором этапах необходимо создать и отредактировать DTD или схему документа, а также сам документ XML. Поскольку DTD, схема и сам документ являются текстовыми файлами, для их создания и модификации можно использовать любой текстовый редактор, например Блокнот (Notepad) в Windows. Однако лучше воспользоваться для обработки приложения специализированным редактором XML, например, Microsoft XML Notepad. Кроме того, редактор XML входит в состав многих интегрированных средств разработки (IDE) документов XML, например, XMLSpy.
Редакторы XML обычно выполняют следующие основные функции:
· поддержка возможности отображения и редактирования документа XML в виде древовидной структуры (основной режим);
· поддержка возможности отображения и редактирования документа XML в текстовом виде (вспомогательный режим);
· возможность редактирования (вставки, изменения или удаления элементов или атрибутов документа) с учетом DTD (внутреннего или внешнего) или схемы;
· поддержка различных кодировок документа.
К дополнительным возможностям редакторов XML относятся:
· средства создания и редактирования DTD и схем;
· наличие «мастеров» (wizards) для облегчения процесса создания документа XML, DTD и схем;
· наличие справочной информации по XML, DTD и схемам.
Для проверки действительности и правильности документа XML используются так называемые синтаксические анализаторы (parsers). Существуют два вида синтаксических анализаторов: анализаторы, проверяющие только правильность документа, т.е. соблюдения правил спецификации XML и анализаторы, которые проверяют не только правильность документа, но и его действительность, т.е. соответствие документа своему DTD или своей схеме. Синтаксические анализаторы могут быть самостоятельными приложениями или компонентами IDE или встроенными в приложение XML. В настоящее время существует два основных типа анализаторов XML:
· SAX-анализаторы;
· DOM-анализаторы.
В общем, обработка документа XML выполняется с помощью индивидуальной программы, разработанной для данного документа XML. Эту программу называют процессором XML (процессором XML также иногда называют программу, которая выполняет и анализ, и обработку документа XML). В некоторых языках программирования имеются средства, облегчающие разработку приложений XML. Ниже будут рассмотрены такие средства для языка Java. Кроме того, для стандартных определенных функциональных задач, например, для форматированного вывода документов XML на экран и печать существуют специальные средства, например, использование таблиц стилей или расширенного языка стилей – XSL (eXtensible Stylesheet Language). Существуют и другие специализированные приложения XML, например, для вывода математических формул – MathML или масштабируемой векторной графики –SVG .
Дата добавления: 2015-03-20; просмотров: 558;