Форматирование и разметка и текстовых файлов
Текстовые файлы относятся к наиболее распространенным типам данных. Для сохранения множества текстовых данных применяют два способа обработки текста: задание формата и ввод команд разметки.
Задание формата – это выбор определенного способа кодирования текстовых данных, характерного для одного или нескольких текстовых редакторов.Текстовые редакторы, процессоры и издательские системы используют специально разработанные способы кодирования, которые выражаются в форматах файлов. Тип формата имеет краткое обозначение из трех или четырех букв латинского алфавита, которое называется расширением файла и присоединяется к имени текстового файла.
Форматы могут быть совместимыми и несовместимыми. Совместимость выражается в возможности чтения текстового файла в различных программах. Несовместимость форматов не позволяет читать один файл во всех редакторах. Обычно наиболее сложные редакторы позволяют читать файлы в форматах программ-конкурентов. Если такая возможность в редакторе отсутствует, то для прочтения файла требуется выполнить его переформатирование.
По расширению текстового файла обычно судят о программе или группе программ, к которым относится файл. Например,файлы, созданные простыми текстовыми редакторами, часто имеют расширение.txt,а процессор Word по умолчанию создает файлы в формате .doc. При этом Word поддерживает и другие форматы, например .rtf.
Разметка текста –это процедура выделения основных и дополнительных элементов текста, которая используется чаще всего для представления сетевых документов, а также для формирования научных текстов. Различаютпонятияфизическойилогическойразметки.
Физическая разметка –указание точного вида каждого символа текста, например, для физической разметки заголовка указывается характеристики: "по центру, 14 пт, полужирный, гарнитура Times". Физическую разметку необходимо использовать при распечатывании текста на принтере.
Логическая разметка –отнесение фрагмента текста к определенной категории, например, при логической разметке заголовка указывается: "это заголовок". Логическая разметка используется при создании документов, предназначенных для хранения и передачи в компьютерной сети. Логическую разметку применяют там, где требуется сохранить форму в самом общем виде. Например, заголовок в логической разметке различим независимо от того, каким шрифтом он будет напечатан.
Логическая разметка электронных документов выполняется с помощью специальных языков разметки. Первый язык разметки – HTML, который был создан для передачи сетевых документов и широко использовался при построении сети Интернет. Процедура разметки заключается в разбиении электронного документа на фрагменты с присвоением каждому фрагменту категории, которая называется тегом. В результате разметки документ разбивается на последовательность теговых контейнеров. Размеченному файлу присваивается новое расширение, например, документы, содержащие команды разметки языка HTML, имеют расширение .html или .htm.
Дата добавления: 2016-05-25; просмотров: 1007;