Технология обработки текстовой информации

1. Разобрать устно следующие вопросы:

1) Преимущества электронных документов перед бумажными?

Ответ:

· Текст редактируемого документа выводится на экран монитора, и пользователь может в диалоговом режиме вносить свои изменения.

· При распечатке текст выводится без помарок и поправок.

· Отпадает необходимость следить за переносами внутри абзаца.

· Можно работать с фрагментами текста (переносить, стирать, копировать, тиражировать и т.д.).

· Можно распечатывать неограниченное число копий документа одинакового качества.

2) Какие функции выполняет текст в культуре людей? Каково назначение текста?

Ответ:

· Во-первых, это коммуникации людей. Для этого необходима максимальная однозначность передачи чётко определенного смысла, чтобы при общении, связи людей не возникли двусмысленность и непонимание.

· Во-вторых, стимулирование выработки новой информации. Для реализации этой функции текста наилучшим оказывается поэтический язык.

· В-третьих, текст обеспечивает память культуры. Так как текст является генератором бывшей, то есть когда-либо случившейся, прошедшей информации. В этом смысле, книги – корабли мысли, странствующие по волнам времени и бережно несущие свой груз от поколения к поколению.

2. Текстовый редактор(ТР) — это прикладная программа, позволяющая создавать текстовые документы, редактировать их, просматривать содержимое документа на экране, распечатывать.

Текстовые процессоры могут обеспечивать выполнение разнообразных функций, а именно:

• редактирование строк текста;

• использование различных шрифтов символов;

• копирование и перенос части текста с одного места на другое или из одного документа в другой;

• контекстный поиск и замену частей текста;

• задание произвольных междустрочных промежутков;

• автоматический перенос слов на новую строку;

• автоматическую нумерацию страниц;

• выравнивание краев абзаца;

• создание таблиц и построение диаграмм;

• проверку правописания слов и подбор синонимов;

• построение оглавлений и предметных указателей;

• распечатку подготовленного текста на принтере в нужном числе экземпляров и т.п.

Текстовые редакторы можно разделить на группы по их мощности и возможностям:

· простые текстовые редакторы (Windows Блокнот) – редактирование текста, простейшее форматирование шрифта;

· текстовые процессоры (Microsoft Word) – больше возможностей по созданию документов (вставка списков и таблиц, средства проверки орфографии, сохранение исправлений и другое);

· настольные издательские системы (Adobe PageMaker) – макетирование книг, журналов и газет.

Помимо этого, существуют приложения для подготовки Web-страниц и сайтов (например, Microsoft FrontPage).

3. Форматы текстовых файлов.

o ТХТ(«простой текстовый»)

Один из первых (если не первый) текстовых форматов, широко используется по сей день. Так как текст хранится в виде последовательности символов, то размер файла в байтах равен числу символов плюс непечатаемые символы (знак пробела, табуляции, знак конца абзаца и другие - их еще называют знаками форматирования). За счет этого достигается малый размер файла. Однако возможности по форматированию подобных документов сильно ограничены. По сути - это просто текст. Текстовые данные могут храниться не только в контейнерах с расширением ТХТ, это расширение не являются обязательными и служит для облегчения выбора программы, котороя открывает файл по умолчанию.

o RTF - «Rich Text Format»

Свободный межплатформенный формат хранения размеченных текстовых документов, созданный Microsoft в 1987 году. Ныне он широко распространен, поэтому большинство современных текстовых редакторов его поддерживают. Создав RTF на платформе Windows, он прекрасно будет читаться и редактироваться на других платформах (Apple, Linux и другие). Стандарт де-факто в полиграфии.
RTF позволяет производить и сохранять достаточно сложное форматирование, вставлять сноски, колонтитулы, рисунки, таблицы и формулы, хотя в этом он все же уступает формату DOC. Уступает он DOC и в объеме файлов: сложные документы более компактно хранятся в DOC-файлах (простые - наоборот). Однако RTF выигрывает спор с DOC в отношении безопасности, так как не использует макросы. Поэтому зараженные макровирусами файлы Word можно «вылечить» сохранением в RTF-формат. Кроме того, формат RTF устойчив к повреждению файла. Если в DOC-файле изменить хотя бы один байт, то он уже не откроется в Word. А повреждение файла в формате RTF может привести только к потере поврежденного куска текста.

O DOC

Сначала это расширение использовалось для обозначения простых текстовых файлов без форматирования, однако в начале 90-х Microsoft фактически его «приватизировала». Поэтому сейчас DOC ассоциируется только с продуктами этой компании. Этот формат обеспечивает большие возможности по форматированию текста (включены сценарии, макросы). За счет этого ухудшилась совместимость с текстовыми редакторами сторонних разработчиков. В файле этого формата содержится огромное количество информации о шрифтах, начертании символов, абзацных отступах и интервалах, даже если все это вам совсем не нужно. Именно из-за этой дополнительной информации файл, содержащий только текст, превышает размер RTF-файла. Однако при включении в документ различных графических элементов и изображений DOC выигрывает в размере и обеспечивает большую совместимость. В отличие от ТХТ и RTF DOC является бинарным форматом, что делает его нечитабельным в простых текстовых редакторах. К примеру, «блокнот» может просматривать некоторые RTF-файлы. Популярен наравне с RTF.

O DOCX

С появлением Office 2007 компания Microsoft перешла на новые форматы, базирующиеся на Office Open XML (визуально отличаются тем, что к расширениям добавлена буква «х» на конце). Формат представляет собой zip-архив, содержащий текст в виде XML, графику и другие данные. Для уменьшения размера файла используется ZiP-компрессия. Документы обратно совместимы с Office 2000/XP/2003, только если установлен Microsoft Office Compatibility Pack (найти и скачать его можно с официального сайта Microsoft, размер файла 27,8 Мб). Если нужно срочно сконвертировать DOCX в другой формат, воспользуйтесь услугами сайта http://docx-converter.com/.Если вы пользуетесь последней версией Office и планируете передавать файлы кому-либо, сохраняйте документы в RTF или DOC.

o ODT/ODF («Open Document Format»)

ODF - общее наименование открытого формата документов для офисных приложений (текст, таблицы, рисунки, базы данных, презентации). Текстовые данные хранятся в файлах с расширением ODT. Стандарт был разработан индустриальным сообществом OASIS и основан на XML-формате. 1 мая 2006 года принят как международный стандарт ISO/IEC 26300. Федеральное Агентство по Техническому Регулированию и Метрологии, входящее в состав Министерства Промышленности и Торговли Российской Федерации, издало приказ об утверждении формата OpenDocument (ODF)в качестве национального стандарта.( Национальный стандарт ГОСТ Р ИСО/МЭК 26300-2010 «Информационная технология. Формат Open Document для офисных приложений (OpenDocument) v1.0», идентичный международному стандарту ISO/IEC 26300:2006). Введен в действие - 1 июня 2011 года. ODF доступен для всех и может быть использован без ограничений. Эдакая бесплатная альтернатива закрытым форматам Microsoft. Для того чтобы производить чтение и запись формата ODF в продуктах Microsoft, был выпущен плагин Sun ODF Plugin for Microsoft Office. Поддержка ODF в Microsoft Office 2007 была введена с выпуском с Service Pack 2. К сожалению, по-прежнему уступает по распространенности RTF и DOC.

o HTML (от англ. Hypertext Markup Language -«язык разметки гипертекста»)

Стандартный язык разметки документов в интернете (расширение .htm/html). Веб-страницы создаются при помощи языка HTML (или XHTML). HTML был разработан британским ученым Тимом Бернерсом-Ли в 1991 году как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области верстки. Текст с разметкой HTML должен был без стилистических и структурных искажений воспроизводиться на различных устройствах. Однако позже активное внедрение мультимедийного и графического оформления на-рушило эти планы. Для просмотра HTML-документов не нужны специальные редакторы, достаточно стандартных средств, встроенных в ОС. По открытости, индексируемости, конвертируемости и читаемости превосходит любые другие форматы. К сожалению, графика обычно сохраняется в отдельной папке.








Дата добавления: 2017-02-20; просмотров: 2196;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.006 сек.