Настольные издательские системы. Программы переводчики. Гипертекстовые системы. Системы распознавания текста.
Настольные издательские системы (НИС) — это программы, предназначенные для профессиональной издательской деятельности, позволяющие осуществлять электронную верстку широкого спектра основных типов документов.
Предусмотренные в программных пакетах данного типа средства позволяют:
•компоновать (верстать) текст;
•использовать всевозможные шрифты и полиграфические изображения;
•осуществлять редактирование на уровне лучших текстовых процессоров;
•обрабатывать графические изображения;
•обеспечивать вывод документов высокого качества;
•и др.
Системы машинного перевода - программы, осуществляющие полностью автоматизированный перевод. Главным критерием программы является качество перевода. Сегодня существует большое количество программ-переводчиков, как локально устанавливаемые на компьютере, так и on-lain переводчики в сети Интернет. Переводчик может быть реализован как в виде приложения, так и в виде веб-сервиса. В первом случае он напоминает текстовый редактор, к которому подключены специальные инструменты, отвечающие за настройку перевода с базами данных по каждому языку. Такая программа может интегрироваться с другими приложениями на компьютере, например, с редакторами из Microsoft Office, онлайн-мессенджерами, веб-браузерами, что позволяет получать перевод непосредственно в этих приложениях без необходимости копирования фрагмента текста в переводчик, причем с сохранением форматирования и структуры текста.
Гипертекст - это текст со вставленными в него словами (командами) разметки, ссылающимися на другие места этого текста, другие документы, картинки и т.д. Во время чтения такого текста (в соответствующей программе, его обрабатывающей и выполняющей соответствующие ссылки или действия) вы видите выделенные в тексте слова. Если наехать на них курсором и нажать клавишу или на кнопку (надавить глаз) мышки, то будет выполнено некое действие, связанное с данным выделенным словом, например, на экране появится текст, на который ссылалось это слово, возможно это другой участок текста этого же документа, а возможно совсем другой документ. Гипертекстовые системы представляют собой новый класс систем управления информацией. Цель создания таких систем - дать возможность пользователям создавать, распространять, связывать друг с другом и использовать массивы самой разнородной информации в форме текста, графики, изображений, аудио-видео информации, программ и т.п.
Гипертекстовую систему можно рассматривать как систему баз данных, которая обеспечивает совершенно разные методы доступа и управления информацией. Однако, в отличие от традиционных систем баз данных, которые имеют регулярную, упорядоченную структуру, гипертекстовые системы баз данных не имеют строгой структуры, и пользователь волен оперировать информацией различными доступными ему методами.
Системы распознавания текста или OCR-системы (Optical Character Recognition) предназначены для автоматического ввода документов в компьютер. Это может быть страница книги, журнала, словаря, какой-то документ — все, что угодно, что было уже напечатано, и должно быть преобразовано обратно в электронную форму.
OCR-системы распознают текст и различные его элементы (картинки, таблицы) с электронного изображения. Изображение получается обычно путем сканирования документа и реже — его фотографированием. Поступившее изображение обрабатывается алгоритмом OCR-программы, выделяются области текста, изображений, таблиц, отделяется мусор от нужных данных.
На следующем этапе каждый символ сравнивается со специальным словарем символов, и если находится соответствие, то этот символ считается распознанным. В итоге вы получаете набор распознанных символов, то есть искомый текст.
Современные OCR-системы представляют собой достаточно сложные программные решения. Ведь текст может быть замусорен, искажен, загрязнен, и программа должна это учитывать и уметь правильно обрабатывать такие ситуации. Кроме того, современные OCR-системы позволяют также получить копию печатного документа в электронном виде с сохранением форматирования, стилей, размеров текста и видов шрифтов и т.д.
Дата добавления: 2015-05-28; просмотров: 1003;