Настольные издательские системы. Программы переводчики. Гипертекстовые системы. Системы распознавания текста.

Настольные издательские системы (НИС) — это программы, предназначенные для профессиональной издательской деятельности, позволяющие осуществлять электронную верстку широкого спектра основных типов документов.

Предусмотренные в программных пакетах данного типа средства позволяют:

•компоновать (верстать) текст;

•использовать всевозможные шрифты и полиграфические изображения;

•осуществлять редактирование на уровне лучших текстовых процессоров;

•обрабатывать графические изображения;

•обеспечивать вывод документов высокого качества;

•и др.

Системы машинного перевода - программы, осуществляющие полностью автоматизированный перевод. Главным критерием программы является качество перевода. Сегодня существует большое количество программ-переводчиков, как локально устанавливаемые на компьютере, так и on-lain переводчики в сети Интернет. Переводчик может быть реализован как в виде приложения, так и в виде веб-сервиса. В первом случае он напоминает текстовый редактор, к которому подключены специальные инструменты, отвечающие за настройку перевода с базами данных по каждому языку. Такая программа может интегрироваться с другими приложениями на компьютере, например, с редакторами из Microsoft Office, онлайн-мессенджерами, веб-браузерами, что позволяет получать перевод непосредственно в этих приложениях без необходимости копирования фрагмента текста в переводчик, причем с сохранением форматирования и структуры текста.

Гипертекст - это текст со вставленными в него словами (командами) разметки, ссылающимися на другие места этого текста, другие документы, картинки и т.д. Во время чтения такого текста (в соответствующей программе, его обрабатывающей и выполняющей соответствующие ссылки или действия) вы видите выделенные в тексте слова. Если наехать на них курсором и нажать клавишу или на кнопку (надавить глаз) мышки, то будет выполнено некое действие, связанное с данным выделенным словом, например, на экране появится текст, на который ссылалось это слово, возможно это другой участок текста этого же документа, а возможно совсем другой документ. Гипертекстовые системы представляют собой новый класс систем управления информацией. Цель создания таких систем - дать возможность пользователям создавать, распространять, связывать друг с другом и использовать массивы самой разнородной информации в форме текста, графики, изображений, аудио-видео информации, программ и т.п.

Гипертекстовую систему можно рассматривать как систему баз данных, которая обеспечивает совершенно разные методы доступа и управления информацией. Однако, в отличие от традиционных систем баз данных, которые имеют регулярную, упорядоченную структуру, гипертекстовые системы баз данных не имеют строгой структуры, и пользователь волен оперировать информацией различными доступными ему методами.

Системы распознавания текста или OCR-системы (Optical Character Recognition) предназначены для автоматического ввода документов в компьютер. Это может быть страница книги, журнала, словаря, какой-то документ — все, что угодно, что было уже напечатано, и должно быть преобразовано обратно в электронную форму.

OCR-системы распознают текст и различные его элементы (картинки, таблицы) с электронного изображения. Изображение получается обычно путем сканирования документа и реже — его фотографированием. Поступившее изображение обрабатывается алгоритмом OCR-программы, выделяются области текста, изображений, таблиц, отделяется мусор от нужных данных.

На следующем этапе каждый символ сравнивается со специальным словарем символов, и если находится соответствие, то этот символ считается распознанным. В итоге вы получаете набор распознанных символов, то есть искомый текст.

Современные OCR-системы представляют собой достаточно сложные программные решения. Ведь текст может быть замусорен, искажен, загрязнен, и программа должна это учитывать и уметь правильно обрабатывать такие ситуации. Кроме того, современные OCR-системы позволяют также получить копию печатного документа в электронном виде с сохранением форматирования, стилей, размеров текста и видов шрифтов и т.д.

 

 








Дата добавления: 2015-05-28; просмотров: 997;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.005 сек.