Технология преобразования бумажного документа в электронный

(смотри также университетские файлы по сканированию)

 

Для хранения документальной или иной информа­ции в памяти ПК она должна быть представлена в элек­тронном виде. Одним из методов решения этой задачи является ввод данных с помощью клавиатуры. Однако при больших объемах информации основной техноло­гией преобразования бумажного документа в электрон­ную форму является сканирование. Сканирование обес­печивает получение графического образа бумажного документа, т. е. в результате сканирования создается графический файл, в котором хранится растровое (т. е. состоящее из точек) изображение документа.

Для ввода текста и иллюстраций можно использо­вать ручные, листовые и планшетные сканеры. Наи­лучшее качество и максимальное удобство при работе с бумажными документами обеспечивают планшетные сканеры. Подключение сканера к ПК обеспечивается через аппаратные и программные интерфейсы. Боль­шинство программ работы со сканером обеспечивают возможность:

1. отсканировать весь документ и далее уточнить (вы­брать) область окончательного сканирования;

2. выбрать место размещения сканированного изобра­жения (передать для печати на принтер, сохранить в файле, передать в графический редактор, отпра­вить по электронной почте);

3. автоматической настройки параметров сканирования;

4. вручную задать дополнительные настройки (разре­шение, размер вывода и др.).

После обработки документа сканером получается графическое изображение документа, но оно не явля­ется текстовым документом с точки зрения компьюте­ра. Следовательно, он не может быть полноценно обра­ботан текстовым процессором. Для преобразования гра­фического образа в текстовой документ используется технология распознавания текста. Современные техно­логии распознавания текста не ориентируются нина конкретный шрифт, ни на конкретный алфавит. Их функциональные возможности универсальны.

Наиболее распространенной программой данного назначения, обеспечивающей высокое качество и удоб­ство применения, является программа FineReader.

Процесс преобразования бумажного документа в элек­тронный происходит в три этапа, каждый из которых может быть выполнен как автоматически, так и под контролем пользователя. На первом — сканирующее устройство выполняет сканирование и передает информацию программе FineReader. При естественном порядке распознавания текста программа последовательно обрабатывает строки слева направо. Однако если текст неоднороден (содержит таблицы, рисунки, примечания и пр.) или раз­бит на несколько колонок, то необходимо провести его сегментацию, т. е. разбиение на блоки. На втором этапе программа осуществляет автоматическую сегментацию и в зависимости от типа информации, содержащейся в каж­дом блоке, проводит далее распознавание текста. Текст документа появляется в окне документа. Его можно со­хранять постранично или собирать весь документ в один файл. Есть возможность прямой передачи полученного текста в Word и Excel, а также в буфер обмена.

Особый интерес представляет режим распознавания заполненных бланков или анкет. При их обработке распознается и вводится в компьютер лишь переменный текст. На основе же постоянного текста предваритель­но создается шаблон формы. Созданный шаблон ис­пользуется на этапе сегментации для разбиения текста по полям бланка. В результирующем документе присутствует как переменный, так и постоянный текст.

 








Дата добавления: 2017-10-09; просмотров: 2523;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.003 сек.