Програмне забезпечення систем розпізнавання. Загальні вимоги.
Основне призначення розпізнавальної системи,якою є OCR-система полягає в аналізі растрової інформації (відсканованого символу) і присвоєнні точковому зображенню відповідного символа. Після завершення процесу розпізнавання OCR-системи повинні вміти зберігати форматування вихідних документів, присвоювати в потрібному місці атрибут абзацу, зберігати таблиці, графіку (нерозпізнані малюнки), штрих-коди і т.п. Сучасні програми розпізнавання підтримують всі відомі текстові та графічні формати і формати електронних таблиць, а деякі підтримують такі формати як HTML і PDF.
Робота з OCR-системами, як правило, не викликає особливих складностей. Більшість таких систем мають простий автоматичний режим “Scan&Read”. Крім того, вони підтримують і режим розпізнавання зображень з файлів. Однак для того, щоби досягти кращих можливих результатів, необхідно попередньо вручну настроїти її на конкретний вигляд тексту, а точніше на спосіб і якість накреслення букв та інших символів.
Дуже важливим при роботі з OCR-системою є зручність вибору мови розпізнавання і типу матеріалу, що розпізнається (друкуюча машинка, факс, матричний принтер, газета, та ін.), а також інтуїтивна зрозумілість користувацького інтерфейсу. При розпізнаванні текстів, в яких використовується декілька мов, ефективність розпізнавання залежить від вміння OCR-системи формувати групи мов.
Дата добавления: 2014-12-08; просмотров: 849;