Технології потокового сканування-розпізнавання
У зв'язку з великим обсягом даних, які потрібно вводити, постає питання про автоматизацію процесу вводу. Найбільш оптимальним методом автоматизації є оптичне розпізнавання образів з готових форм. При сучасному рівні розвитку технологій сканування та розпізнавання образів можна довести швидкість вводу до 100 000 аркушів на добу при якості автоматичного розпізнавання 95-98%.Автоматичне розпізнавання даних дозволяє уникнути таких помилок, як неправильний набір даних оператором, набір даних в неправильних полях форми, розбіжність даних за форматом. Досить простим та прозорим стає масштабування системи. Так, підвищення обсягу обробки на 1000 аркушів на добу потребує лише обладнання ще одного робочого місця. Якість вводу інформації перестає залежати від людського фактору, швидкість вводу легко піддається прогнозу та плануванню.
Програмне забезпечення, яке здійснює обробку та розпізнавання даних, відповідає наступним вимогам:
- гнучкість та простота настроювання на різноманітні типи форм;
- висока швидкість та якість розпізнавання;
- захист від несанкціонованого доступу;
- контроль над операторами в процесі обробки;
- простота експлуатації, програмне забезпечення не вимагає високої кваліфікації оператора;
- перехресні перевірки розпізнаних даних за словниками та базами даних;
- автоматичний контроль сум;
- простий та ефективний швидкодіючий інтерфейс до системи для сполучення з базою даних;
- здатність працювати в умовах коливання обсягу вводу від одиниць до кількох тисяч аркушів.
Оскільки призначення підсистеми розпізнавання - обробка великої кількості вхідних форм, ця підсистема підтримує такі можливості розподілення операцій, як:
- пакетна обробка даних, коли форми поєднуються у іменовані пакети, що проходять по стадіях обробки;
- централізоване адміністрування комплексу;
- безперервний моніторинг процесу обробки, окремих станцій, операторів та завдань;
- гнучка схема маршрутизації пакетів у системі;
- модульна архітектура для розподілення операцій;
- гнучке підстроювання під конкретну задачу;
- система черг та прикріплення задач до конкретних операторів;
- захищений доступ;
- сховище оброблених пакетів;
- обробка форм складної нелінійної структури;
- контроль за цілісністю даних;
- звіти про робочий стан комплексу.
Крім того, підсистема розпізнавання має гнучкий та потужний інтерфейс взаємодії з прикладними підсистемами для інтеграції функцій розпізнавання. Для цього використовується один з розповсюджених механізмів автоматизації, таких як OLE Automation чи COM (DCOM) інтерфейси.
