Перед ЦКБ МТ "Рубин" стояла задача сканирования сопроводительных карточек к чертежам, распознавания номера чертежа, а также публикации образов и номеров карточек в СУД DocsOpen. Проблемами, усложняющими решение поставленной задачи, были большой объем данных, которые нужно было ввести - 12 млн. карточек, плохое качество вводимых карточек, а также нумерация карточек "от руки".
Воплощению поставленной задачи в жизнь помогала консалтинговая группа "Весть", которая предложила воспользоваться комплексом Kofax Ascent Capture, включающий в том числе и модуль расопознавания рукопечатных текстов от компании ABBYY.
В ходе реализации проекта, возникла проблема: перекос изображения, возникавший при сканировании, не позволял применить автоматическое распознавание номеров карточек и требовал участие оператора для ввода номера вручную, в результате скорость ввода документов становилась неприемлемой. Данная проблема была успешно решена при помощи "регистрационных зон", которые использовались для определения положения номера карточки на странице. Сценарий проверки контролировал, соответствует ли распознанное значение заданному формату, в результате номера подавляющего большинства карточек распознавались без ошибок.