Распознавание документов

| статьи | печать

Компьютерное распознавание документов — процесс трудоемкий, но необходимый. Финансовый отдел и бухгалтерия обрабатывают счета, накладные; юристы — договоры и соглашения; канцелярия — входящие письма и факсы, маркетинговый отдел — различную печатную продукцию. Однако запуск программы по распознаванию PDF-файлов приводит подчас к остановке всех остальных программ.

Разработчики компании ABBYY считают, что использование системы Recognition Server не окажет негативного влияния на повседневные бизнес-процессы предприятия. Это высокопроизводительное серверное решение для автоматизации процессов оптического распознавания и конвертирования документов в/из формата PDF в промышленных масштабах.

Его использование дает ряд преимуществ: сотрудники меньше времени проводят в курилках из-за «зависания» сети, повышается эффективность работы офиса в целом.

Систему можно рассматривать как самостоятельное решение и как составную часть для любого клиент-серверного решения, например по автоматизации документооборота и архивирования компании.

В зависимости от специфики работы по распознаванию текстов все компоненты системы можно установить локально на один компьютер или распределить по сети. ABBYY Recognition Server использует для распознавания печатного текста 187 языков на основе латинского, греческого, армянского алфавитов и кириллицы.

Скорость распознавания и обработки изображений увеличена до 2,5 раза по сравнению с тем, что было до сих пор. Точность расшифровки документа гарантирует установленный порог по качеству распознавания символов. Если он превышен, например в тексте несколько раз буква «е» заменялась на «э», то этот документ перенаправляется на задание повторно.

Система проста в обращении и не требует получения дополнительных знаний от пользователей. Они только кладут изображение и PDF-файлы во входящую папку, а потом забирают результат из исходящей папки. Все остальное происходит автоматически.

Система состоит из нескольких частей. Серверная управляет всеми сервисами, запросами и настройками обработки. Открытый интерфейс программирования дает возможность реализовать систему как самостоятельное решение, так и способную интегрироваться с клиент-серверными приложениями.

Станция обработки предназначена для распознавания изображения отсканированных или сфотографированных документов, а также для преобразования PDF-файлов. Мониторинг всей работы системы обеспечивает консоль управления.

Все это экономит административные ресурсы, компьютерные мощности и время сотрудников.

К сведению

Наиболее успешно ABBYY Recognition Server используется для решения следующих задач:

Преобразование больших объемов документов. Этот процесс может осуществляться в фоновом режиме, используя при этом несколько станций распознавания, что снижает влияние на другие рабочие процессы и помогает избежать излишней траты технических и человеческих ресурсов.

Ввод документов для последующего индексирования. Благодаря специальному режиму анализа автоматически определяется и распознается все изображение, включая текст на картинках, в диаграммах, подписях, логотипах, который может быть легко проиндексирован в системе электронного документооборота или архива, что обеспечивает в дальнейшем качественный полнотекстовый поиск в подобном документе.

Полнотекстовое преобразование для ввода данных – распознавание неструктурированных документов с целью дальнейшего ввода документов в существующую систему.

Создание архива документов в PDF-формате с возможностью полнотекстового поиска по каждому документу.