Потоковый ввод документов и данных

        

Эффективная работа современной организации все чаще строится на работе с электронными данными. Система, способная обеспечить надлежащий уровень точности и скорости работы с информацией является важной составляющей успеха деятельности, как коммерческих, так и государственных структур. Однако процесс превращения бумажных документов в пригодные для дальнейшего использования данные не ограничивается одной лишь установкой сканера. Современные технологии предоставляют богатый выбор сценариев ввода, технических параметров, организационных моделей. Однако за гибкостью подходов к организации процесса ввода и обработки данных также могут скрываться и «подводные камни», осведомленность о которых прямым образом сказывается на успехе внедрения современных технологий и конечной стоимости проекта внедрения.

Следует разделять понятия «ввод документов» (Document capture) и «ввод данных» (Data capture).

Ввод документов


Ввод документов – это процесс преобразования бумажной версии документа в электронное изображение, происходящий, чаще всего, с помощью сканирования. При этом процесс ввода документов часто содержит в себе еще и фазу простого распознавания текста, когда в дополнение к электронному изображению документа также получается его текстовое содержимое, однако без выделения в нем каких-либо структурных единиц или логических блоков.


Ввод данных


Ввод данных предполагает, что из обрабатываемого документа необходимо извлечь какую- то структурированную информацию, поля, атрибуты, чтобы в последующем передать эти реквизиты документа на обработку в другую информационную систему. Процессы ввода данных могут применяться как к бумажным документам, так и к электронным, в случае если формат последних не подходит для последующей обработки данных из них в других информационных системах.


Организация процесса ввода и распознавания данных – это комплекс мероприятий, связанных со сканированием бумажных документов, обработкой полученных изображений и/или электронных документов, распознаванием текстовых и цифровых значений полей документа, штрих-кодов и последующей конвертацией распознанной информации в нужный формат для передачи на хранение в архив или в другие информационные системы.

Ввод и распознавание данных включают следующие этапы работы с данными:

Ввод документов и данных

Этапы, характерные для работы с бумажными документами:



  • Сортировка документов. Определение типов документов, которые должны подлежать вводу. Современные системы ввода документов и данных предлагают возможности для автоматического определения типа и последующей сортировки документов. Однако в некоторых случаях может понадобиться и ручная предварительная сортировка.

  • Подготовка документов. Физическая или логическая подготовка документов для последующего сканирования и распознавания. Данный этап позволяет уменьшить количество ошибок при переводе данных в электронный вид, определить важность документов, сократить необходимость повторного сканирования.

  • Сканирование. Перевод документов из бумажного в электронный формат с помощью соответствующих аппаратных и программных средств.


Этапы, применяемые для работы с электронными образами документов:


Этапы перечисленные далее применяются как для электронных образов документов, полученных в результате сканирования, так и для электронных документов, полученных альтернативными путями, например, изображения из факс-сервера или изображения, полученные путем преобразования документов из других электронных форматов с целью извлечения данных из них.



  • Обработка изображений. Данный этап позволяет улучшить качество полученного документа, с тем, чтобы сократить количество неточностей при распознавании и уменьшить риск утери важной информации. К этапу обработки изображений относятся такие операции как, например, коррекция возможных перекосов изображения, неравномерности освещения, если документ был снять цифровой камерой или мобильным телефоном, удаление из изображения документа цветных печатей и штампов, которые могут мешать процессу распознавания.

  • Распознавание. Данный этап позволяет перевести обработанные и подготовленные изображения в редактируемые форматы и/или извлечь нужные данные из документа с помощью специального программного обеспечения.

  • Верификация. На этом этапе проводится проверка извлеченных при распознавании данных на корректность распознанной информации и на соответствие правилам перекрестных проверок. Данные операции проводятся в основном в автоматическом режиме, с предложением оператору проверить лишь те случаи, по которым правила автоматической проверки документа показывают либо недостаточную уверенность в качестве распознавания либо несоответствие полученных данных правилам перекрестных проверок.

  • Индексирование. Это процесс проставления условных обозначений, атрибутов и составления указателей, служащих для упрощения доступа к документам и (или) информации

  • Сохранение данных, размещение информации. Завершающий этап процесса ввода, когда обработанные данные либо сохраняются в формате, пригодном для дальнейшего использования в рабочих процессах организации, либо отправляются на обработку в другую информационную систему (например ERP, CRM или бухгалтерскую) либо публикуются в том или ином виде

Опыт компаний, внедривших систему автоматизированного ввода данных, свидетельствует о том, что использование данных технологий несет прямые выгоды для организации, которые можно измерить и оценить, например:

  • Сокращение суммарных расходов на обработку документов. С внедрением автоматизированной системы существенно сокращается количество сотрудников, задействованных в процессе ввода данных, а, следовательно, сокращаются расходы на заработную плату и аренду помещений;
  • Увеличение скорости ввода данных в информационные системы в 3-10 раз по сравнению с ручным вводом;
  • Быстрый возврат инвестиций: средняя окупаемость проекта составляет от полугода до 1 года.

Есть также и непрямые выгоды от использования современных систем ввода, значительно повышающие эффективность работы организации:

  • Ускорение рабочих процессов, более быстрое и качественное обслуживание клиентов;
  • Получение быстрого доступа к нужным данным, находящимся в актуальном виде и оперативно обновляющимся, позволит руководству принимать более информированные решения;
  • Снижение риска утери важных документов;
  • Повышение уровня защиты доступа к информации и обеспечения конфиденциальности документов;
  • Повышение удобства обмена данными при совместной работе.

Наши решения в области потокового ввода документов:

Обработка кадровых документов

Обработка бухгалтерских документов