Автор работы: Пользователь скрыл имя, 07 Февраля 2014 в 12:26, реферат
В последнее время проблема массового ввода данных стала особо актуальной.Число документов постоянно растёт, а вместе с ними увеличиваются проблемы по вводу и обработке больших объёмов данных в вычислительных системах.Необходимость обработки структурированных и неструктурированных форм документов,изначально выполненных на бумаге, возникает в деятельности большого количества государственных,акционерных и частных предприятий
ВВЕДЕНИЕ
СТАНДАРТНЫЕ ФОРМЫ И ИХ КЛАССИФИКАЦИЯ
• Понятие и признаки классификации стандартных форм
• Типы стандартных форм в зависимости от применения
• Выводы к разделу 1
ВВОД И ОБРАБОТКА СТАНДАРТНЫХ ФОРМ
• Этапы ввода и обработки форматированных документов
• Основные принципы потокового ввода форм
• Требования к системам массового ввода стандартных форм
• Подходы к реализации систем обработки форм
• Выводы к разделу 2
СИСТЕМЫ МАССОВОГО ВВОДА СТАНДАРТНЫХ ФОРМ
• СистемаABBYY Fine Reader Form
• СистемаCognitive Forms
• Выводы к разделу 3
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
Больших успехов в разработке
систем массового ввода и
СистемаABBYY Fine Reader Form
СистемаFine Reader Form предназначена для автоматического ввода данных из стандартных форм и форматированных документов в информационные системы и базы данных.
Преимущества системы:
СемействоABBYY Form Reader 6.5 включает в себя:
ABBYY Form Readerуспешно используют банки, страховые компании,маркетинговые агентства и производственные компании,государственные учреждения и учебные заведения,торговые компании и медицинские организации.
ABBYY Form Readerспособен обрабатывать любые типы форм, соответствующие простым требованиям машиночитаемости,автоматически сортирует бланки, проверяет комплектацию многостраничных форм, не требует вмешательства оператора на этапах сканирования и распознавания.
Система предполагает автоматический контроль результатов распознавания с помощью перекрёстных проверок, правил контроля сумм,сверок по словарям и базам данных.Существует возможность создать собственные правила проверки,в том числе с подключением списков и словарей,и использовать их для контроля качества вводимых данных.
Использование локальной версии ABBYY Form Readerпозволяет силами одного сотрудника вводить ежедневно от 500 до 1000 страниц в зависимости от сложности формы и аппаратной конфигурации.Если объём работ по вводу данных увеличится,пользователь в течение дня сможет модифицировать существующий комплекс, перейдя на версию с большей производительностью.Чтобы увеличить скорость обработки форм на 1000 страниц в день, достаточно установитьForm Reader на еще одно рабочее место [3,4,12].
Fine Reader Bank —система автоматизированного ввода платежных поручений —также является продуктом разработки компании ABBYY. Fine Reader Bank— готовое приложение,в основе которого лежит технология распознавания гибких форм[5,6].
СистемаCognitive Forms
КомпанияCognitive Technologiesразработала систему для ввода и обработки форм — Cognitive Forms. Процесс её работы осуществляется следующим образом.
Оператор на станции сканирования помещает пачку документов в устройство автоматической подачи сканера.Нажатием клавиши запускается процесс потокового сканирования документов.
Подсистема распознавания— Cognitive Form-Reader в автоматическом режиме управляет распознаванием и контекстной проверкой правильности распознавания.
На станции визуального контроля (модуль редактированияCognitive Form Editor) оператор имеет возможность визуально контролировать и редактировать распознанные поля форм перед экспортом в базу данных.
В подсистеме описания форм(Cognitive Form Designer) производится компьютерное описание обрабатываемых форм, используемое на всех этапах процесса ввода от распознавания до экспорта в базу данных.
Подсистема экспорта результатов
формирует текстовое
Одним из важных элементовCognitive Forms является система контроля за правильностью ввода информации.Ее основная функция состоит в том, чтобы точность распознавания на выходе составляла100%, обеспечивая при этом минимальную степень утомляемости оператора.Человек контролирует лишь те данные,которые не удовлетворяют требованиям правильности распознавания.
Слова документа,содержащие
сомнительно распознанные символы или
автоматически исправленные подсистемой
контекстного контроля,подсвечиваются.
Благодаря гибкой модульной организации системы имеется возможность простого масштабирования для увеличения производительности ввода.
Система работает по принципу максимальной автоматизации ввода. Все операции,связанные с навигацией по форме, распознаванием,контекстным контролем за корректностью ввода и экспортом в базу данных,происходят без участия оператора.
Участие оператора может потребоваться только на стадии окончательного контроля перед экспортом в базу данных.
По описанию заметно, что в системе обработки форм Cognitive Forms ярко представлены все этапы ввода стандартных форм, а также система является масштабируемой и открытой, что даёт ей преимущества.
Выводы к разделу 3
Из нескольких сотен компаний,предлагающих решения или компоненты систем обработки форм, наиболее известными являются системы«ABBYY Fine Reader Form»и «Cognitive Forms». Они предлагают различные модули ввода и обработки форм. Организация может приобрести как всю систему,так и отдельные модули. Кроме того, многие компании разрабатывают свои собственные решения, лицензируя у производителей модули обработки.Следовательно,в выборе системы массового ввода следует ориентироваться на особенности организации и формы, преобладающие в ней.
ЗАКЛЮЧЕНИЕ
В деятельности большого количества государственных,акционерных и частных предприятий возникает необходимость обработки структурированных и неструктурированных форм документов,изначально выполненных на бумаге. Обычно под этим понимается первоначальный ввод информации с бумажного документа в информационную систему предприятия и, затем, собственно обработка данных в СУБД и прикладных информационных системах.
Суммарное количество документов,которые должны быть занесены в базу данных для дальнейшей обработки только в одной организации,может достигать нескольких тысяч и даже десятков тысяч в день. Можно представить,в каком масштабе подобные работы производятся в целом по Украине.На это тратятся огромные средства,в то время как проблема может быть решена намного более эффективно.
С ростом числа документов растут и проблемы по вводу и обработке больших объёмов данных в вычислительных системах. Практически в любом бизнесе,связанном с обслуживанием клиентов, а также в деятельности государственных органов, занятых сбором данных о физических и юридических лицах, возникают стандартные формы.
Стандартными формами являются однотипные,имеющие априорную структуру документы,которые классифицируются по таким признакам:способ нанесения информации,геометрическая вариативность полей и наличие явных разделителей полей.
Стандартные формы используются
в различных бизнес-
Осуществление автоматизированного ввода
Ввод стандартных форм и форматированных документов
форм в базу данных подразумевает выполнение нескольких этапов: подготовка обработки формы, сканирование,сегментация полученного изображения,распознавание значимых полей,верификация,сохранение данных в полях базы данных.Причём сам процесс обработки формы включает именно сегментацию изображения формы и извлечение данных из значимых полей.
Придерживание определённых принципов при вводе форм освободит сотни людей от неэффективного утомительного труда. Учёт основных требований,предъявляемых к системам массового ввода форм, а также учёт подходов к их реализации обеспечит реальную экономию,снизит количество опечаток, повысит точность и соответственно достоверность вводимых данных.
Подчас неосведомленность начальства и неэффективная организация работы приводят к тому, что в компьютер вручную вбиваются тысячи однотипных печатных и рукопечатных форм. Объемы подобного труда просто огромны.Если в организации обрабатывается100 и более форм в день, то нецелесообразность автоматизации их ввода исключается,так как автоматизация экономически себя оправдает.
Наиболее известными системами,предлагающими решения или компоненты систем обработки форм, являются«ABBYY Fine Reader Form»и «Cognitive Forms». Они предлагают различные модули ввода и обработки форм. Организация может приобрести как всю систему,так и отдельные модули. Кроме того, многие компании разрабатывают свои собственные решения, лицензируя у производителей модули обработки.
Следовательно,автоматизацию ввода форм могут позволить себе крупные организации с большим объёмом документооборота.Автоматизация сократит затраты на ручной ввод данных из форм и повысит эффективность работы организации вцелом.
СПИСОК ЛИТЕРАТУРЫ