Программные средства сканирования и распознавания изображений

Автор работы: Пользователь скрыл имя, 18 Декабря 2013 в 18:20, реферат

Краткое описание

Задача сканирования текстов, при необходимом качественном разрешении, на 90% состоит в распознавании. А для этого разработано математическое обеспечение, которое позволяет эффективно построить технологию получения качественных электронных документов. Чтобы реализовать автоматический или автоматизированный перевод бумажных документов в электронный вид, необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ, называемых системами оптического распознавания символов.

Содержание

1.Общие требования к выполнению курсовой работы 4
1.1 Цели и задачи курсовой работы 4
1.2Тематика курсовых работ 4
1.3Примерный объем и содержание отдельных частей курсовой работы 5
2.Рекомендации по подготовке и оформлению курсовой работы 6
2.1 Изложение текста 8
2.2 Формулы 9
2.3 Иллюстрации 10
2.4 Таблицы 11
3.Последовательность выполнения курсовой работы 12

Скачать полностью (25.41 Кб) Сколько стоит заказать работу?

Прикрепленные файлы: 1 файл

Иванов.doc

— 75.00 Кб (Скачать документ)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

КУРСОВАЯ РАБОТА

по дисциплине

«Информационные технологии»

на тему:

«Программные средства сканирования и распознавания изображений»

Выполнил:

студент курса группы

специальности «»

очной формы обучения

________________________

(подпись)

Руководитель работы:

Работа допущена к защите _______________________ ______________

(подпись руководителя) (дата)

Работа выполнена и

защищена с оценкой _________________________ Дата защиты______________

Члены комиссии: ________________ __________ _______________

(должность) (подпись) (И.О. Фамилия)

________________ _______________ _______________

Ставрополь, 2013 г.

СОДЕРЖАНИЕ

1.Общие требования к выполнению курсовой работы 4

1.1 Цели и задачи курсовой работы 4

1.2Тематика курсовых работ 4

1.3Примерный объем и содержание отдельных частей курсовой работы 5

2.Рекомендации по подготовке и оформлению курсовой работы 6

2.1 Изложение текста 8

2.2 Формулы 9

2.3 Иллюстрации 10

2.4 Таблицы 11

3.Последовательность выполнения курсовой работы 12

Сканированиее плотность свет

Для пользователей компьютеров единственным путём просмотра электронных файлов является сканирование изображения. Во время этого процесса сканер преобразовывает текст, графику листа и плёнку в цифровой образ, процесс преобразования может быть аналоговым и цифровым.

Процесс сканирования изображения является лёгким и доступным и чаще всего работают со сканером, при использовании он является наиболее эффективным и разнообразным. Его широко используют для коммерческих целей, но любителям также нравится сканировать изображения, особенно если они увлекаются фотографиями. Также часто его используют в художественном творчестве, это заодно и весело, и полезно.

Обучающая программа по сканированию всегда доступна, как и для рисунка, так и для документов. Не для пользователей компьютеров единственным путём просмотра электронных файлов является сканирование изображения. Во время этого процесса сканер преобразовывает текст, графику листа и плёнку в цифровой образ, процесс преобразования может быть аналоговым и цифровым.

Для сканирования изображения нужно следовать нескольким основным шагам, для любого типа сканера или программного обеспечения метод сканирования фотографий на планшетном сканере один и тот же. Когда лампа светит на фотографию, оптические ячейки сканера фиксируют цвета, отражающиеся с точек изображения. Такими цветами являются красный, зелёный и синий. (КЗС).

Пиксель или элемент рисунка передаётся к каждой точке и измеряется в пикселях из расчёта на дюйм, это является разрешением образа. Три числа представляют каждый пиксель на образе, и эти числа показывают яркость красного, зелёного и синего компонента цвета. Итак, есть разные форматы изображения, и каждый формат хранит информацию о пикселях и цветах в разных вариантах. имеет значения, что вы хотите перенести в компьютер: текст или рисунок, вы должны знать, как работать со сканером. Обычно программное обеспечение объясняет все шаги детально, и сканировать изображения вы можете практически как цветным, так и чёрно- белым.

Сканирование документов – процесс создания электронного изображения бумажного документа, напоминает его фотографирование. На этапе сканирования производится получение изображения при помощи сканера и сохранение их в виде, удобном для последующей обработки.

Процесс сканирования осуществляется автоматически и требует от пользователя только вспомогательных операций, таких как смена сканируемой страницы.

Сканирование, как единый сквозной процесс, распадается на две независимых ветви. По одному направлению идёт ввод в вычислительные системы текстовых массивов информации, по другому – графических.

Чтобы реализовать автоматический или автоматизированный перевод бумажных документов в электронный вид, необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ, называемых системами оптического распознавания символов.

Распознавание текстов и изображений

Процесс распознавания изображений является сложной многоэтапной процедурой. Многоэтапность (иерархичность) обусловлена тем, что различные задачи обработки на самом деле тесно связаны и качество решения одной из них влияет на выбор метода решения остальных. Так выбор метода распознавания зависит от конкретных условий предъявления входных изображений, в том числе характера фона, других изображений, помеховой обстановки и связан с выбором методов предобработки, сегментации, фильтрации.

Распознавание - чаще всего конечный этап обработки, лежащий в основе процессов интерпретации и понимания. Входными для распознавания являются изображения, выделенные в результате сегментации и, частично, отреставрированные. Они отличаются от эталонных геометрическими и яркостными искажениями, а также сохранившимися шумами.

На этом шаге происходит идентификация документа и выделение его объектов (полей, пометок, штрихкодов и прочего), удаляются помехи, которые мешают распознаванию (например, разграфка). Далее происходит распознавание полей документа. Затем проводится оценка достоверности результатов распознавания, после чего производится обобщенный лингвистический анализ поля.

После распознавания может следовать специальная обработка его результатов на основании априорной лингвистической и структурной информации о поле. После этого принимается решение о достоверности результатов распознавания. В системе реализована схема, признающая поле недостоверным в случае наличия в нем хотя бы одного недостоверного символа. После этого происходит сохранение результатов распознавания во внутренний формат системы и выполняется контроль логической непротиворечивости данных.

Кроме всего этот этап выполняет дополнительные функции: автоматическое определение угла поворота страницы и его автоматическая коррекция.

Процесс распознавания полностью автоматический, не требует наличия оператора, при этом возможно распараллеливание распознавания в рамках локальной сети.

При необходимости, после распознавания документ передается на верификацию. Если же необходимости в верификации нет, распознанные данные могут экспортироваться во внешние информационные системы и базы данных.

Верификация документа: исправление ошибок заполнения и распознавания, подтверждение результатов распознавания «сомнительных» полей, просмотр полей, не прошедших логический контроль, и принятие решения о дальнейшей судьбе таких документов. На этом этапе оператор производит визуальный контроль результатов распознавания и принимает решение о дальнейшем маршруте документа. Процесс реализован в двухоконном редакторе форм. В одном окне показано изображение бумажного документа, в другом - электронная форма, содержащая распознанные данные.

Процесс верификации документа идет по следующей схеме. Оператору предъявляется изображение и электронная форма с распознанными данными. При этом поля, не прошедшие контроль достоверности и логической непротиворечивости, подсвечены цветом для привлечения внимания оператора. Оператор, перемещая фокус между полями электронной формы, видит диагностику ошибок и либо исправляет ошибку, либо, если ошибку нельзя исправить, принимает решение передать документ на этап обработки «плохих» документов. При передвижении по полям модуль автоматически подсвечивает рамку поля на изображении.

Для повышения эффективности работы оператора предусмотрены два режима: проход только по полям, не прошедшим контроль, и режим пропуска незаполненных полей. Кроме этого, если прикреплен словарь, содержащий допустимые значения для поля, то имеется возможность указать в описании поля необходимость предъявления словаря оператору и разрешить оператору вставлять в поле значения из словаря.

После окончания верификации документа оператору предлагается либо отложить его, либо передать на этап экспорта данных.

Возможно распараллеливание процесса верификации в рамках локальной сети. В крупных проектах массового ввода могут быть одновременно задействованы десятки операторов, выполняющих функцию верификации потока документов.

После верификации, данные могут экспортироваться во внешние информационные системы и базы данных.

Точность распознавания

Ключевым параметром систем распознавания, характеризующим их практическую ценность, является точность распознавания, то есть процент правильно распознанных символов.

Optical Character Recognition - системы могут достигать наилучшей точности распознавания - свыше 99,9% для чистых изображений, составленных из обычных шрифтов. На первый взгляд такая точность распознавания кажется идеальной, но уровень ошибок все же удручает, потому что, если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю. То есть, если какого-то слова нет в словаре системы, то она по специальным правилам пытается найти похожее. Но это все равно не позволяет исправлять 100 % ошибок, что требует человеческого контроля результатов.

Точность распознавания падает за счет ошибок распознавания. Повышению точности распознавания способствует устранение указанных ниже причин ошибок.

Причины ошибок при распознавании

Встречающиеся в реальной жизни тексты обычно далеки от совершенства, и процент ошибок распознавания для "нечистых" текстов часто недопустимо велик. Грязные изображения - здесь наиболее очевидная проблема, потому что даже небольшие пятна могут затенять определяющие части символа или преобразовывать один в другой. Еще одной проблемой является неаккуратное сканирование, связанное с "человеческим фактором", так как оператор, сидящий за сканером, просто не в состоянии разглаживать каждую сканируемую страницу и точно выравнивать ее по краям сканера.

Если документ был ксерокопирован, нередко возникают разрывы и слияния символов. Любой из этих эффектов может заставлять систему ошибаться, потому что некоторые из OCR-систем полагают, что непрерывная область изображения должна быть одиночным символом.

Страница, расположенная с нарушением границ или перекосом, создает немного искаженные символьные изображения, которые могут быть перепутаны OCR.

Более трудоёмкой является задача сканирования цветных изображений. Она обычно заключается в наиболее полном считывании информации с оригинала, т. е. его тонового и цветового диапазона, а также разрешения. При этом желательно по необходимости скорректировать недостатки оригинала с точки зрения последующего использования изображения. Например, компенсировать нежелательный цветовой сдвиг, тоновый дисбаланс или подавить полиграфический растр оригинала.

В настоящее время для решения этих задач многие фирмы производят соответствующее оборудование и разрабатывают математическое обеспечение. Однако именно в наличии большого количества возможностей и способов организовать технологический процесс сканирования и кроется главная опасность. Выбор определённого устройства и программ позволяет удовлетворительно и без перенастроек работать только со сравнительно небольшим диапазоном типов документов

2.2Применение сканирования

Применение сканеров имеет широкий диапазон и находится в постоянном развитии. Сканирование интенсивно используются в специализированных информационных технологиях. По сканированию текста наиболее полно наработан – цветной графики, давно работают в области полиграфии

Успешность применения сканеров зависит не только от их собственных качеств, но и от правильного их использования. Каждая из областей применения имеет свой собственный акцент и делает ударение на различные характеристики системы.

Настольные издательские системы (вы вводите в издаваемую статью рисунки, диаграммы, фотографии). В данном случае сканеры должны быть как минимум цветными, обладать высокой разрешающей способностью, широким диапазоном оптических плотностей, с числом передаваемых цветов 16 777 216 (24 бита на точку - 8 бит на каждый цвет RGB) и т.д.

Системы обработки документов (пакет оптического распознавания символов вместе со сканером научат ваш компьютер "читать" текст, экономия времени, которое тратится на ввод с клавиатуры). Сканеры, применяемые для этих целей не должны быть цветными, т.к. для сканирования текста необходимо регистрировать только два уровня - белый и черный (глубина точки 1 бит), высоких разрешающих способностей здесь тоже не требуется, а значит, стоимость сканера сильно снижается.

САПР (сканер + программа векторизации облегчает процесс ввода чертежей для дальнейшего их использования в пакетах автоматического проектирования). Нет необходимости применять здесь цветной сканер, но разрешающая способность должна быть достаточно высокой, чтобы косые линии не выглядели как ступеньки лестницы.

Информация о работе Программные средства сканирования и распознавания изображений