Сканирование и распознавание изображений

Автор работы: Пользователь скрыл имя, 16 Мая 2013 в 16:34, реферат

Краткое описание

Одним из основных способов ввода информации в вычислительные системы является сканирование. Именно сканер стал тем устройством, с помощью которого в компьютер попадает огромное количество информации.
С помощью современной аппаратуры сканирования с высоким разрешением исходного документа довольно просто формируется графический файл специального формата. Такой файл после соответствующей обработки может быть преобразован в любой из форматов, которые применяются в информационных технологиях. Это форматы представления текстов и графических видов информации – фотографий, слайдов, рисунков и т.п.

Прикрепленные файлы: 1 файл

Сканирование и распознавание изображений.doc

— 110.50 Кб (Скачать документ)

 

 

 

Реферат.

Тема: Сканирование и  распознавание изображений.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2012 год

  
Введение.

Одним из основных способов ввода информации в вычислительные системы является сканирование. Именно сканер стал тем устройством, с помощью которого в компьютер попадает огромное количество информации.

С помощью современной  аппаратуры сканирования с высоким разрешением исходного документа довольно просто формируется графический файл специального формата. Такой файл после соответствующей обработки может быть преобразован в любой из форматов, которые применяются в информационных технологиях. Это форматы представления текстов и графических видов информации – фотографий, слайдов, рисунков и т.п.

Преобразование документа  в электронный вид делится на два этапа: получение графического образа документа и перевод графического образа в текстовый формат. Графический образ документа является результатом сканирования. Перевод графического образа документа в текстовый формат может быть произведен вручную или посредством автоматического распознавания.

Говоря о сканировании, вспомним, что же такое сканер? А  так же рассмотрим основные характеристики сканеров.

 

Сканер. Характеристики сканера.

Ска́нер (англ. scanner) — устройство, выполняющее преобразование расположенного на плоском носителе (чаще всего бумаге) изображения в цифровой формат.

В 1857 году флорентийский аббат Джованни Казелли (итал. Giovanni Caselli) изобрёл прибор для передачи изображения на расстояние, названный впоследствии пантелеграф. Передаваемая картинка наносилась на барабан токопроводящими чернилами и считывалась с помощью иглы.

В 1902 году, немецким физиком Артуром Корном (нем. Arthur Korn) была запатентована технология фотоэлектрического сканирования, получившая впоследствии название телефакс. Передаваемое изображение закреплялось на прозрачном вращающемся барабане, луч света от лампы, перемещающейся вдоль оси барабана, проходил сквозь оригинал и через расположенные на оси барабана призму и объектив попадал населеновый фотоприёмник. Эта технология до сих пор применяется в барабанных сканерах.

В дальнейшем, с развитием полупроводников, усовершенствовался фотоприёмник, был изобретен планшетный способ сканирования, но сам принцип оцифровки изображения остаётся почти неизменным.

Основные характеристики сканеров.

  • Оптическое разрешение. Является основной характеристикой сканера. Сканер снимает изображение не целиком, а по строчкам. По вертикали планшетного сканера движется полоска светочувствительных элементов и снимает по точкам изображение строку за строкой. Чем больше светочувствительных элементов у сканера, тем больше точек он может снять с каждой горизонтальной полосы изображения. Это и называется оптическим разрешением. Оно определяется количеством светочувствительных элементов (фотодатчиков), приходящихся на дюйм горизонтали сканируемого изображения. Обычно его считают по количеству точек на дюйм - dpi (dots per inch). Нормальный уровень разрешение не менее 600 dpi, увеличивать его еще дальше - значит, применять дорогую оптику, дорогие светочувствительные элементы, и увеличивать время сканирования. Для обработки слайдов необходимо более высокое разрешение 1200 dpi.
  • Разрешение по X. Этот параметр показывает количество пикселей у фоточувствительной линейки, из которых формируется изображение. Разрешение является одной из основных характеристик сканера. Большинство моделей имеет оптическое разрешение сканера 600 или 1200 dpi (точек на дюйм). Его достаточно для получения качественной копии. Для профессиональной работы с изображением необходимо более высокое разрешение.
  • Разрешение по Y. Этот параметр определяется величиной хода шагового двигателя и точностью работы механики. Механическое разрешение сканера значительно выше оптического разрешения фотолинейки. Именно оптическое разрешение линейки фотоэлементов будет определять общее качество отсканированного изображения.
  • Скорость сканирования. Скорость сканирования зависит от разрешения при сканировании и от размера оригинала. Обычно производители указывают этот параметр для формата А4. Скорость сканирования может измеряться количеством страниц в минуту или временем, необходимым для сканирования одной страницы. Иногда измеряется в количестве сканируемых линий в секунду.
  • Глубина цвета. Как правило, производители указывают два значения для глубины цвета - внутреннюю глубину и внешнюю. Внутренняя глубина - это разрядность АЦП (аналого-цифрового преобразователя) сканера, она указывает на то, сколько цветов сканер способен различить в принципе. Внешняя глубина - это количество цветов, которое сканер может передать компьютеру. Большинство моделей используют для цветопередачи 24 бита (по 8 на каждый цвет). Для стандартных задач в офисе и дома этого вполне достаточно. Но если вы собираетесь использовать сканер, для серьезной работы с графикой, попробуйте найти модель с большим числом разрядов.
  • Максимальная оптическая плотность. Максимальная оптическая плотность у сканера - это оптическая плотность оригинала, которую сканер отличает от 'полной темноты'. Чем больше это значение, тем больше чувствительность сканера и, тем выше качество сканирования темных изображений.
  • Тип источника света. Ксеноновые лампы отличаются малым временем прогрева, долгим сроком службы и небольшими размерами. Флуоресцентные лампы с холодным катодом дешевы в производстве и имеют долгий срок службы. Светодиоды (LED) обладают малыми размерами, низким энергопотреблением и не требуют времени для прогрева. Но по качеству цветопередачи LED-сканеры уступают сканерам с флуоресцентными и ксеноновыми лампами.
  • Тип датчика сканера. В сканерах МФУ обычно используется один из двух типов датчиков: контактный (CIS) или ПЗС (CCD). CIS представляет собой линейку фотоэлементов, которая равна ширине сканируемой поверхности. Во время сканирования она перемещается под стеклом и строка за строкой передает информацию об изображении на оригинале в виде электрического сигнала. Для освещения обычно используются светодиоды, которые расположены в непосредственной близости от фотолинейки на той же подвижной платформе. Сканеры на базе CIS имеют простую конструкцию, тонкий корпус и небольшой вес, они обычно дешевле сканеров на базе CCD. Основной недостаток CIS состоит в малой глубине резкости.

Виды сканеров.

  • планшетные — наиболее распространённый вид сканеров, поскольку обеспечивает максимальное удобство для пользователя — высокое качество и приемлемую скорость сканирования. Представляет собой планшет, внутри которого под прозрачным стеклом расположен механизм сканирования.
  • ручные — в них отсутствует двигатель, следовательно, объект приходится сканировать пользователю вручную, единственным его плюсом является дешевизна и мобильность, при этом он имеет массу недостатков — низкое разрешение, малую скорость работы, узкая полоса сканирования, возможны перекосы изображения, поскольку пользователю будет трудно перемещать сканер с постоянной скоростью.
  • листопротяжные — лист бумаги вставляется в щель и протягивается по направляющим роликам внутри сканера мимо лампы. Имеет меньшие размеры, по сравнению с планшетным, однако может сканировать только отдельные листы, что ограничивает его применение в основном офисами компаний. Многие модели имеют устройство автоматической подачи, что позволяет быстро сканировать большое количество документов.
  • планетарные сканеры — применяются для сканирования книг или легко повреждающихся документов. При сканировании нет контакта со сканируемым объектом (как в планшетных сканерах). Подробности на английском языке http://en.wikipedia.org/wiki/Planetary_scanner
  • книжные сканеры - предназначены для сканирования брошюрованных документов. Сканирование производится лицевой стороной вверх - таким образом, Ваши действия по сканированию неотличимы от перелистывания страниц при обычном чтении. Это предотвращает их повреждение и позволяет пользователю видеть документ в процессе сканирования.
  • слайд-сканеры — как ясно из названия, служат для сканирования плёночных слайдов, выпускаются как самостоятельные устройства, так и в виде дополнительных модулей к обычным сканерам.
  • сканеры штрих-кода — небольшие, компактные модели для сканирования штрих-кодов товара в магазинах.

Принцип действия

Сканируемый объект кладется на стекло планшета сканируемой поверхностью вниз. Под стеклом располагается  подвижная лампа, движение которой  регулируется шаговым двигателем. Свет, отраженный от объекта, через систему зеркал попадает на чувствительную матрицу, далее на АЦП и передается в компьютер. За каждый шаг двигателя сканируется полоска объекта, которые потом объединяются программным обеспечением в общее изображение.

Изображение всегда сканируется в  формат RAW — а затем конвертируется в обычный графический формат с применением текущих настроек яркости, контрастности, и т. д. Эта конвертация осуществляется либо в самом сканере, либо в компьютере — в зависимости от модели конкретного сканера. На параметры и качество RAW-данных влияют такие аппаратные настройки сканера, как время экспозиции матрицы, уровни калибровки белого и чёрного, и т. п.

 

Сканирование.

Для пользователей компьютеров  единственным путём просмотра электронных  файлов является сканирование изображения. Во время этого процесса сканер преобразовывает текст, графику листа и плёнку в цифровой образ, процесс преобразования может быть аналоговым и цифровым.

Процесс сканирования изображения  является лёгким и доступным и  чаще всего работают со сканером, при  использовании он является наиболее эффективным и разнообразным. Его широко используют для коммерческих целей, но любителям также нравится сканировать изображения, особенно если они увлекаются фотографиями. Также часто его используют в художественном творчестве, это заодно и весело, и полезно. 

Обучающая программа по сканированию всегда доступна, как и для рисунка, так и для документов. Не для пользователей компьютеров единственным путём просмотра электронных файлов является сканирование изображения. Во время этого процесса сканер преобразовывает текст, графику листа и плёнку в цифровой образ, процесс преобразования может быть аналоговым и цифровым.

Для сканирования изображения нужно  следовать нескольким основным шагам, для любого типа сканера или программного обеспечения метод сканирования фотографий на планшетном сканере один и тот же. Когда лампа светит на фотографию, оптические ячейки сканера фиксируют цвета, отражающиеся с точек изображения. Такими цветами являются красный, зелёный и синий. (КЗС). 

Пиксель или элемент рисунка передаётся к каждой точке и измеряется в пикселях из расчёта на дюйм, это является разрешением образа. Три числа представляют каждый пиксель на образе, и эти числа показывают яркость красного, зелёного и синего компонента цвета. Итак, есть разные форматы изображения, и каждый формат хранит информацию о пикселях и цветах в разных вариантах. 
имеет значения, что вы хотите перенести в компьютер: текст или рисунок, вы должны знать, как работать со сканером. Обычно программное обеспечение объясняет все шаги детально, и сканировать изображения вы можете практически как цветным, так и чёрно- белым.

Пиксель или элемент  рисунка передаётся к каждой точке  и измеряется в пикселях из расчёта  на дюйм, это является разрешением  образа. Три числа представляют каждый пиксель на образе, и эти числа показывают яркость красного, зелёного и синего компонента цвета. Итак, есть разные форматы изображения, и каждый формат хранит информацию о пикселях и цветах в разных вариантах.

Сканирование  документов – процесс создания электронного изображения бумажного документа, напоминает его фотографирование. На этапе сканирования производится получение изображения при помощи сканера и сохранение их в виде, удобном для последующей обработки.

Процесс сканирования осуществляется автоматически и требует от пользователя только вспомогательных операций, таких как смена сканируемой страницы.

Сканирование, как единый сквозной процесс, распадается на две  независимых ветви. По одному направлению  идёт ввод в вычислительные системы текстовых массивов информации, по другому – графических.

Задача сканирования текстов, при необходимом качественном разрешении, на 90% состоит в распознавании. А для этого разработано математическое обеспечение, которое позволяет  эффективно построить технологию получения качественных электронных документов.

Чтобы реализовать автоматический или автоматизированный перевод  бумажных документов в электронный  вид, необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ, называемых системами оптического распознавания символов.

 

Распознавание текстов и изображений.

Процесс распознавания  изображений является сложной многоэтапной процедурой. Многоэтапность (иерархичность) обусловлена тем, что различные  задачи обработки на самом деле тесно связаны и качество решения одной из них влияет на выбор метода решения остальных. Так выбор метода распознавания зависит от конкретных условий предъявления входных изображений, в том числе характера фона, других изображений, помеховой обстановки и связан с выбором методов предобработки, сегментации, фильтрации.

Распознавание — чаще всего конечный этап обработки, лежащий в основе процессов интерпретации и понимания. Входными для распознавания являются изображения, выделенные в результате сегментации и, частично, отреставрированные. Они отличаются от эталонных геометрическими и яркостными искажениями, а также сохранившимися шумами.

На этом шаге происходит идентификация документа и выделение  его объектов (полей, пометок, штрихкодов и прочего), удаляются помехи, которые мешают распознаванию (например, разграфка). Далее происходит распознавание полей документа. Затем проводится оценка достоверности результатов распознавания, после чего производится обобщенный лингвистический анализ поля.

После распознавания  может следовать специальная  обработка его результатов на основании априорной лингвистической  и структурной информации о поле. После этого принимается решение  о достоверности результатов  распознавания. В системе реализована  схема, признающая поле недостоверным в случае наличия в нем хотя бы одного недостоверного символа. После этого происходит сохранение результатов распознавания во внутренний формат системы и выполняется контроль логической непротиворечивости данных.

Информация о работе Сканирование и распознавание изображений