Программа сканирования и распознавания текстов FineReader

Автор работы: Пользователь скрыл имя, 09 Мая 2014 в 11:16, реферат

Краткое описание

Проблема распознавания текста в составе точечного графического изображения является весьма сложной. Подобные задачи решают с помощью специальных программных средств, называемых средствами распознавания образов. Реальный технический прорыв в этой области произошел лишь в последние годы. До этого распознавание текста было возможно только путем сравнения обнаруженных конфигураций точек со стандартным образцом (эталоном, хранящимся в памяти компьютера).
Авторы программ задавали критерий «похожести», используемый при идентификации символов.
Подобные системы назывались OCR (Optical Character Recognition — оптическое распознавание символов) и опирались на специально разработанные шрифты, облегчавшие такой подход.

Содержание

Введение…………………………………………………………………………3
Программа FineReader………………………………………………………..5
Распознавание документов в программе FineReader…………………….6
Как ввести документ за минуту……………………………………………...8
Параметры сканирования……………………………………………………9
Основные панели программы FineReader................................................11
Советы и примеры…………………………………………………………...14
Заключение…………………………………………………………………....21
Список литературы…………………………………………………………..22

Прикрепленные файлы: 3 файла

Введение.doc

— 30.00 Кб (Скачать документ)

Введение

После обработки документа сканером получается графическое изображение документа (графический образ). Но графический образ еще не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ. Проблема распознавания текста в составе точечного графического изображения является весьма сложной. Подобные задачи решают с помощью специальных программных средств, называемых средствами распознавания образов. Реальный технический прорыв в этой области произошел лишь в последние годы. До этого распознавание текста было возможно только путем сравнения обнаруженных конфигураций точек со стандартным образцом (эталоном, хранящимся в памяти компьютера).

Авторы программ задавали критерий «похожести», используемый при идентификации символов. 
Подобные системы назывались OCR (Optical Character Recognition — оптическое распознавание символов) и опирались на специально разработанные шрифты, облегчавшие такой подход.

Естественно приходилось сталкиваться с произвольным и, тем более, сложным шрифтом, программы такого рода начинали давать серьезные сбои. 
Современные научные достижения в области распознавания образов буквально перевернули представление об оптическом распознавании символов.

Современные программы вполне могут справляться с различными (и весьма вычурными) шрифтами без перенастройки. Многие распознают даже рукописный текст. 
Поскольку потребность в распознавании текста отсканированных документов достаточно велика, неудивительно, что имеется значительное число программ, предназначенных для этой цели. Так как разные научные методы распознавания текста развивались независимо друг от друга, многие из этих программ используют совершенно разные алгоритмы. 
Эти алгоритмы могут давать разные результаты на разных документах.

Например, упоминавшиеся выше системы OCR способны распознавать только стандартный специально подготовленный шрифт и дают на этом шрифте наилучшие результаты, которые не может превзойти ни одна, из более универсальных программ. 
Современные алгоритмы распознавания текста не ориентируются ни на конкретный шрифт, ни на конкретный алфавит. Большинство программ способно распознавать текст на нескольких языках. Одни и те же алгоритмы можно использовать для распознавания русского, латинского, арабского и других алфавитов и даже смешанных текстов.

Разумеется, программа должна знать, о каком алфавите идет речь. 
Нас, прежде всего, интересуют программы, способные распознавать текст, напечатанный на русском языке. Такие программы выпускаются отечественными производителями. Наиболее широко известна и распространена программа FineReader.

Актуальность темы: в развитии новых технологий человечество постоянно движется к их упрощению и простоте использования. Это происходит даже в распознавании текста отсканированных документов, как это было уже выше сказано. Распознавание текста с помощью программы FineReader есть задача, которая позволяет человечеству перейти к упрощенной форме изучения информации. И это развитие становится не локальным, т.е. развитие происходит не в одной, а глобальным, т.е. охватывающих всех.

 

 


Основная часть.doc

— 357.50 Кб (Просмотреть файл, Скачать документ)

содержание.doc

— 22.50 Кб (Просмотреть файл, Скачать документ)

Информация о работе Программа сканирования и распознавания текстов FineReader