Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Задачи распознавания имеют следующие характерные черты.






Это информационные задачи, состоящие из двух этапов:

Ø преобразование исходных данных к виду, удобному для распознавания;

Ø собственно распознавание (указание принадлежности объекта определенному классу).

 

Примеры задач распознавания образов:

Ø Распознавание рукописного и печатного текста.

Ø Распознавание штрих-кодов;

Ø Распознавание автомобильных номеров;

Ø Распознавание лиц и других биометрических данных;

Ø Распознавание речи.

 

Для распознавания образов в настоящее время создано немало специальных программ. Так, например, для распознавания рукописного и печатного текста используется - программа FineReader, которая распознает печатный текст. Программа PenReader осуществляет мгновенный перевод рукописного текста, написанного от руки на экране планшетного ПК или с помощью графического планшета - дигитайзера. К программам распознавания образов относятся также программы для идентификации отпечатков пальцев, распознавания подписей, человеческих лиц, которые могут использоваться охранными системами, в криминалистической экспертизе и т.д. Сюда же относятся и программы синтеза, анализа и распознавания речи, т.е. программы, которые предназначены для преобразования текса в речь (синтезаторы речи - Рассказчик 3) и наоборот программы распознавания речи и преобразования её в текст (анализ - Диктограф5).

 

Программа оптического распознавания текста (FineReader)

 

Сканер - устройство ввода в компьютер изображений в виде текста, рисунков, слайдов, фотографий и другой графической информации.

 

При сканировании текстовых документов получается графическое изображение - графический образ документа. Но графический образ еще не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ.

Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition – OCR).

Одна из самых известных программ для распознавания текстов – это FineReader.

Программа FineReader выпускается отечественной компанией ABBYY Software (www.bitsoft.ru). Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных текстов.
Программа имеет ряд удобных возможностей. Она позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов (или с многостраничными документами) и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов. Она позволяет редактировать распознанный текст и проверять его орфографию.


Основные возможности OCR FineReader Ø улучшенная точность распознавания и сохранения, форматирования исходных документов; Ø распознавание и сохранение документов в удобном для пользователя формате, в том числе в формате PDF; Ø экспорт распознанного текста в офисные приложения; Ø возможность воспроизводить такие сложные элементы верстки, как непрямоугольные картинки, обтекание картинок текстом, различные шрифты, таблицы. Пакетная обработка – облегчает работу с многостраничными документами. Такие функции, как " распознать", " повернуть изображение", " очистка изображения", " сохранить" можно применять ко всему пакету в целом.Пиктограммы позволяют контролировать процесс пакетной обработки документов.Система проверки орфографии позволяет легко проверить и отредактировать распознанный текст. Неуверенно распознанные символы и слова, которых нет в словаре, выделяются различными цветами.Распознавание многоязычных документов – FineReader распознает тексты на 177 языках, включая английский, русский, немецкий, французский и др. Чтобы распознать документ, состоящий из русских и английских слов и фраз, следует перед распознаванием выбрать соответствующий язык распознавания, т.е. " Русско-Английский". Распознает любой тип шрифта, кроме рукописного и декоративного, данные типы шрифта процессор воспринимает как рисунок. Поддержка Windows XP – FineReader полностью совместим с операционными системами компании Microsoft. Прямой экспорт в Microsoft Word, Excel и Outlook – FineReader легко и быстро экспортирует результаты распознавания в офисные приложения. Обработка изображений различных форматов – FineReader поддерживает большое количество входных форматов файлов. Можно распознавать изображения, полученные из самых разных источников, в том числе факсы.

Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.006 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал