![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Задачи распознавания имеют следующие характерные черты.
Это информационные задачи, состоящие из двух этапов: Ø преобразование исходных данных к виду, удобному для распознавания; Ø собственно распознавание (указание принадлежности объекта определенному классу).
Примеры задач распознавания образов: Ø Распознавание рукописного и печатного текста. Ø Распознавание штрих-кодов; Ø Распознавание автомобильных номеров; Ø Распознавание лиц и других биометрических данных; Ø Распознавание речи.
Для распознавания образов в настоящее время создано немало специальных программ. Так, например, для распознавания рукописного и печатного текста используется - программа FineReader, которая распознает печатный текст. Программа PenReader осуществляет мгновенный перевод рукописного текста, написанного от руки на экране планшетного ПК или с помощью графического планшета - дигитайзера. К программам распознавания образов относятся также программы для идентификации отпечатков пальцев, распознавания подписей, человеческих лиц, которые могут использоваться охранными системами, в криминалистической экспертизе и т.д. Сюда же относятся и программы синтеза, анализа и распознавания речи, т.е. программы, которые предназначены для преобразования текса в речь (синтезаторы речи - Рассказчик 3) и наоборот программы распознавания речи и преобразования её в текст (анализ - Диктограф5).
Программа оптического распознавания текста (FineReader)
Сканер - устройство ввода в компьютер изображений в виде текста, рисунков, слайдов, фотографий и другой графической информации.
При сканировании текстовых документов получается графическое изображение - графический образ документа. Но графический образ еще не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ. Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition – OCR). Одна из самых известных программ для распознавания текстов – это FineReader. Программа FineReader выпускается отечественной компанией ABBYY Software (www.bitsoft.ru). Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных текстов. Основные возможности OCR FineReader Ø улучшенная точность распознавания и сохранения, форматирования исходных документов; Ø распознавание и сохранение документов в удобном для пользователя формате, в том числе в формате PDF; Ø экспорт распознанного текста в офисные приложения; Ø возможность воспроизводить такие сложные элементы верстки, как непрямоугольные картинки, обтекание картинок текстом, различные шрифты, таблицы. Пакетная обработка – облегчает работу с многостраничными документами. Такие функции, как " распознать", " повернуть изображение", " очистка изображения", " сохранить" можно применять ко всему пакету в целом.Пиктограммы позволяют контролировать процесс пакетной обработки документов.Система проверки орфографии позволяет легко проверить и отредактировать распознанный текст. Неуверенно распознанные символы и слова, которых нет в словаре, выделяются различными цветами.Распознавание многоязычных документов – FineReader распознает тексты на 177 языках, включая английский, русский, немецкий, французский и др. Чтобы распознать документ, состоящий из русских и английских слов и фраз, следует перед распознаванием выбрать соответствующий язык распознавания, т.е. " Русско-Английский". Распознает любой тип шрифта, кроме рукописного и декоративного, данные типы шрифта процессор воспринимает как рисунок. ![]()
|