![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Актуальные задачи распознавания. Среди множества интересных задач по распознаванию (распознавание отпечатков пальцев, распознавание по радужной оболочке глаза ⇐ ПредыдущаяСтр 4 из 4
Среди множества интересных задач по распознаванию (распознавание отпечатков пальцев, распознавание по радужной оболочке глаза, распознавание машиностроительных чертежей и т. д.) следует выделить задачу определения реальных координат заготовки и определения шероховатости обрабатываемой поверхности, рассмотренную в лекции 10. Другой актуальной задачей является распознавание машинописных и рукописных текстов в силу ее повседневной необходимости. Практическое значение задачи машинного чтения печатных и рукописных текстов определяется необходимостью представления, хранения и использования в электронном виде огромного количества накопленной и вновь создающейся текстовой информации. Кроме того, большое значение имеет оперативный ввод в информационные и управляющие системы информации с машиночитаемых бланков, содержащих как напечатанные, так и рукописные тексты. В связи с этим рассмотрим принципы и подход к распознаванию в задаче машинного чтения печатных и рукописных текстов, описанные в работе [55]. Для решения данной задачи используются следующие основные принципы. 1. Принцип целостности - распознаваемый объект рассматривается как единое целое, состоящее из структурных частей, связанных между собой пространственными отношениями. 2. Принцип двунаправленности - создание модели ведется от изображения к модели и от модели к изображению. 3. Принцип предвидения заключается в формировании гипотезы о содержании изображения. Гипотеза возникает при взаимодействии процесса " сверху-вниз", разворачивающегося на основе модели среды, модели текущей ситуации и текущего результата восприятия, и процесса " снизу-вверх", основанного на непосредственном грубом признаковом восприятии. 4. Принцип целенаправленности, включающий сегментацию изображения и совместную интерпретацию его частей. 5. Принцип " не навреди" - ничего не делать до распознавания и вне распознавания, то есть без " понимания". 6. Принцип максимального использования модели проблемной среды. Указанные принципы реализованы в пакете программ " Графит" [56], в программах FineReader-рукопись и FormReader - для распознавания рукописных символов и, частично, в программе FineReader для распознавания печатных текстов [55]. Входящая в FormReader программа чтения рукописных текстов была выпущена в 1998 году одновременно с системой ABBYY FineReader 4.0. Эта программа может читать все рукописные строчные и заглавные символы, допускает ограниченные соприкосновения символов между собой и с графическими линиями и обеспечивает поддержку 10 языков. Основное применение программы - распознавание и ввод информации с машиночитаемых бланков. В системе ABBYY FormReader при распознавании рукописных текстов используются структурный, растровый, признаковый, дифференциальный и лингвистический уровни распознавания. Для более подробного освоения подходов к распознаванию машинописных и рукописных текстов в системе ABBYY FormReader читателю рекомендуется непосредственно ознакомиться с работой А. Шамиса [55], при этом знание основ машинной графики на уровне [57] подразумевается. С другими работами по распознаванию читатель может познакомиться в литературе [62], [63]. Завершая этот раздел лекции, отметим особенности задачи зрительного восприятия роботов по сравнению с традиционными задачами распознавания образов и машинной обработки изображений [64]: · необходимость построения комплексного описания среды на основе учета значительной априорной информации (модели проблемной среды) в отличиие от традиционной задачи выделения фиксированных признаков или измерения отдельных параметров; · необходимость анализа трехмерных сцен не только в плане анализа трехмерных объектов по их плоским проекциям, но и в плане определения объемных пространственных отношений; · необходимость анализа изображений, включающих одновременно несколько произвольно расположенных объектов (в общем случае произвольной формы) в отличие от традиционной задачи, когда для распознавания предъявляется, как правило, один объект; · необходимость анализировать реальную динамическую среду, а не статические изображения; · отсутствие постоянной фиксированной задачи и необходимость оперативно решать возникающие по ходу дела задачи; · необходимость следить за изменениями в среде, которые могут порождать новые оперативные задачи; · необходимость организации системного процесса взаимодействия в реальном времени нескольких подсистем робота (" глаз-мозг", " глаз-мозг-рука"). В заключение лекции следует отметить, что методов распознавания много, они опубликованы (см. список литературы к данной лекции). Успеха в создании серьезных программных продуктов по распознаванию и решению задач зрительного восприятия роботов добьются коллективы, упорно и кропотливо создающие и оттачивающие свои инструментальные средства для реальных задач распознавания изображений.
|