Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Эмпирические методы распознавания
Характерной чертой параметрического случая является использование в той или иной степени эмпирических распределений вероятности вместо истинных и эмпирических оценок (средних) вместо математических ожиданий. Это обстоятельство приводит к особым требованиям к объему и составу полной совокупности исходных данных {X} для того, чтобы эмпирическое осреднение приводило к состоятельным оценкам математических ожиданий. К непараметрическим методам оценки плотности вероятности f(xj) прибегают также при большом числе признаков xj и наличии зависимостей между ними. В этом случае нет необходимости делать предположение о виде функции f(xj). При этом класс функций, к которым применимы эти методы, ограничивается непрерывными функциями или близкими к ним.
Оценка парзеновского типа (обобщенная гистограмма)
Это одна из распространенных непараметрических оценок. Оценочная функция при этом может быть представлена выражением: где , j=1, …, N – функции, называемые ядрами, центрами которых являются точки в пространстве признаков, соответствующие объектам обучающей выборки. h(i) – коэффициент “размытости” i-го признака, зависящий от N. Если ядра выбираются симметричными относительно центра, т.е. являются функциями расстояния от центра, то оценка принимает вид: где - расстояние от до . Обобщенная гистограмма является асимптотически несмещенной и состоятельной, если выбор функции h от N при N®¥ обеспечивает h®¥ и Nh®¥. Для получения оценки плотности не по всему пространству признаков, а в заданной точке используются методы локального оценивания парзеновского окна и KN “ближайших соседей”. Оба метода основываются на возможности оценивания вероятности появления реализации в заданной области по эмпирической частоте. Вероятность попадания в некоторую область А признакового пространства “K” объектов из выборки объемом N равна: где Р – вероятность попадания в эту область одного объекта. Математическое ожидание к (как случайного числа объектов, попадающих в область А) равно P× N. Распределение вероятности Pk имеет выраженный максимум около математического ожидания. Потому можно полагать, что k@PN. То равенство тем точнее, чем больше N. Определение: Чтобы получить оценку средней плотности по области А необходимо найти значение Р как: P @ k/N И поделить то значение оценки вероятности на объем VA области А, т.е.:
|