Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Метрика в признаковом пространстве: расстояния между объектами
Рассмотрим наиболее часто используемые расстояния между объектами [12, 25]. 1. Обычное евклидово расстояние: . Данная мера различия объектов используется в трех случаях: 1. выборка извлечена из нормально распределенной генеральной совокупности с ковариационной матрицей вида (признаки некоррелированы и имеют одинаковую дисперсию); 2. признаки однородны по физическому смыслу и одинаково важны при классификации; 3. признаковое пространство совпадает с геометрическим пространством. 2. Взвешенное евклидово расстояние: . Данная мера различия объектов применяется в случаях, когда каждому l -му признаку удается приписать некоторый «вес» , пропорциональный степени важности признака при классификации, . 3. Обобщенное расстояние Махаланобиса:
,
где – векторы значений признаков, характеризующих объекты и ; Σ – ковариационная матрица генеральной совокупности, из которой извлечена выборка; Δ – некоторая симметричная неотрицательно-определенная матрица весовых коэффициентов признаков. Данную метрику рекомендуется использовать в случае гетероскедастичности и коррелированности исходных признаков. 4. Расстояние Минковского: , . Интересны несколько частных случаев, соответствующих различным значениям p: при метрика сводится к обычному евклидову расстоянию, при получают расстояние Чебышева, при – Хеммингово расстояние (манхэттенская метрика, расстояние city-block, метрика города) [26]. 5. Хеммингово расстояние часто применяется как мера различия объектов, задаваемых дихотомическими признаками: . 6. Расстояние Чебышева: . 7. Корреляционное расстояние: , где – выборочный коэффициент корреляции между объектами и . 8. Расстояние Канберра: . Если кластерный анализ применяется для решения задачи классификации признаков, то для измерения сходства i -го и j -го признаков используется мера близости , в качестве которой могут выступать различные коэффициенты связи: коэффициент корреляции, корреляционное отношение, ранговые коэффициенты корреляции и др.
|