КАТЕГОРИИ:

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Линейный дискриминантный анализ

Стр 1 из 2Следующая ⇒

Лабораторная работа № 10

I. Результаты наблюдений составляют два набора строк, всего строк в таблице. В каждой строке содержатся числовые значения переменных: первый набор и второй набор.

Зададим две матрицы:

Процедура линейного дискриминантного анализа заключается в нахождении такой линейной комбинации переменных , чтобы как можно лучше разделить два набора данных.

Линейная дискриминантная функция определяется выражением

(1)

Центры двух множеств (векторы средних) задаются формулами:

, ,

-среднее по значениям переменной для набора данных

Сумма квадратов отклонений от среднего является мерой вариации переменной.

Тогда внутригрупповой вариацией данных является величина:

где

Объединенной ковариационной матрицей называют

Межгрупповую вариацию можно записать в виде:

Один из методов поиска оптимальной дискриминантной функции заключается в максимизации отношения:

или ,

отличается от только числовым коэффициентом. Максимизация введенных величин означает максимизацию отношения межгрупповой вариации к внутригрупповой вариации.

Будем считать, что параметры выбираются из условия максимума отношения или . Вычислив производные по неизвестным параметрам и приравняв их к нулю, получим равенство, которому должны удовлетворять неизвестные параметры:

Подставив в , получим:

Величину называют обобщенным расстоянием или расстоянием Махалонобиса.

Константу можно выбрать произвольным образом, так как она входит в качестве множителя в дискриминантную функцию. Значение коэффициента не влияет на возможность дискриминации между группами. Коэффициент часто задают равным единице или выбирают так, чтобы

Для задания правила классификации необходимо выбрать пороговое значение , если цена ошибочной классификации одинакова для обеих групп и если вероятность принадлежности наблюдения к каждой из групп одинакова, то

Правило классификации:

отнести наблюдение к группе I, если

отнести наблюдение к группе II, если

12 Следующая ⇒

Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2026 год. (0.28 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал