Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Второй подход
В случае неработоспособности первой главной компоненты и отсутствия обучения, к сожалению, не существует удовлетворительного решения задачи построения скалярного индикатора анализируемого интегрального свойства. Подобные ситуации возникают, когда в составе апостериорного набора частных критериев имеется определенное количество взаимно слабо коррелированных переменных, хотя каждая из них вносит существенный вклад в описание и интерпретацию анализируемого интегрального свойства. Тогда задача аппроксимации значений всех частных критериев по значению единственного скалярного индикатора может в принципе не иметь решения, хотя первая главная компонента и остается сравнительно наилучшим предиктором в данной аппроксимационной схеме. Поэтому приходится отказаться от попыток свести многокритериальную задачу к однокритериальной, а вместо этого попытаться предложить способ максимальной редукции размерности анализируемой многокритериальной схемы. Ниже представлен алгоритм решения данной задачи. 1. Построить главные компоненты по апостериорному набору унифицированных частных критериев . 2. Рассмотреть в качестве интегральных индикаторов анализируемых свойств первых главных компонент, где число определяется из условия:
. (6.23)
1. Провести многокритериальную Парето-классификацию объектов, выбирая в качестве критериев: 1. либо первые k главных компонент (если они поддаются содержательной интерпретации); 2. либо , , частных критериев апостериорного набора, наиболее тесно коррелированных с (если первых главных компонент не поддаются содержательной интерпретации). Процедура Парето-классификации последовательно выделяет из элементов множества В непересекающиеся «слои»: сначала слой В 1 наихудших с точки зрения анализируемого свойства объектов, затем слой В 2 объектов, наихудших среди оставшихся, и т.д., а именно: 1. слой В 1состоит их всех тех точек , для которых не существует ни одной точки такой, что неравенство выполнялось бы для всех координат, то есть при всех ; 2. слой В 2состоит их всех тех точек , для которых не существует ни одной точки такой, что неравенство выполнялось бы для всех координат, то есть при всех ; 3. и так далее до полного исчерпания точек исходного классифицируемого множества [13].
6.4 Построение интегрального показателя на основе модели множественного выбора
Построение интегрального показателя на основе моделей множественного выбора предусматривает предварительное разбиение исследуемых объектов на однородные группы , . Построение однородных групп можно осуществить методами кластерного анализа, с использованием нейросетевых технологий, а также методами неметрического шкалирования, позволяющими разделить все исследуемые объекты на классы, анализируя «карты» их расположения в теоретическом стимульном пространстве [14, 31, 32]. В работе [18] рассматриваются вопросы моделирования зависимости между порядковой результативной и количественными объясняющими переменными в виде:
, (6.24)
где – генеральная совокупность объектов; – некоторая неизвестная функция, задающая гперповерхность уровня , ; – значения, характеризующие принадлежность к однородной группе; – апостериорный набор унифицированных частных критериев. В нашем случае не имеет смысла говорить о функциональной зависимости между признаком y и количественными признаками , а следует изучать регрессионную зависимость:
, (6.25)
где – случайная величина с возможными значениями . Поскольку значения «y» не наблюдаются, то в практике исследования подобных зависимостей, получивших название моделей упорядоченного множественного выбора, сложился подход, в соответствие с которым объект наблюдения относится к той группе , , для которой принимает наибольшее значение. Так как функции , , не известны, то они аппроксимируются линейной по параметрам зависимостью от наблюдаемых характеристик. В итоге получим модель:
, , (6.26)
где – значение ненаблюдаемой латентной переменной для i -го объекта; – вектор-строка значений унифицированных частных критериев для i -го объекта; – апостериорное отклонение ненаблюдаемого значения латентной переменной , определяемое функцией , , от значения линейной функции для i -го объекта; – количество объектов наблюдения. При этом области отобразятся в интервалы с неизвестными (подлежащими оцениванию) границами [18]:
Тогда функция регрессии (6.19) аппроксимируется следующим образом:
(6.27)
где ; – априорные отклонения, соответствующие апостериорным и являющиеся независимыми одинаково распределенными случайными величинами с законом распределения . Модель регрессии (6.27) можно записать в виде:
. (6.28)
Конкретизируя вид функции распределения , получают различные варианты общей модели, например, если , то пробит-модель; если , то логит-модель [32]. Описание подходов к оцениванию коэффициентов модели (6.28) по сгруппированным данным подробно содержится в научной и научно-методической литературе [1, 2, 32]. В основе подходов лежит требование к объему и структуре исходных данных, состоящее в том, что выборка должна содержать достаточное количество групп объектов, каждая из которых должна быть большой по объему для получения приемлемой оценки вероятности. Поэтому на практике оценка коэффициентов моделей с качественными (порядковыми) результативными признаками производится методом максимального правдоподобия. Для оценки неизвестных параметров (вектора коэффициентов и , ) модели (6.28) строится логарифмическая функция правдоподобия в предположении независимости наблюдений:
, (6.29) где Оценка качества модели осуществляется также как и моделей множественного и бинарного выбора на основе предложенного Макфадденом индекса отношения правдоподобия LRI [32]:
, (6.30)
где – значение логарифма функции правдоподобия, – значение логарифма функции правдоподобия при , т.е. для тривиальной модели. Альтернативный способ построения мер качества состоит в вычислении прогноза и сравнения его с фактическими значениями. Проверка статистической значимости отдельных коэффициентов модели осуществляется на основе статистики Вальда [1, 32]. Рассмотрим моделирование латентного показателя, характеризующего миграционную привлекательность муниципальных образований Оренбургской области по набору показателей за 2013г.: – число зарегистрированных иностранных работников на 1000 человек населения; – средненоминальная заработная плата работников (руб.); – оборот розничной торговли на душу населения, (руб.); – число организаций по основным видам экономической деятельности, (ед.); – численность населения в трудоспособном возрасте (тыс. чел.); – уровень безработицы (%); – инвестиции в основной капитал на душу населения (руб.). Предварительно объекты наблюдения (муниципальные образования Оренбургской области) с помощью методов кластерного анализа были разбиты на три группы. Для моделирования латентного показателя, описывающего особенности миграции трудовых ресурсов, рассмотрена переменная, значения которой формируются экспертно на основе полученной классификации муниципальных образований:
В таблице 6.1 приведены оценки параметров пробит-модели, полученные методом максимального правдоподобия.
Таблица 6.1 – Результаты оценивания модели упорядоченного множественного выбора
Как видно из таблицы 6.1, коэффициенты регрессии являются статистически значимыми. На основе оцененной модели множественного упорядоченного выбора проведено ранжирование муниципальных образований Оренбургской области (таблица 6.2). Таблица 6.2 – Ранжирование муниципальных образований Оренбургской области по показателям, характеризующим миграционную ситуацию
Анализ результатов ранжирования муниципальных образований Оренбургской области по осредненному значению латентного показателя (столбец 5 таблицы 6.2) показал, что более высокий рейтинг определяет большую концентрацию трудовых мигрантов в териториях, к которым относятся г. Оренбург, г. Бузулук (Бузулукский район), г. Бугуруслан (Бугурусланский район), так как эти города и районы являются крупными промышленными и экономическими центрами. Ряд районов области (Новосергиевский, Сорочинский, Тюльганский) имеют средний рейтинг. Здесь сосредоточены предприятия по переработки продукции сельского хозяйства. Сравнительно низкие ранги имеют Тоцкий, Грачевский, Алексеевский районы. Эти районы наименее привлекательны для мигрантов. Следует отметить, что использование данного подхода требует экспертно оцененных значений .
|