Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Статистический анализ результатов имитации






 

Как уже отмечалось, в анализе стохастических процессов большое значение имеют статистические взаимосвязи между случайными величинами. В предыдущем примере для установления степени взаимосвязи ключевых и расчетных показателей мы использовали графический анализ. В качестве количественных характеристик подобных взаимосвязей в статистике используют два показателя: ковариацию и корреляцию.

Ковариация и корреляция. Ковариация выражает степень статистической зависимости между двумя множествами данных.Коэффициент ковариации случайных величин X, Y, обозначаемый иногда как cov (X, Y), есть математическое ожидание произведения отклонений каждой из этих величин от своего математического ожидания:

bXY = cov (X, Y) = M [(XMX)(YMY)]

Для вычисления коэффициента ковариации надо знать закон распределения двумерной случайной величины (X, Y). Тогда для непрерывных величин:

,

а для дискретных величин

В последней формуле суммирование ведется по всем t значениям, которые принимает величина X и всем q значениям, которые принимает величина Y.

 

Положительная ковариация наблюдается в том случае, когда большим значениям случайной величины Х соответствуют большие значения случайной величины Y, т.е. между ними существует тесная прямая взаимосвязь. Соответственно отрицательная ковариация будет иметь место при соответствии малым значениям случайной величины Х больших значений случайной величины Y. При слабо выраженной зависимости значение показателя ковариации близко к 0. Ковариация зависит от единиц измерения исследуемых величин, что ограничивает ее применение на практике. Более удобным для использования в анализе является производный от нее показатель — коэффициент корреляции r, вычисляемый по формуле

.

Коэффициент корреляции обладает теми же свойствами, что и ковариация, однако является безразмерной величиной и принимает значения от –1 (характеризует линейную обратную взаимосвязь) до +1 (характеризует линейную прямую взаимосвязь). Для независимых случайных величин значение коэффициента корреляции близко к 0.

Определение количественных характеристик для оценки тесноты взаимосвязи между случайными величинами в EXCEL может быть осуществлено двумя способами:

1) с помощью статистических функций КОВАР() и КОРРЕЛ();

2) с помощью специальных инструментов статистического анализа.

Если число исследуемых переменных больше 2, более удобным является использование инструментов анализа.

Инструмент анализа данных «Корреляция». Определим степень тесноты взаимосвязей между переменными V, Q, P, NCF и NPV. При этом в качестве меры будем использовать коэффициент корреляции r.

1. Выберите в главном меню тему «Сервис» пункт «Анализ данных». Результатом выполнения этих действий будет появление диалогового окна «Анализ данных», содержащего список инструментов анализа.

2. Выберите из списка «Инструменты анализа» пункт «Корреляция» и нажмите кнопку «ОК» (рис. 22). Результатом будет появление окна диалога инструмента «Корреляция».

3. Заполните поля диалогового окна, как показано на рис. 23 и нажмите кнопку «ОК».

Вид полученной таблицы после выполнения элементарных операций форматирования приведен на рис. 24.

 

Рис. 22 — Список инструментов анализа (выбор пункта «Корреляция»)

 

Рис. 23 — Заполнение окна диалога инструмента «Корреляция»

Рис. 24 — Результаты корреляционного анализа

Результаты корреляционного анализа представлены в виде квадратной матрицы, заполненной только наполовину, поскольку значение коэффициента корреляции между двумя случайными величинами не зависит от порядка их обработки. Нетрудно заметить, что эта матрица симметрична относительно главной диагонали, элементы которой равны 1, так как каждая переменная коррелирует сама с собой.

Как следует из результатов корреляционного анализа, выдвинутая в процессе решения предыдущего примера гипотеза о независимости распределений ключевых переменных V, Q, P в целом подтвердилась. Значения коэффициентов корреляции между переменными расходами V, количеством Q и ценой Р (ячейки В3.В4, С4) близки к 0.

В свою очередь величина показателя NPV напрямую зависит от величины потока платежей (r =1). Кроме того, существует корреляционная зависимость средней степени между Q и NPV (r =0, 548), P и NPV (r =0, 67). Как и следовало ожидать, между величинами V и NPV существует умеренная обратная корреляционная зависимость (r =–0, 39).

 

Полезность проведения последующего статистического анализа результатов имитационного эксперимента заключается также в том, что во многих случаях он позволяет выявить некорректности в исходных данных, либо даже ошибки в постановке задачи. В частности в рассматриваемом примере, отсутствие взаимосвязи между переменными затратами V и объемами выпуска продукта Q требует дополнительных объяснений, так как с увеличением последнего, величина V также должна расти. Таким образом, установленный диапазон изменений переменных затрат V нуждается в дополнительной проверке и, возможно, корректировке.

Близкие к нулевым значения r указывают на отсутствие линейной связи между исследуемыми переменными, но не исключают возможности нелинейной зависимости. Кроме того, высокая корреляция не обязательно всегда означает наличие причинной связи, так как две исследуемые переменные могут зависеть от значений третьей.

При проведении имитационного эксперимента и последующего вероятностного анализа полученных результатов мы исходили из предположения о нормальном распределении исходных и выходных показателей. Вместе с тем, справедливость сделанных допущений, по крайней мере, для выходного показателя NPV, нуждается в проверке.

Для проверки гипотезы о нормальном распределении случайной величины применяются специальные статистические критерии: Колмогорова-Смирнова, w2, c2. В целом EXCEL позволяет быстро и эффективно осуществить расчет требуемого критерия и провести статистическую оценку гипотез.

Однако в простейшем случае для этих целей можно использовать такие характеристики распределения, как асимметрия (скос) и эксцесс. Напомним, что для нормального распределения эти характеристики должны быть равны 0. На практике близкими к нулевым значениями можно пренебречь. Для вычисления коэффициента асимметрии и эксцесса в EXCEL реализованы специальные статистические функции — СКОС() и ЭКСЦЕСС().

Мы же будем использовать возникшую проблему как повод для знакомства с еще одним полезным инструментом анализа данных EXCEL — «Описательная статистика».

Инструмент анализа данных «Описательная статистика». Чем больше характеристик распределения случайной величины нам известно, тем точнее мы можем судить об описываемых ею процессов. Инструмент «Описательная статистика» автоматически вычисляет наиболее широко используемые в практическом анализе характеристики распределений. При этом значения могут быть определены сразу для нескольких исследуемых переменных.

Определим параметры описательной статистики для переменных V, Q, P, NCF, NPV. Для этого необходимо выполнить следующие шаги.

1. Выберите в главном меню тему «Сервис» пункт «Анализ данных». Результатом выполнения этих действий будет появление диалогового окна «Анализ данных», содержащего список инструментов анализа.

2. Выберите из списка «Инструменты анализа» пункт «Описательная статистика» и нажмите кнопку «ОК». Результатом будет появление окна диалога инструмента «Описательная статистика».

3. Заполните поля диалогового окна, как показано на рис. 25 и нажмите кнопку «ОК».

Результатом выполнения указанных действий будет формирование отдельного листа, содержащего вычисленные характеристики описательной статистики для исследуемых переменных. Выполнив операции форматирования, можно привести полученную таблицу к более наглядному виду (рис. 26).

Рис. 25 — Заполнение полей диалогового окна «Описательная статистика»

Рис. 26 — Описательная статистика для исследуемых переменных

 

Многие из приведенных в данной таблице характеристик хорошо знакомы, а их значения уже определены с помощью соответствующих функций на листе «Результаты анализа». Поэтому рассмотрим лишь те из них, которые не упоминались ранее.

Вторая строка таблицы содержит значения стандартных ошибок e для средних величин распределений. Другими словами среднее или ожидаемое значение случайной величины определено с погрешностью± e.

Медиана — это значение случайной величины, которое делит площадь, ограниченную кривой распределения, пополам (т.е. середина численного ряда или интервала). Как и математическое ожидание, медиана является одной из характеристик центра распределения случайной величины. В симметричных распределениях значение медианы должно быть равным или достаточно близким к математическому ожиданию.

Как следует из полученных результатов, данное условие соблюдается для исходных переменных V, Q, P (значения медиан лежат в диапазоне М ± e, т.е. практически совпадают со средними). Однако для результатных переменных NCF, NPV значения медиан лежат ниже средних, что наводит на мысль о правосторонней асимметричности их распределений.

Мода — наиболее вероятное значение случайной величины (наиболее часто встречающееся значение в интервале данных). Для симметричных распределений мода равна математическому ожиданию. Иногда мода может отсутствовать. В данном случае EXCEL вернул сообщение об ошибке. Таким образом, вычисление моды не представляется возможным.

Эксцесс характеризует остроконечность (положительное значение) или пологость (отрицательное значение) распределения по сравнению с нормальной кривой. Теоретически, эксцесс нормального распределения должен быть равен 0. Однако на практике для генеральных совокупностей больших объемов его малыми значениями можно пренебречь.

В рассматриваемом примере примерно одинаковый положительный эксцесс наблюдается у распределений переменных Q, NCF, NPV. Таким образом, графики этих распределений будут чуть остроконечнее, по сравнению с нормальной кривой. Соответственно графики распределений для переменных V и Р будут чуть более пологими, по отношению к нормальному.

Асимметричность (коэффициент асимметрии или скоса — s) характеризует смещение распределения относительно математического ожидания. При положительном значении коэффициента распределение скошено вправо, т.е. его более длинная часть лежит правее центра (математического ожидания) и обратно. Для нормального распределения коэффициент асимметрии равен 0. На практике, его малыми значениями можно пренебречь.

В частности асимметрию распределений переменных V, Q, P в данном случае можно считать несущественной, чего нельзя, однако сказать о распределении величины NPV.

Осуществим оценку значимости коэффициента асимметрии для распределения NPV. Наиболее простым способом получения такой оценки является определение стандартной (средней квадратической) ошибки асимметрии, рассчитываемой по формуле

,

где n — число значений случайной величины (в данном случае — 500).

Если отношение коэффициента асимметрии s к величине ошибки s as меньше трех (т.е. < 3), то асимметрия считается несущественной, а ее наличие объясняется воздействием случайных факторов. В противном случае асимметрия статистически значима и факт ее наличия требует дополнительной интерпретации. Осуществим оценку значимости коэффициента асимметрии для рассматриваемого примера.

Введите в любую ячейку ЭТ формулу: «= 0, 763 / КОРЕНЬ(6*499 / 501*503)» (Результат: 7, 06).

Поскольку отношение > 3, асимметрию следует считать существенной. Таким образом, наше первоначальное предположение о правосторонней скошенности распределения NPV подтвердилась.

Для рассматриваемого примера наличие правосторонней асимметрии может считаться положительным моментом, так как это означает, что большая часть распределения лежит выше математического ожидания, т.е. большие значения NPV являются более вероятными.

Аналогичным способом можно осуществить проверку значимости величины эксцесса — е. Формула для расчета стандартной ошибки эксцесса имеет следующий вид:

,

где n — число значений случайной величины.

Если отношение < 3, эксцесс считается незначительным и его величиной можно пренебречь.

Можно включить проверку значимости показателей асимметрии и эксцесса в разработанный шаблон, задав соответствующие формулы в листе «Результаты анализа». Для удобства предварительно следует определить собственное имя для ячейки В10 листа «Имитация», например — «Кол_знач». Тогда формула проверки значимости коэффициента асимметрии для распределения NPV может быть задана следующим образом:

«=СКОС(ЧСС)/КОРЕНЬ(6*(Кол_знач -1))/((Кол_знач+1)*(Кол_знач+ 3))».

Для вычисления коэффициента асимметрии в этой формуле использована статистическая функция СКОС(). Формула для проверки значимости показателя эксцесса задается аналогичным образом. Числителем этой формулы будет функция ЭКСЦЕСС(), а знаменателем соотношение (7), реализованное средствами EXCEL.

Оставшиеся показатели описательной статистики (рис. 26) представляют меньший интерес. Величина «Интервал» определяется как разность между максимальным и минимальным значением случайной величины (численного ряда). Параметры «Счет» и «Сумма» представляют собой число значений в заданном интервале и их сумму соответственно.

Последняя характеристика «Уровень надежности» показывает величину доверительного интервала для математического ожидания согласно заданному уровню надежности или доверия.По умолчанию уровень надежности принят равным 95 %.

Для рассматриваемого примера это означает, что с вероятностью 0, 95 (95%) величина математического ожидания NPV попадет в интервал 3412, 14 ± 224, 88.

Вы можете указать другой уровень надежности, например — 98%, путем ввода соответствующего значения в поле «Уровень надежности» диалогового окна «Описательная статистика». Следует отметить, что чем выше принятый уровень надежности, тем больше будет величина доверительного интервала для среднего.

Расчет доверительного интервала для среднего значения можно также осуществить с помощью специальной статистической функции ДОВЕРИТ().

Дополнение «Анализ данных» содержит целый ряд других полезных инструментов, позволяющих быстро и эффективно осуществить требуемый вид обработки данных. Вместе с тем, большинство из них требует осмысленного применения и соответствующей подготовки пользователя в области математической статистики.

В заключении отметим, что имитационное моделирование позволяет учесть максимально возможное число факторов внешней среды для поддержки принятия управленческих решений и является наиболее мощным средством анализа инвестиционных рисков. Необходимость его применения в отечественной финансовой практике обусловлена особенностями российского рынка, характеризующегося субъективизмом, зависимостью от внеэкономических факторов и высокой степенью неопределенности.

Результаты имитации могут быть дополнены вероятностным и статистическим анализом и в целом обеспечивают менеджера наиболее полной информацией о степени влияния ключевых факторов на ожидаемые результаты и возможных сценариях развития событий.

К недостаткам рассмотренного подхода следует отнести:

- трудность понимания и восприятия менеджерами имитационных моделей, учитывающих большое число внешних и внутренних факторов, вследствие их математической сложности и объемности;

- при разработке реальных моделей может возникнуть необходимость привлечения специалистов или научных консультантов со стороны;

- относительную неточность полученных результатов, по сравнению с другими методами численного анализа и др.

 



Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.011 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал