![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Идентификация закона распределения случайной величины
Случайная величина. В инженерной практике необходимо исследовать не только детерминированные, но и стохастические процессы. Практически все процессы в технологических и технических объектах выполняются в непрерывно меняющихся непредвиденным образом условиях. В связи с этим приходится анализировать случайные величины в этих объектах. Под случайной величиной понимают величину, принимающую в результате испытания значение, которое принципиально нельзя предсказать исходя из условий опыта. Случайная величина обладает целым набором допустимых значений, но в результате каждого отдельного опыта принимает лишь какое-то одно из них. Она может принимать различные значения даже при неизменном комплексе основных факторов. Различают дискретные и непрерывные случайные величины. Возможные значения дискретных случайных величин можно заранее перечислить. Значения непрерывной случайной величины не могут быть заранее перечислены, они непрерывно заполняют некоторый промежуток. Чтобы полностью охарактеризовать случайную величину, необходимо не только указывать, какие значения она может принимать но и как часто. Законы распределения случайной величины. При решении многих прикладных задач необходимые вероятностные характеристики соответствующих случайных величин неизвестны исследователю и должны определяться по экспериментальным данным. Такое статистическое описание результатов наблюдений, построение и проверка различных математических моделей, использующих понятие вероятности, составляет основное содержание математической статистики. Фундаментальными понятиями статистической теории являются понятия вероятности и распределения вероятности случайной величины. Пусть дискретная случайная величина
Сумма вероятностей всех возможных значений случайной величины равна единице так как тот факт, что случайная величина примет в результате опыта одно из своих значений, есть достоверное событие. Эта суммарная вероятность распределена определенным образом между отдельными значениями. Дискретную случайную величину можно полностью задать вероятностным рядом, указав вероятность
Всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями, называется законом распределения. Вероятностный ряд является одним из видов законов распределения случайной величины. Распределение непрерывной случайной величины нельзя задавать при помощи вероятностей отдельных значений. Число значений так велико, что для большинства из них вероятность принять эти значения равна нулю, т.е. событие может произойти, а вероятность его равна нулю. Для непрерывных случайных величин изучается вероятность того, что в результате опыта значение случайной величины попадет в некоторую заданную область. Аналитическими выражениями законов распределения случайной величины являются функции распределения вероятностей - интегральная и дифференциальная. Интегральная функция распределения
Следовательно, вероятность того, что значение случайной величины
Аналогично,
Интегральная функция распределения случайной величины обладает следующими свойствами: 1) 2) 3) 4) В виде функции распределения можно задать распределение как непрерывной, так и дискретной случайной величины. Как видно из определения, Интегральная функция распределения дискретной случайной величины всегда есть разрывная ступенчатая функция, скачки которой происходят в точках, соответствующих возможным значениям случайной величины, и равны вероятностям этих значений. Сумма всех скачков равна единице. Возможные виды интегральных функций распределения изображены на рис. 2.12 для непрерывной (а) и дискретной (б) случайной величины: Рис 2.12. Если функция
Таким образом, значение функции Отметим основные свойства функции 1) 2) 3) 4) ( С помощью дифференциальной функции распределения вычисляется вероятность нахождения случайной величины в любой области из множества ее возможных значений. Например,
Для непрерывной случайной величины вероятность можно определить как относительную долю площади под кривой плотности распределения вероятностей Рис. 2.13. Теоретическое и эмпирическое распределение. Распределение вероятностей называется теоретическим. Оно может быть установлено для соответствующей случайной величины из анализа генеральной совокупности. Под генеральной совокупностью понимают все допустимые значения случайной величины. Содержательный смысл этого понятия состоит в том, что предполагается существование некоторых вполне определенных свойств, неслучайных закономерностей присущих данной совокупности, тех свойств, которые и должны быть выяснены исследователем. Фактически эти свойства являются объективным отображением вероятностных свойств изучаемого объекта, которые могут быть охарактеризованы с помощью соответствующих законов распределения вероятностей или связанных с ними числовых параметров. Считается, что указанные свойства не изменяются во времени и присущие генеральной совокупности неслучайные закономерности сохраняют постоянным свой характер, т.е. являются устойчивыми. На практике исследователь всегда располагает лишь ограниченным числом значений случайной величины, представляющим собой некоторую выборку из генеральной совокупности. Выборка это конечный набор значений случайной величины, полученный в результате наблюдений. Число элементов выборки называется ее объемом. Если, например, Выборка называется репрезентативной (представительной), если она достаточно полно характеризует генеральную совокупность. Для обеспечения репрезентативности выборки чаще всего используется случайный выбор элементов (рандомизация). При таком выборе предполагается, что каждая возможная выборка фиксированного объема имеет одну и ту же вероятность выбора, а последовательные наблюдения взаимно независимы. Смысл статистических методов заключается в том, что по выборке ограниченного объема При многократном извлечении выборок одного и того же объема и последующем нахождении множества оценок одного и того же параметра получаются различные числовые значения этих оценок, изменяющиеся от одной выборке к другой случайным образом. Иными словами любая оценка произвольного параметра Оценка Оценка Предположим, что в результате эксперимента получена выборка
Функция распределения Для каждой выборки эмпирическая функция распределения будет своей, но все эмпирические функции распределения одной и той же случайной величины будут иметь нечто общее, что является информацией о функции распределения этой случайной величины. Доказано, что с вероятностью 1 при
Практически это означает, что при достаточно большой выборке функцию распределения генеральной совокупности приблизительно можно заменить функцией распределения выборки. Эмпирическая функция распределения обладает следующими свойствами: 1) 2) 3) если График эмпирической функции распределения имеет вид, приведенный на рис. 2.12, б. Полигоном эмпирического распределения называют ломаную, отрезки которой соединяют точки При обработке выборок больших объемов весь отрезок, в котором заключены все наблюдаемые значения случайной величины Гистограммой эмпирического распределения называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат интервалы длины Если учитываются не абсолютные частоты На рис 2.14 приведен возможный вид гистограммы эмпирического распределения случайной величины. Рис. 2.14 Числовые характеристики случайной величины. Интегральная и дифференциальная функции распределения являются исчерпывающими вероятностными характеристиками случайной величины. Однако в прикладных задачах некоторые основные свойства случайных величин могут быть определены более просто с помощью определенных числовых параметров. Наибольшую роль среди них на практике играют два параметра, характеризующие центр рассеяния (центр распределения) случайной величины и степень ее рассеяния вокруг этого центра. Наиболее распространенной характеристикой центра распределения является математическое ожидание Для дискретных случайных величин
где
Для непрерывных случайных величин математическое ожидание выражается интегралом:
Степень рассеяния случайной величины
Для дискретной случайной величины
для непрерывной
Дисперсия Если Квадратный корень из дисперсии
Определение оценок математического ожидания
Отметим, что множитель Оценка результатов наблюдений случайной величины. Рассмотрим некоторые методы статистических оценок. Важнейшая задача математической статистики, решение которой позволило бы, в принципе, решить и все остальные задачи - это нахождение функции распределения наблюдаемой случайной величины. Пусть имеется экспериментальная выборка большого объема Решение поставленной задачи включает следующие этапы: 1) построение эмпирической кривой (гистограммы) распределения случайной величины по заданной выборке и выбор типа теоретического распределения (выдвижение рабочей гипотезы); 2) определение параметров теоретического распределения; 3) проверка адекватности теоретического распределения (подтверждение рабочей гипотезы); 4) уточнение теоретического закона распределения, если первоначальная рабочая гипотеза отвергается. Построение эмпирической кривой (гистограммы) распределения. Гистограмма При обработке выборок больших объемов используют метод " сгруппированных данных". Выборка объема
где найденное значение округляют до ближайшего целого числа. Длина интервала
Подсчитывают число элементов выборки
определяет относительную частоту попадания случайной величины в Середина
Полученный статистический ряд можно записывать в виде табл. 2.2. Таблица 2.2. Статистический ряд
По данным табл. 2.2. строят гистограмму эмпирического распределения, представляющую собой ступенчатую кривую, значение которой на Кривую эмпирического распределения можно аппроксимировать различной теоретической кривой распределения - законом Пуассона, Вейбула, биномиальным, показательным, логарифмическим, нормальным и др. По виду гистограммы предполагают, что случайная величина Определение параметров теоретического распределения. Окончательное уточнение неизвестной функции распределения сводится к определению некоторых числовых параметров распределения. По выборке могут быть рассчитаны выборочные статистические характеристики (выборочное среднее, дисперсия и т.д.), которые являются оценками соответствующих генеральных параметров. Оценки, получаемые по выборке, сами являются случайными величинами. К оценке обычно предъявляются требования состоятельности и несмещенности. Для получения оценок используют различные методы. Широко применяется метод максимального правдоподобия. Оценки, получаемые при помощи этого метода отвечают изложенным требованиям. Сущность метода максимального правдоподобия заключается в нахождении таких оценок неизвестных параметров, для которых функция правдоподобия при случайной выборке объема Функция
называется функцией правдоподобия, где В качестве оценки для
из которого определяют искомое значение Достаточным условием максимума является выполнение неравенства
В общем случае требуется оценить одновременно несколько параметров распределения. В этом случае формулировка принципа максимального правдоподобия сохраняется: надо найти такую совокупность допустимых значений параметров
в максимум. Необходимое условие экстремума
а неотрицательная определенность матрицы
в стационарной точке является достаточным условием того, чтобы этот локальный экстремум был максимумом функции правдоподобия. Из системы уравнений (5.152) находят оценки Найдем методом максимального правдоподобия оценку для параметра
по выборке Для этого распределения функция правдоподобия имеет вид
где Пусть распределение случайной величины
где Функция правдоподобия
Необходимые условия экстремума
Упуская промежуточные математические операции, из системы (2.159) находим:
Оценка
Уменьшение знаменателя в (5.162) на единицу непосредственно связано с тем, что величина
называется числом степеней свободы выборки. В практических вычислениях для дисперсии
легко вытекающая из формулы (5.162). Преимущество формулы (5.164) в том, что в ней нет операций вычитания близких чисел, как в формуле (5.162), что приводит к потере точности. Как правило, число наблюдений
Проверка адекватности теоретического распределения. Проверку рабочей гипотезы о законе распределения случайной величины по выборке проводят при помощи критериев согласия. Критерием согласия называется критерий гипотезы о том, что генеральная совокупность имеет распределение предполагаемого типа (например, нормальное распределение).Критерии согласия позволяют определить вероятность того, что при гипотетическом законе распределения наблюдающееся в рассматриваемой выборке отклонение вызывается случайными причинами, а не ошибкой в гипотезе. Если эта вероятность велика, то отклонение от гипотетического закона распределения следует признать случайным и считать, что гипотеза о предполагаемом законе распределения не опровергается. Вероятностный характер критериев не позволяет однозначно принять или опровергнуть проверяемую гипотезу. Критерий позволяет утверждать, что гипотеза не противоречит опытным данным, если вероятность наблюдаемого отклонения от гипотетического закона велика, или что гипотеза не согласуется с опытными данными, если эта вероятность мала. Среди различных критериев согласия наиболее употребителен универсальный критерий согласия Проверку гипотезы о виде функции распределения с помощью этого критерия производят следующим образом: 1. По выборке строят гистограмму. Если в каком -либо Пусть
2. Задаются видом гипотетической функции распределения и для каждого из параметров 3. Определяют теоретическую вероятность
где
В случае нормального закона распределения
Этот интеграл можно вычислить с помощью таблицы значений функции Лапласа
Функция Лапласа 4. Вычисляют значение
Известно, что для данного критерия согласия случайная величина
где 5. Задавшись уровнем значимости 6. Сравнивают значения После того, как определен закон распределения случайной величины, можно говорить о том, что имеется модель изменения этой величины.
|