Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Нормальное распределение
Пусть из генеральной совокупности извлечена выборка, причем х 1наблюдалась n 1раз, х 2 – n 2, х 3 – n 3 раз, а S ni = n – объем выборки. Наблюдаемые значения хi – варианты, а последовательное написание их в возрастающем порядке – вариационный ряд. Числа наблюдений ni называются частотами, а их отношение к объёму выборки – относительными частотами. Перечень вариант и соответствующих им частот, или относительных частот называется статистическим распределением выборки или законом распределения случайной величины. Собственно законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Простейшей формой задания этого закона является таблица, в которой перечислены значения случайной величины и соответствующие им частоты, относительные частоты или вероятности. Такую таблицу называют рядом распределения (табл. 4.1). Таблица 4.1 Ряд распределения
Для наглядности строят различные графики распределения. В случае геометрического представления ряда распределения дискретных случайных величин получаем многоугольник распределения (рис. 4.1) или полигон частот.
х 1 х 2 х 3 х 4 х 5 х 6 Рис. 4.1. Многоугольник распределения
Для его построения на оси абсцисс откладывают варианты хi, а на оси ординат – соответствующие им относительные частоты wi, Точки
Рис. 4.2. Многоугольник дискретного распределения (а); кривая непрерывного распределения (б)
Если многоугольник распределения (кривая распределения) имеет более одного максимума, распределение называется «полимодальным». Иногда встречаются распределения, обладающие посередине не максимумом, а минимумом. Такие распределения называют «антимодальными» (рис. 4.3).
Рис. 4.3. Антимодальное распределение (а и б см. пояснения к рис. 4.2) Два последних термина см. в разд. 3, где кроме важнейших из характеристик положения – математического ожидания, упоминались и другие, в частности мода (рис. 4.4) и медиана (рис. 4.5).
Рис. 4.4. Мода случайной величиныРис. 4.5. Медиана распределения
Модой случайной величины называется ее наиболее вероятное значение. В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, когда распределение является симметричным и модальным (т. е. имеет моду) и существует математическое ожидание, то оно совпадает с модой и центром симметрии распределения. Часто применяемой еще одной характеристикой положения – медианой (рис. 4.5), пользуются обычно только для непрерывных случайных величин, хотя формально ее можно определить и для дискретной величины. Медианой случайной величины х называется такое число Me, для которого Р (Х < Ме) = Р (Х > Ме),
т. е. одинаково вероятно, окажется ли случайная величина меньше или больше Me. Геометрическая медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам. В случае симметричного модального распределения медиана совпадает с математическим ожиданием и модой. Распределение случайных величин является математической моделью вероятностного процесса, отличающегося тем, что элементарные исходы могут проявляться в самой разнообразной форме по численному значению и частоте. Математической модели может быть подобрана физическая модель, а для нее в свою очередь – математическая модель распределения. Итак, ряд распределения является законом распределения для дискретной (непрерывной) случайной величины. Простейшим примером дискретного распределения является ситуация с п равновероятностными исходами. Физической моделью такого распределения являются исходы бросания монеты, кубика и т. д. Но для непрерывной величины ряда не существует. В то же время различные области возможных значений случайной непрерывной величины не являются одинаково вероятными, поэтому и для непрерывной величины существует также распределение вероятностей. В случае непрерывного признака для геометрического представления целесообразно строить гистограмму (рис. 4.6).
Рис. 4.6. Гистограмма частот
Для этого весь интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частных интервалов длиной D х, находят для каждого частного интервала пi – сумму частот вариант, попавших в i -й интервал. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частные интервалы длиной D х, а высоты равны (плотность частоты). Площадь такого прямоугольника равна , а сумма площадей всех прямоугольников (площадь гистограммы) . В случае использования относительных частот или вероятностей площадь гистограммы будет равна единице. Вероятность непрерывного события х есть функция от х. Эта функция называется функцией распределения случайной величины х и обозначается F (x). Функцию распределения называют также интегральной функцией распределения или интегральным законом распределения величин . (4.1) Функция распределения непрерывной случайной величины F (х), определяющая вероятность того, что случайная величина х принимает какое-нибудь значение в пределах интервала а, b, определится как . Интегральная кривая этой функции (рис. 4.7) монотонно возрастает от нуля (при х = – ¥) до единицы (при х = ¥). Обратная функция дает значение х, соответствующее заданной вероятности непревышения Р (х). Эти значения называют квантилями вероятности Р (х).
Рис. 4.7. Интегральная функция распределения
Функция является производной функции распределения F (х)и характеризует плотность, с которой распределяются значения случайной величины. Эта функция называется плотностью распределения или плотностью вероятности. Иногда её называют функцией распределения, или дифференциальным законом распределения случайной величины. Плотность распределения является пределом отношения вероятности события, состоящего в том, что непрерывная случайная величина принимает значения, лежащие в заданном малом интервале, к длине интервала, когда эта длина стремится к нулю. Кривую, изображающую плотность распределения случайной величины на графике дифференциальной функции распределения (рис. 4.8), называют кривой распределения. Кривые распределения могут иметь чрезвычайно разнообразную форму. Рис. 4.8. Плотность распределения Часто наблюдаются кривые с вершинами, сдвинутыми вправо Отрицательная асимметрия свидетельствует о том, что преобладают варианты с большими значениями, а варианты с малыми значениями встречаются реже. Наоборот, положительная асимметрия свидетельствует о преобладании вариант с малыми значениями, но реже встречаются варианты с большими значениями. Показатель асимметрии вычисляют по формуле . (4.2) Также часто встречаются кривые с приподнятой вершиной (рис. 4.9, в). Такие кривые распределения называются кривыми распределения с положительным эксцессом. Положительный эксцесс свидетельствует о скоплении большинства вариант в середине ряда, что дает характерный резкий подъём кривой в центре. Более или менее равномерное распределение вариант или скопление их по краям придают кривой распределения плосковершинную, двух-, иногда многовершинную форму (рис. 4.9, г, д, е). Такие кривые называются кривыми распределения с отрицательным эксцессом. Показатель эксцесса вычисляют по формуле . (4.3) Симметричные кривые распределения, не имеющие ни положительного, ни отрицательного эксцесса, называются кривыми нормального распределения (рис. 4.9, ж). Дифференциальная кривая вместе с осью абсцисс ограничивает площадь, равную единице. Заштрихованная площадь, ограниченная ординатами, проходящими через точки ха и хb, определяет вероятность попадания в интервал между ха и хb (рис. 4.10). Функция распределения представляет собой некоторую абстрактную математическую модель, при помощи которой описывают случайные экспериментально наблюдаемые величины. Аналитические выражения функции распределения содержат в себе параметры распределения. Если известен закон распределения случайной величины, то она может быть полностью охарактеризована численными значениями закона её распределения.
Рис. 4.9. Кривые распределения: а – с отрицательной асимметрией; б – с положительной асимметрией; в – с положительным эксцессом; г, д – с отрицательным эксцессом; е – с отрицательным эффектом в высшей его форме; ж – кривая нормального распределения
Заштрихованная на рис. 4.10 площадь равна вероятности того, что случайная величина х заключена в пределах (а, b), т. е. . (4.4)
В большинстве случаев, когда имеет место большое количество измерений ( > 50) случайной величины , её распределение соответствует нормальному закону распределения, именуемому законом Гаусса. Его главной особенностью является то, что он является предельным законом, к которому приближаются другие законы распределения вероятности . (4.5) Графически нормальный закон представлен симметричной относительно ординаты колоколообразной кривой (рис. 4.11) с двумя точками перегиба при , асимптотически приближающейся к оси абсцисс. Рис. 4.11. График нормального распределения частот
Основная масса результатов измерений группируется около среднего значения . На участке оказывается 68, 3% всех измерений (68, 3 % – это доля площади, ограниченная кривой распределения и этим интервалом). В границах размещается 95, 4 % всех измерений, а в границах – 99, 7 %. Параметрами нормального распределения являются и . Среднее арифметическое (математическое ожидание) является центром рассеяния и определяет положение распределения на оси абсцисс, а параметр определяет форму кривой распределения. Наибольшая ордината кривой распределения обратно пропорциональна . Так как площадь, ограниченная кривой распределения и осью абсцисс, всегда равна 1, то при увеличении кривая становится плоской, и наоборот. В практических расчетах обычно используют нормированное распределение, которое получается при переходе от величины х к её функции . (4.6) Тогда функция примет вид или (4.7)
(4.8)
|