![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Корреляционный анализ. Метод наименьших квадратов
В исследовательской практике часто требуется установить и оценить зависимость одной случайной величины Y от одной или нескольких других величин. Такие зависимости могут быть функциональными или статистическими. Зависимость является функциональной в том случае, когда каждой отдельной величине соответствует строго определенная другая величина, например, каждому радиусу окружности соответствует строго определенная площадь круга. Вообще же строго функциональные зависимости между двумя величинами встречаются крайне редко, так как обе величины подвержены действию случайных факторов и среди них могут быть общие для обеих величин. В этом случае возникает статистическая зависимость. Статистической (корреляционной) называют такую зависимость, при которой изменение одной из величин влечёт изменение распределения другой, и в частности при изменении одной величины изменяется среднее значение другой. Корреляционная зависимость может быть парной или множественной, положительной или отрицательной, прямолинейной или криволинейной. Под прямой, или положительной корреляцией подразумевают такую корреляцию, когда с увеличением одного свойства средние значения другого свойства неуклонно возрастают. Например, при повышении плотности древесины (кг/м3) предел прочности при сжатии вдоль волокон (МПа) в среднем возрастает. При обратной, или отрицательной, корреляцией с увеличением одного свойства средние значения другого свойства непрерывно убывают. Например, при добавлении в бетон воды прочностные характеристики бетона ухудшаются. Если связь между факторами (плотностью древесины; количеством воды) и откликами (прочностью древесины и бетона соответственно) существует, то она проявляется в эксперименте в неявном виде, а для использования результатов эксперимента в практических целях неявную зависимость следует сделать явной и представить ее в виде функции, системы уравнений, номограммы, графика и т. д. Если зависимости между факторами и откликами не существует, то следует обработать их независимо друг от друга по правилам математической статистики. Наиболее простым способом первичного определения связи между двумя свойствами является способ графического изображения результатов наблюдений (рис. 5.1)
Рис. 5.1. Зависимость между плотностью и пределом
Для этого строится поле корреляции или диаграмма разброса из которой часто удается визуально определить вид зависимости и определить соответствующую ей функциональную зависимость (рис. 5.2). Задачу подбора вида функции, лучшим образом соответствующей кривой, называют подгонкой кривых по точкам. При этом необходимо определить количественный принцип соответствия теоретической функции экспериментальным точкам. Мерой такого соответствия логично принять минимальные отклонения по всем точкам или сумму всех Так как эти отклонения могут быть положительными и отрицательными, то математически проще предварительно возвести их в квадрат и обеспечить минимум для суммы квадратов отклонений. Этот метод, названный методом наименьших квадратов, соответствует критерию наилучшего приближения.
![]() ![]() Рис. 5.2. Диаграммы разброса
Поиск математических зависимостей между переменными более сложен и на этом этапе обычно используют методы регрессионного и корреляционного анализов. Регрессионный анализ дает возможность вывести уравнение, а корреляционный – установить, насколько хорошо экспериментально полученные точки согласуются с выбранным уравнением и насколько тесна связь между двумя и более величинами, наблюдаемыми и фиксируемыми при моделировании. Математический метод, обеспечивающий такую подгонку выбранной кривой, при которой экспериментальные точки описывают ее наилучшим образом в смысле критерия наименьших квадратов, называют регрессионным анализом. Он широко используется при планированном эксперименте. Однако, наилучшее приближение теоретической кривой к экспериментальным результатам еще не означает ее соответствия физической сущности явления (рис. 5.3).
Корреляционная зависимость Y от X – это Yx = f (x). (5.11) Это уравнение называют уравнением регрессии Y на X, функцию При парной линейной корреляции между двумя величинами х и у теоретическое уравнение, описывающее эту связь, выглядит так
Угловой коэффициент прямой линии регрессии Y на X называют выборочным коэффициентом регрессии Y на X и обозначают r ух; он является оценкой коэффициента регрессии. Уравнение (5.12) хорошо опишет экспериментальный материал в том случае, если сумма квадратов отклонений экспериментальных величин уi, от расчетных значений Рис. 5.4. Отклонение фактических уровней от выровненных
Это и есть основной принцип метода наименьших квадратов, на котором основан расчет уравнения и определение коэффициентов а и r ух (b)
Для отыскания минимума приравняем нулю соответствующие частные производные
Выполнив преобразования, получим систему уравнений относительно а и b откуда
Пример 5.4. Найти выборочное уравнение регрессии
Составим расчетную таблицу (табл. 5.4). Таблица 5.4 Расчетная таблица
Искомое уравнение регрессии будет иметь вид
Достоверность коэффициента определяют из условий нормального распределения или распределения Стьюдента–Фишера:
Для независимых случайных величин коэффициент корреляции Для расчетов часто пользуются такой модификацией формулы коэффициента корреляции:
Пример 5.5. Определим зависимость прочности строительного раствора Таблица 5.5 Исходные данные
Расположение точек на поле корреляции подсказывает линейную зависимость прочности раствора от расхода цемента (рис. 5.5). В качестве исходной математической модели рассматривается линейная зависимость
Упростим формулу и приравняем
Рис. 5.5. Зависимость прочности раствора от расхода цемента
Достоверность коэффициента корреляции определяют из условия распределения Стьюдента–Фишера
при вероятности Р = 0, 95 величина
|