![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Порядок выполнения работы. 1. Запустите программу STATISTICA V6.0 и загрузите файл c исходными данными, который использовался в лабораторной работе №1.
1. Запустите программу STATISTICA V6.0 и загрузите файл c исходными данными, который использовался в лабораторной работе №1.
Группировка данных 2. В основном меню выберите пункт Статистика (Statistics) и запустите модуль Основная статистика/Таблицы (Basic Statistics/Tables). Из стартовой панели модуля Основная статистика/Таблицы (Basic Statistics/Tables) выберите пункт Таблицы частот (Frequency Tables), как показано на рисунке 2.1:
Рисунок 2.1 – Экранная форма выбора пункта Таблицы частот
При этом появится окно вида, изображенного на рисунке 2.2:
Рисунок 2.2 – Экранная форма вкладки Таблицы частот
3. В окне Таблицы частот (Frequency Tables), щелкнув по кнопке Переменные (Variables), выберите переменную (или переменные) для анализа. Количество переменных задается преподавателем. 4. Изучите данные и выполните разбиение на группы для выбранной переменной. Разбиение на группы должно по возможности учитывать следующие принципы: ü количество групп (N) – не менее 16; ü количество наблюдений в группе не менее 5-7; ü интервалы группирования могут быть одинаковыми или задаваться, исходя из оптимальной компоновки групп. Перейдите на вкладку Дополнительно (Advanced). Здесь в меню Метод категоризации для таблиц и графиков (Categorization method for tables & graps) можно задать количество групп, на которые разбивается выборка. Это можно сделать одним из следующих способов:
1. Все различные значения x (All distinct values); 2. 3. Приближенное число интервалов(“Neat” of exact intervals); 4. Размер шага (Step size), h=(xmax-xmin)/N; 5. Целые категории (Integer categories); 6. Задание группирующих кодов (Specific grouping codes (values)); 7. Определенные пользователем категории (User-specified categories).
Учитывая требования п. 4, выберите метод категоризации для своих данных и задайте свои характеристики группирования данных. Рекомендуется пользоваться п.4. Для этого вначале рассчитывается значение шага h (см. рис. 2.3), по формуле выше (п. 4.4). В этой формуле значения xmax и xmin представляют собой максимальное и минимальное значение выбранной для анализа переменной, а N – количество регистров этой переменной. Однако, если количество групп, на которые разбивается выборка, в дальнейшем превышает значение 60, разрешается искусственно увеличить значение шага. В этом случае можно также воспользоваться другим методом категоризации (см. п. 2 и 3). В пунктах 2, 3 – можно задать точное или приближенное количество интервалов, исходя из общего диапазона изменения значений данных. Рисунок 2.3 – Экранная форма вкладки Таблицы частот
5. Перейдите на вкладку Опции (Options). В меню Опции отображения для таблиц частоты (Display Options for frequency tables) отметьте первые три опции – кумулятивные частоты (cumulative frequencies), проценты – относительные частоты (Percentages – relative frequencies), кумулятивные проценты (cumulative Percentages), как показано на рисунке 2.4.
Рисунок 2.4 – Экранная форма меню Опции отображения для таблиц частоты
6. В окне Таблицы частот (Frequency Tables) нажмите кнопку Расчет (Summary). В результате расчетов будет выведена таблица расчетных данных – диапазон группирования, частоты (Count), кумулятивные частоты (Cumul. Count), проценты – относительные частоты (Percent), кумулятивные проценты (Cumul. Percent). Сохраните таблицу для отчета.
Таблица 2.1. – Таблица расчетных данных
7. Визуализируйте таблицу, построив на ее базе гистограмму. Вернитесь в диалоговое окно Таблицы частот (Frequency Tables), перейдите на вкладку Дополнительно (Advanced) и нажмите кнопку Гистограммы (Histograms). Сохраните появившийся график для отчета (см. рис. 2.5). Рисунок 2.5 – Пример графика, построенного с использованием кнопку Гистограммы в диалоговое окне Таблицы частот
Проверка нормальности распределения данных. Метод 1. Проверка нормальности с помощью оценок коэффициентов ассиметрии и эксцесса. (Предварительно необходимо ознакомиться с [6] §9 стр. 137 и §8 стр. 250)
8. Создайте новый файл данных STATISTICA 6.0 с двумя столбцами и числом строк равным количеству групп, на которые была разбита выборка (см. п.4). В первом столбце запишите средние значения по каждому интервалу группирования выбранной переменной для анализа. Для этого предварительно рассчитайте эти значения, воспользовавшись известными значениями начала и конца каждого диапазона (см. п.6, таблица, первый столбец). Во второй столбец запишите частоты (количество наблюдений, попадающее в группу). Используйте для этого полученную ранее таблицу частот (см. п.6, таблица, второй столбец – Count). 9. Запустите модуль Основная статистика/Таблицы (Basic Statistics/Tables) и выберите в появившемся окне опцию Описательные статистики (Descriptive Statistics).
Рисунок 2.6 – Экранная форма вкладки Описательные статистики
10. В окне Описательные статистики (Descriptive Statistics) нажмите кнопку Переменные (Variables) и выберите первую переменную. Далее нажмите на кнопку Вес Рисунок 2.7 – Экранная форма выбора переменных
Кликните дважды по полю Weight variable. При этом откроется окно выбора переменных. Выберите в этом окне вторую переменную и нажмите кнопку ОК. Убедитесь, что поле Weight variable отражает имя второй переменной. Нажмите кнопку ОК. 11. Перейдите на вкладку Дополнительно (Advanced). Отметьте в появившемся окне ассиметрию и эксцесс, и их стандартные ошибки (4 последние строчки в поле Variation, moments). Все остальные отметки, которые устанавливаются автоматически, можно снять (см. рис. 2.8).
Рисунок 2.8 – Экранная форма вкладки Advanced 12. Нажмите кнопку Расчет (Summary) в окне Описательные статистики (Descriptive Statistics). 13. Система выполнит расчет и на экране появится таблица с результатами.
Таблица 2.2. – Таблица результатов расчета в окне Описательные статистики
Если ассиметрия и эксцесс близки к нулю и по абсолютной величине их значения имеют тот же порядок, что и их ошибки, тогда ассиметрия и эксцесс не значимы. Поэтому можно говорить, что данные согласованы с гипотезой о нормальности, если порядок иной (ассиметрия или эксцесс сильно отличаются от нуля), то тогда данные не согласованы с гипотезой. Однако, оценка на нормальность по ассиметрии и эксцессу не является точным методом, т.к. в программе STATISTICA 6.0 не реализованы количественные вероятностные оценки в этом случае.
Метод 2. Использование критерия Хи-квадрат для проверки нормальности. (Предварительно необходимо ознакомиться с [6] §23 стр. 329) 14. Для анализа используйте ту же переменную (или переменные), что и в предыдущем случае. Запустите модуль Настройка распределения (Distribution Fitting): Рисунок 2.9 – Экранная форма запуска модуля Настройка распределения При этом появится окно следующего вида:
Рисунок 2.10 – Экранная форма выбора вида распределения
15. Далее в списке Непрерывные распределения (Continuous Distribution) выберите Нормальное (Normal). Нажмите кнопку OK. 16. В появившемся окне Подгонка непрерывных распределений (Fitting Continuous Distribution) нажмите кнопку Переменные (Variable) и выберите название переменной из файла. Рисунок 2.11 – Экранная форма подгонки нормального распределения
17. В диалоговом окне Подгонка непрерывных распределений (Fitting Continuous Distribution) нажмите кнопку Расчет (Summary). В результате расчетов будет выведена таблица расчетных данных – наблюдаемые частоты (observed frequency), кумулятивные наблюдаемые частоты (cumulative observed), проценты – относительные частоты (Percent observed), кумулятивные проценты (Cumul. % observed), ожидаемая частота (Cumultv expected) и т.д. Сохраните таблицу для отчета.
Таблица 2.3. – Таблица результатов расчета частот
18. В верхней части таблицы приведено значение статистики Хи -квадрат и уровень значимости (вероятность ошибиться при отклонении гипотезы нормальности). Чем ближе значение Хи -квадрата к нулю, тем более правомерной считается гипотеза (см. [6] §23 стр. 329). Исходя из этого, сделайте оценку правомерности гипотезы H0: генеральная совокупность распределена нормально. 19. Для визуализации результатов в диалоговом окне Подгонка непрерывных распределений (Fitting Continuous Distribution) на вкладке Быстрые (Quick) нажмите кнопку Графики наблюдаемого и ожидаемого распределения (Plot of observed and expected distribution). На экране появится гистограмма с наложенным нормальным распределением. Сохраните график для отчета.
Рисунок 2.12 – Пример графика наблюдаемого и ожидаемого распределения Подгонка вероятностных распределений к реальным данным 20. На практике в случае, если переменная не подчиняется нормальному вероятностному распределению, изучают другие распределения, описанные в разделе Краткие теоретические сведения. В лабораторной работе следует в любом случае изучить соответствие нескольких вероятностных распределений реальным данным для приобретения навыков подгонки распределений к реальным данным. Запустите модуль Настройка распределений (Distribution fitting) (см. п. 14). В окне Непрерывные распределения (Continuous Distribution) выберите анализируемое распределение, например, равномерное (Rectangular) и нажмите кнопку ОК. Выберите переменную для анализа, нажав кнопку Переменные(Variables). Для анализа следует выбирать ту же переменную, что и в п. 16. Запустите программу на расчет и постройте таблицы и графики по аналогии с п.п.17-19. 21. В лабораторной работе следует кроме оценки данных на соответствие нормальному и равномерному распределению сделать также оценку по показательному и логнормальному распределению. Таблицы и графики используйте для написания отчета.
|