Федеральное агентство по образованию
Государственное образовательное учреждение высшего профессионального образования
«ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ УПРАВЛЕНИЯ»
Институт информационных систем управления
Кафедра прикладной математики
РАБОТА №2
По дисциплине
«Математическая статистика»
Тема работы :
«Дисперсионный анализ»
Выполнил: студент группы ПМиИ2-1 Вельможина И.Р.
Проверил: Калинина В.Н.
Москва – 2012
РАБОТА 2. Дисперсионный анализ.
i) Однофакторный дисперсионный анализ (выполняется с применением программы «Однофакторный дисперсионный анализ» надстройки «Анализ данных» пакета Microsoft Excel).
Задача. Сведения о количестве голосов Y, отданных за кандидата в трех однотипных случайно выбранных избирательных округах, в которых использовались разные виды агитации ( — личные встречи кандидата с избирателями, — раздача листовок с программой кандидата, — выступление кандидата по телевидению), приведены для каждого варианта в прил. 2, а. Требуется:
1. Записать детерминированную модель дисперсионного анализа количества голосов, поданных за кандидата в избирательном округе, и предъявляемые к ней требования. На 5%-ном уровне значимости проверить
гипотезу о равенстве групповых генеральных дисперсий количества голосов, используя критерий Бартлетта.
2. Построить дисперсионную таблицу; на 5%-ном уровне значимости проверить гипотезу об отсутствии влияния видов агитации на количество голосов, поданных за кандидата.
3. В случае, если эта гипотеза отвергается:
а) оценить влияние видов агитации на количество голосов, используя коэффициент детерминации;
б) на 5%-ном уровне значимости провести попарное сравнение влияния видов агитации.
4. Оценить параметры модели.
ii) Двухфакторный дисперсионный анализ (выполняется с применением
программы «Двухфакторный дисперсионный анализ с повторениями» надстройки «Анализ данных» пакета Microsoft Excel).
Задача. При исследовании зависимости средней оценки Y по математической статистике в группе от метода обучения ( — традиционный классический, — компьютерный, — комбинированный), будущей специальности ( — «Менеджмент организации», — «Социология») и их взаимодействия было выделено случайным образом 18 групп, которые приписывались в равных количествах шести комбинациям методов и специальностей. Знания оценивались тестом, состоящим из 120 вопросов. Сведения о среднем числе правильных ответов в группах приведены для каждого варианта в прил. 2, б. Требуется:
1. Записать детерминированную модель двухфакторного дисперсионного анализа (с повторениями) средней оценки по математической статистике в группе и предъявляемые к модели требования; проверить гипотезу о равенстве групповых генеральных дисперсий.
2. Построить дисперсионную таблицу; на 5%-ном уровне значимости проверить гипотезы об отсутствии влияния на среднюю оценку: метода обучения; будущей специальности; взаимодействия метода обучения и будущей специальности.
3. При отклонении каких-либо из перечисленных гипотез рассчитать соответствующий коэффициент детерминации.
4. Оценить параметры модели.
Однофакторный дисперсионный анализ .
Сведения о количестве голосов Y, отданных за кандидата в трех однотипных случайно выбранных избирательных округах, в которых использовались разные виды агитации ( — личные встречи кандидата с избирателями, — раздача листовок с программой кандидата, — выступление кандидата по телевидению), приведены в табл. 1.
Исходные данные для однофакторного дисперсионного анализа
Вариант №4
-
Номер избирательного участка
1
63
65
79
2
63
68
79
3
64
69
80
4
72
79
88
5
73
87
6
87
Таблица 1
Пункт 1 . Детерминированная модель однофакторного дисперсионного анализа количества голосов ,поданных за кандидата в избирательном округе имеет следующий вид :
К этой модели предъявляются следующе требования :
Все случайные величины
;
В однофакторном дисперсионном анализе проверяют гипотезу ,
.
Рис. 1 Числовые данные для программы « Однофакторный дисперсионный анализ»
|
|
|
63 |
65 |
79 |
63 |
68 |
79 |
64 |
69 |
80 |
72 |
79 |
88 |
73 |
|
87 |
|
|
87 |
Рис.2. Результаты работы программы «Однофакторный дисперсионный анализ»
Однофакторный дисперсионный анализ |
|
|
|
|
|
|
|
|
|
|
|
|
|
ИТОГИ |
|
|
|
|
|
|
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
|
|
|
5 |
335 |
67 |
25,5 |
|
|
|
4 |
281 |
70,25 |
36,91666667 |
|
|
|
6 |
500 |
83,33333333 |
19,46666667 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
Между группами |
821,5166667 |
2 |
410,7583333 |
15,89604945 |
0,000423363 |
3,885293835 |
Внутри групп |
310,0833333 |
12 |
25,84027778 |
|
|
|
|
|
|
|
|
|
|
Итого |
1131,6 |
14 |
|
|
|
|
Проверим на 5%-ном уровне значимости гипотезу о равенстве групповых генеральных дисперсий количества голосов ,предположив нормальность распределения случайных величин и их независимость . Для этого применим критерий Барлетта .
Рассчитано программой :
«Счет» - число наблюдений на каждом уровне .
«Сумма» - сумма значений для каждого уровня ( ) .
«Среднее» - несмещенные оценки групповых средних .
«Дисперсия» -групповые дисперсии для каждого уровня ( .
Для расчета числового значения статистики Барлетта
, где =3 – число уровней фактора ,
Где числовое значение статистики Барлетта будет равно
Статистика Барлета в предположении справедливости гипотезы о равенстве групповых генеральных дисперсий имеет распределение , близкое к . При критическая точка . Поскольку , то есть , нет оснований отвергнуть проверяемую гипотезу .
Пункт 2 . Таблица «Дисперсионный анализ» , полученная в результате работы программы , представляет собой дисперсионную таблицу . Расшифруем ее отдельные ячейки в Табл.2. В этой таблице , .
Источник вариации результативного признака Y |
Показатель вариации |
Число степеней свободы ( ) |
Оценка дисперсии , ( ) |
|
-значение |
|
Фактор А |
821,5166 |
|
=410,75 |
15,89 |
0,000423363 |
3,885293835 |
Остаточные факторы |
310,083 |
|
|
|
||
Общая вариация |
1131,6 |
|
|
|
|
|
Проверка гипотезы = производится на основе анализа статистики , имеющей ( в предположении справедливости ) распределение Фишера-Снедекора с и степенями свободы . Мы отвергаем гипотезу так как , то есть , то есть . Гипотезу можно проверить и так : если Р-значение не меньше принятого уровня значимости ,гипотезу принимают , а если Р-значение оказывается меньше , то отвергают .В нашем случае , значит гипотезу мы отвергаем .
Пункт 3 . а) Таким образом , вид агитации существенно влияет на количество голосов ,отданных за кандидата . Оценим силу этого влияния с помощью коэффициента детерминации
– такова (73%) доля общей вариации наблюдаемого числа голосов , отданных за кандидата , обусловленная изменчивостью фактора - вида агитации . Влиянием не контролируемых факторов обусловлено 27% вариации числа голосов .
б) Попарное сравнение видов агитации по влиянию на количество поданных голосов проведем при помощи проверки гипотез gпри альтернативах . Вычислим значения статистики , имеющей (в предположении справедливости ) распределение Стьюдента с степенями свободы ( здесь .
Критическая точка распределения Стьюдента на 5%-ном уровне значимости .
Гипотеза не отвергается , так как , то есть , то есть эффекты влияния первого и второго уровней фактора на результативный признак одинаковы , а гипотезы отвергаются (так как и ) , то есть при переходе с первого и второго уровня на третий эффект влияния не изменялся .
Пункт 4 . Оценим параметры детерминированной модели однофакторного дисперсионного анализа . Оценка параметра равна общему среднему . Оценка эффекта влияния -ого уровня ыфактора равна , то есть ;
;
;
Оценка параметра равна .