Dispersionnyy_analiz_ИПИС
.pdfМинистерство сельского хозяйства РФ Департамент научно-технологической политики и образования
ФГОУ ВПО Волгоградская государственная сельскохозяйственная академия
Кафедра высшей математики
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. РЕШЕНИЕ ЗАДАЧ ПО ТЕМЕ:
«ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ»
Методическая разработка
Волгоград ИПК «Нива»
2010
1
УДК 519.2(075.3) ББК 22.17я72 К 67
РекомендованокизданиюкафедройвысшейматематикиВГСХА и учебно-методическимсоветомфакультетаэлектрификациис.х.
Корниенко, В.С.
К 67Математическая статистика. Решение задач потеме «Однофакторный дисперсионный анализ». Методическая разработка [Текст] /В.С. Корниенко; Волгогр. гос. с.-х. акад. Волгоград, 2010. 20 с.
Приведены необходимые теоретические сведения. Решено (в «ручном» режиме и с помощью Mathcad) достаточное число задач.
Для студентов специальности 110302 - «Электрификация и автоматизация сельского хозяйства».
УДК 519.2(0.75.3) ББК 22.17я72
2
Дисперсионный анализ дает общую схему проверки статистических гипотез, основанную на тщательном изучении различных источников вариации [изменчивости, неоднородности] в сложной ситуации. Он позволяет оценить влияние одного или нескольких факторов на результирующий признак.
Предположения, лежащие в основе дисперсионного анализа, довольно жесткие и подчеркивают тот факт, что данный метод следует использовать только для таких зависимых переменных, которые были тщательно изучены и точно измерены. До тех пор, пока объемы выборок приблизительно равны, дисперсионный анализ может мириться с некоторым нарушением допущений модели. Но в ситуации выборок, сильно отличающихся по объему, следует воспользоваться другими методами (например, хиквадрат).
На практике часто встречается ситуация, когда можно указать один фактор, влияющий на конечный результат, и этот фактор принимает конечное число значений. Такая ситуация может быть проанализирована при помощи однофакторного дисперсионного анализа.
I. Теоретические сведения
1. Условия применимости
Дисперсионный анализ был предложен Р. Фишером* для решения некоторых задач в области биологических исследований, в частности в сельскохозяйственной статистике. В настоящее время дисперсионный анализ определяется как статистический метод, предназначенный для оцен-
ки влияния различных факторов на результат эксперимента, в связи с чем, область применения этого метода становится значительно шире. Результатом эксперимента является некоторая случайная величина X, называемая также результативным признаком. На значения случайной величины X влияет фактор A, состоящий из нескольких уровней [групп] Ai , i 1,r.
Рассмотрим простой пример. Директора фирмы интересует зависимость выполненных работ за смену от работающей на стройке бригады. Предположим, что на стройке работают r бригад. Объем выполненных работ является результативным признаком X, работающую бригаду назовем фактором A, а через Ai обозначим i й уровень [группу] фактора A (i ю
бригаду, i 1,r).
* Фишер Роналд Эймлер (1890-1962) – английский математик, генетик и статистик. Исследования относятся к математической статистике.
3
В дисперсионном анализе наблюдаемые величины разбиваются на r
групп, причем i я группа содержит выборку из ni , i 1,r, величин Xi N a mi , 0 , где 0 является постоянной, хотя и неизвестной величиной, не зависящей от i.
Обозначим через xi, j значение j й величины в i й группе. Модель однофакторного дисперсионного анализа можно записать в виде
xi, j a mi i,j , (1)
где a - генеральное среднее всех мыслимых результатов наблюдений, т.е. M(X) , mi - эффект влияния на X , вызванный i-м уровнем фактора A, или, иначе, отклонение математического ожидания ai результативного признака при i-м уровне фактора от общего математического ожидания a, т.е. mi ai a; i, j - случайный остаток, отражающий влияние на величину
всех других неконтролируемых факторов.
Основными предпосылками дисперсионного анализа являются: 1) Остатки i, j взаимно независимы для любых i и j .
2) i, j N 0, 0 и 0 не зависит от i и j .
Средние значения mi в (1) могут меняться под влиянием некоторых факторов, например, под влиянием различных способов обработки, различных видов животных или растений, неоднородности почвы и т.д. Целью эксперимента является исследование этой изменчивости средних значений (например, гипотеза H0 о их равенстве).
2. Разложение суммы квадратов отклонений
Несмещенной оценкой для неизвестной дисперсии σ2 является, как известно, сумма квадратов
r |
ni |
|
|
|
|
Q xi, j |
|
x |
2 , |
(2) |
|
i 1 |
j 1 |
|
|
|
|
деленная на n 1, где |
r |
|
|
|
|
|
|
|
|
|
|
n ni |
(3) |
||||
|
i 1 |
|
|
|
|
количество всех наблюдений.
Основная идея дисперсионного анализа заключается в разбиении этой суммы квадратов отклонений на несколько компонент, каждая из которых соответствует предполагаемой причине изменения средних значений mi .
Обозначим через
|
|
1 |
ni |
|
||
x |
i |
xi, j |
(4) |
|||
|
||||||
|
|
n |
i |
|
|
|
|
|
|
i 1 |
|
- среднее арифметическое величин i-й группы, через
4
|
|
1 |
r |
ni |
|
|
x |
|
xi, j |
(5) |
|||
|
||||||
|
|
n i 1 |
j 1 |
|
- среднее арифметическое всех величин. Тогда справедливо тождество
r ni |
|
|
|
r |
|
|
|
|
|
r ni |
|
|
|
|
xi, j |
|
x |
2 |
ni |
|
x |
i |
x |
2 |
xi, j |
|
x |
i 2 , |
(6) |
i 1 j 1 |
|
|
|
i 1 |
|
|
|
|
|
i 1 j 1 |
|
|
|
|
или
(7)
Таким образом, полная сумма квадратов отклонений от общего среднего Q разбивается на две компоненты: Q1 - сумма квадратов между группами, Q2 - сумма квадратов внутри групп. Если поделить обе части равенства (6) на число наблюдений n, то получим известное правило сложения дисперсий:
DОБЩ DВНГР DМЕЖГР ,
где
|
|
|
ОБЩ |
|
1 n |
x |
|
|
2 |
n |
; |
|
|
ВНГР |
1 |
|
N |
|
|
|
ГРj ; |
|||||||||
|
D |
|
x |
D |
|
|
D |
|||||||||||||||||||||||
|
|
|
|
|
|
j |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
i |
|
|
|
|
i |
|
|
|
|
|
|
n |
|
|
|
|
|
|
||||
|
|
|
|
|
|
n i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
ГР |
1 |
xi |
|
|
j 2 |
; |
|
МЕЖГР |
1 |
|
Nj |
|
j |
|
2 . |
||||||||||||||
D |
x |
D |
x |
x |
||||||||||||||||||||||||||
|
n |
|||||||||||||||||||||||||||||
|
|
|
|
n i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
П р и м е р. Дана совокупность, состоящая из следующих двух групп:
x |
3 |
1 |
4 |
n1 |
|
2 |
6 |
n2 |
n |
Частота |
2 |
5 |
3 |
10 |
|
4 |
5 |
9 |
19 |
Необходимо доказать, что DОБЩ DВНГР DМЕЖГР . Р е ш е н и е. Дано: n1 10, n2 9.
Найдем групповые средние:
|
1 |
1 |
(3 2 1 5 4 3) 2,3; |
|
2 |
1 |
(2 4 6 5) 4,222. |
x |
x |
||||||
|
|
n1 |
|
|
n2 |
Найдем групповые дисперсии:
|
ГР1 |
|
1 |
(3 |
|
1)2 2 (1 |
|
1)2 5 (4 |
|
1)2 3 1,81; |
|
D |
x |
x |
x |
||||||||
10 |
|||||||||||
|
|
|
|
|
|
|
|
|
DГР2 1 (2 x2 )2 4 (6 x2 )2 5 3,951. 9
Найдем внутригрупповую дисперсию:
|
|
|
|
ВНГР |
|
|
1 |
|
(n |
|
ГР1 n |
|
|
|
|
ГР2 ) 2,824. |
|
|
|
D |
|
D |
|
D |
|||||||||||
|
|
n n |
|
|
|||||||||||||
|
|
|
|
|
|
2 |
1 |
|
|
2 |
|
|
|
|
|||
1 |
|
|
|
|
|
|
|
|
|
||||||||
Найдем общую среднюю: |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
1 |
|
(3 2 1 5 4 3 2 4 |
6 5) 3,2. |
|||||||||||
|
x |
||||||||||||||||
|
n1 n2 |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Найдем общую дисперсию:
5
|
ОБЩ |
|
1 |
(3 |
|
)2 2 (1 |
|
)2 5 (4 |
|
)2 3 (2 |
|
)2 4 (6 |
|
)2 5 3,745. |
|||||||||||||
D |
x |
x |
x |
x |
x |
||||||||||||||||||||||
19 |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Найдем межгрупповую дисперсию: |
|||||||||||||||||||||||||||
|
|
|
|
|
|
МЕЖГР |
1 |
( |
|
1 |
|
)2 10 ( |
|
2 |
|
)2 9 0,921. |
|||||||||||
|
|
|
|
|
D |
x |
x |
x |
x |
||||||||||||||||||
|
|
|
|
|
|
n1 n2
Убедимся, что общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий:
DОБЩ DВНГР DМЕЖГР = 2,824 + 0,921 = 3,745.
Решим этот пример с помощью Mathcad. Введем данные:
ORIGIN 1
|
3 |
2 |
|
|
|
|
2 |
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|||
G1 |
1 |
5 |
|
|
G2 |
G stack(G1 G2) |
|
||||||||||||||||
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
6 |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
4 |
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n1 G1 2 |
|
|
n2 G2 2 |
|
|
|
|
|
|
|
|||||||||||||
Найдем средние: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
xs1 |
|
G1 1 G1 2 |
|
|
|
xs2 |
|
G2 1 G2 2 |
|
xso |
G 1 G 2 |
|
|
||||||||||
|
|
n1 |
|
|
|
|
|
n2 |
|
n |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Найдем дисперсии: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
G1 1 xs |
|
2 G1 2 |
|
|
|
|
G2 1 xs 2 |
G2 2 |
|
|||||||||||||
D1 |
|
|
1 |
|
|
|
|
|
|
D2 |
|
|
|
2 |
|
|
|
|
|
|
|||
|
|
n1 |
|
|
|
|
|
|
|
|
n2 |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
1 |
2 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
n D |
|
2 |
n |
|||||||||||||
Do |
|
G |
xso |
G |
|
|
DvG |
DmG |
(xs xso) |
||||||||||||||
|
|
n |
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
n |
|
Выведем результаты:
|
10 |
2.3 |
|
xso 3.211 |
|
1.81 |
|
n |
|
xs |
|
D |
|
|
|
|
9 |
4.222 |
|
3.951 |
|||
Do 3.745 |
DvG 2.824 |
|
DmG 0.921 |
|
|
|
Проверим выполнимость правила:
6
Do DvG DmG 1
Здесь G1 – первая группа; G2 – вторая группа; G – общая группа; xs1 – средняя группы G1; xs2 – средняя группы G2; xso – средняя группы G; D1 – дисперсия группы G1; D2 – дисперсия группы G2; Do – дисперсия группы G; DvG – внутригрупповая дисперсия; DmG – межгрупповая дисперсия.
3. Критерий Бартлетта
Одним из условий применения дисперсионного анализа является ра-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
венство генеральных групповых дисперсий i2 |
02 , i 1,r. |
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
Проверим гипотезу H0: 12 |
|
22 |
|
... r2 |
с помощью критерия Барт- |
||||||||||||||||||||||||||||||||||||||||||||
летта. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для этого выполним следующую последовательность расчетов. |
|
||||||||||||||||||||||||||||||||||||||||||||||||
1. Найдем несмещенные оценки |
Si2 |
|
|
групповых дисперсий по форму- |
|||||||||||||||||||||||||||||||||||||||||||||
ле |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
niSi2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
, |
|
|
i |
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(8) |
|||||||||||||||
|
|
|
|
|
|
|
|
Si2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
1,r |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ni |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
2. Найдем общую несмещенную оценку дисперсии: |
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
(n 1)S2 |
(n |
2 |
1)S |
2 |
|
... (n |
r |
|
1)S2 |
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||
|
S2 |
|
1 |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
r |
. |
|
|
|
(9) |
|||||||||||
|
|
(n1 1) (n2 |
1) ... (nr |
1) |
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
3. Вычислим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|||
|
1 |
|
|
1 |
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
(10) |
||||||
q 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
n |
|
1 |
... n |
|
|
1 |
(n |
1) ... (n |
|
|
|||||||||||||||||||||||||||||||||
3(r 1) n 1 |
2 |
r |
r |
1) . |
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
4. Вычислим статистику Бартлетта: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
S |
2 |
|
|
|
|
||||||||||||
|
q (n1 |
1)ln |
|
S |
|
|
|
|
|
... (nr 1)ln |
|
|
|
|
. |
|
|
|
(11) |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
S1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Sr |
|
|
|
|
|
|
Статистика при ni 3, i 1,r, и справедливости гипотезы H0 имеет распределение, близкое к r2 1 , что дает возможность проверить гипотезу H0 описанными ранее способами.
4. Проверка гипотезы о равенстве групповых средних
Пусть H |
: |
m m, i |
|
. Заметим, что величина |
|
|
Q |
|
, являющая- |
|
|
S2 |
|||||||||
1,r |
||||||||||
|
||||||||||
0 |
|
i |
|
n 1 |
|
|||||
|
|
|
|
|
|
|
|
ся несмещенной оценкой для σ2, всегда будет иметь распределение χ2 с
n 1 степенями свободы и по ней можно построить доверительный интервал для σ2.
Если гипотеза H0 верна, то величины
7
|
|
1 |
|
Q и |
|
|
|
1 |
Q |
|
(12) |
S2 |
|
|
S2 |
|
|
||||||
ф |
|
r 1 |
1 |
0 |
|
n r |
2 |
|
будут иметь распределение Фишера с r 1 и n r степенями свободы, соответственно, при этом Sф2 и S02 являются несмещенными оценками для межгрупповой дисперсии 02 .
Отношение
1
r 1Q1 (13)
1
n r Q2
называется дисперсионным отношением и, если гипотеза H0 верна, то статистика имеет распределение Фишера с r 1, n r степенями свободы. В этом случае эффекты влияния уровней фактора A будут нулевыми, т.е. m1 m2 ... mr 0, а оценка параметра a равна общему среднему x, вычисленному по формуле (5). Проверка гипотезы H0 о равенстве групповых средних проводится по схеме, изложенной ранее. Если же гипотеза H0 отвергается, то параметр a по-прежнему вычисляется по формуле (5), а оценка эффекта mi влияния i-го уровня фактора равна
mi xi x, |
(14) |
где xi определяется по формуле (4), а x - по формуле (5). Проверка гипотезы H0 о равенстве групповых средних проводится по схеме, изложенной ранее.
5. Коэффициент детерминации
Предположим, что фактор A влияет на результативный признак X . Для измерения степени этого влияния используют выборочный ко-
эффициент детерминации, равный
|
|
Q1 |
, |
(15) |
|
d |
|||||
|
|||||
|
|
Q |
|
который показывает, какую долю выборочной дисперсии составляет дисперсия групповых средних, иначе говоря, какая доля общей дисперсии объясняется зависимостью результативного признака X от фактора A.
6. Сводка формул
Изложенные выше формулы для решения задач однофакторного анализа приведем в табл. 1.
При вычислении сумм квадратов Q, Q1 , Q2 часто удобно при ni n0 использовать следующие формулы:
8
|
|
|
|
r |
n0 |
2 |
|
|
|
r n0 |
2 |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
xi, j |
|
|
|
xi, j |
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
Q |
i 1 j 1 |
|
|
i 1 j 1 |
, |
|
|
|
(16) |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
1 |
|
|
|
|
n0 |
|
|
|
|
|
|
n0r |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
r |
n0 |
2 |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
r |
|
|
xi, j |
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
0 |
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
Q2 |
xi2, j |
|
j 1 |
, |
|
|
|
(17) |
||||||||||||||||
|
|
|
|
|
|
n0 |
|
|
|
|
||||||||||||||||
|
|
|
|
i 1 |
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
r |
n0 |
2 |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
n |
|
|
|
|
xi, j |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
r |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
0 |
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
Q xi2, j |
|
|
j 1 |
. |
|
|
|
(18) |
||||||||||||||||
|
|
|
|
|
|
n0r |
|
|
|
|
||||||||||||||||
|
|
|
|
|
i 1 |
j 1 |
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а 1 |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Компоненты |
Сумма квадратов |
|
|
|
|
Число степеней |
Оценки дисперсии |
|||||||||||||||||||
дисперсии |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
свободы |
|
|
|
|
|
|
|
|
|||
Межгрупповая |
Q1 |
ni xi |
x 2 |
|
|
|
|
|
|
r 1 |
|
Sф2 |
|
|
Q1 |
|||||||||||
|
|
r |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
r 1 |
|
|
|
||||
Внутригруп- |
|
r |
ni |
|
|
|
|
|
|
|
|
n r |
|
|
|
|
Q2 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
повая |
Q2 xi, j |
xi 2 |
|
|
|
|
|
|
|
|
|
S02 |
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
n r |
|||||||||||||||||
|
|
i 1 |
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
Общая |
Q xi, j |
x 2 |
|
|
|
|
|
|
n 1 |
|
S2 |
|
|
Q |
||||||||||||
|
|
r |
ni |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
i 1 |
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n 1 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
II. Задачи
Задача 1. В табл. 2 приведены данные по объемам работ, выполненных на стройке за смену для четырех бригад.
|
|
|
Т а б л и ц а 2 |
Номер |
Объем выполненной |
Групповое |
Выборочная |
бригады |
работы |
среднее |
смещенная |
|
|
|
дисперсия |
1 |
140, 144, 142, 145 |
142,75 |
3,688 |
2 |
150, 149, 152, 152 |
150,75 |
1,688 |
3 |
148, 149, 146, 147 |
147,50 |
1,25 |
4 |
150, 155, 154, 152 |
152,75 |
3,688 |
Выполняются ли для этих данных условия проведения дисперсионного анализа?
Р е ш е н и е. Будем считать, что результаты выработок не зависят друг от друга и имеют нормальное распределение. Проверим по критерию Бартлетта гипотезу о равенстве групповых дисперсий. В нашем случае
r 4, ni 4, (i 1,4), n 16.
1. Найдем несмещенные оценки дисперсий по формулам (8):
9
|
|
|
|
|
S |
2n |
|
3,688 4 |
4,917; |
|
|
|
|
S2 |
n |
|
|
|
1,688 4 |
2,251; |
|||||||||
S2 |
|
|
S2 |
2 |
|
||||||||||||||||||||||||
|
|
|
1 |
1 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|||||||||||||
1 |
|
|
n 1 |
3 |
|
|
2 |
|
n |
2 |
1 |
|
3 |
|
|
||||||||||||||
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
S32 |
n3 |
|
|
1,25 |
4 |
1,667; |
|
|
|
S42 |
n4 |
|
|
3,688 4 |
|
4,917. |
|||||||||||
S32 |
|
|
|
S42 |
|
||||||||||||||||||||||||
n3 |
1 |
|
|
n4 |
1 |
3 |
|
||||||||||||||||||||||
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
2. По формуле (9) найдем общую несмещенную дисперсию:
|
|
(n 1)S2 |
... (n |
|
|
1)S2 |
|
|
3 4,917 2,251 1,667 4,917 |
3,438. |
||||||||||||||||||||||||||
S2 |
4 |
|
||||||||||||||||||||||||||||||||||
|
1 |
1 |
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
(n1 1) ... (n4 |
1) |
|
|
|
|
|
|
|
|
|
|
|
3 4 |
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
3. По формуле (10) найдем параметр |
|
|
|
1 |
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
q |
|
|
|
1 |
|
|
|
1 |
|
1 |
|
|
1 |
|
|
1 |
|
|
|
1 |
|
|
0,878. |
|
|||||||||
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
3 |
3 |
3 |
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
3(4 1) 3 |
|
|
|
|
|
3 3 3 3 |
|
|
|
|
|
||||||||||||||||||
4. Вычислим статистику для критерия Бартлетта: |
|
|
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
3,438 |
|
|
|
|
|
3,438 |
|
|
|
3,438 |
|
|
3,438 |
|
3,986. |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
3ln |
|
|
|
|
|
|
3ln |
|
|
|
3ln |
|
|
||||||||||||||||
0,878 3ln |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
4,917 |
|
|
|
|
|
2,251 |
|
|
|
1,667 |
|
4,917 |
|
|
|||||||||||||||||
Проверим гипотезу H0: 12 |
... 14 |
на уровне значимости 0,05. По |
||||||||||||||||||||||||||||||||||
таблицам |
распределения |
|
|
32 |
|
при |
|
0,05 |
находим |
32,кр |
7,82. Так как |
|||||||||||||||||||||||||
3,986 32,кр , то гипотезу H0 принимаем. |
|
|
|
|
|
|
|
|
|
Mathcad-контроль:
Сперва проверим результаты 3-го и 4-го столбцов табл. 2:
|
|
140 |
|
|
|
150 |
|
|
|
148 |
|
|
|
150 |
|
|
|
144 |
|
|
|
149 |
|
|
|
149 |
|
|
|
155 |
|
G1 |
|
|
G2 |
|
|
G3 |
|
|
G4 |
|
|
||||
142 |
|
152 |
|
146 |
|
154 |
|
||||||||
|
|
145 |
|
|
|
152 |
|
|
|
147 |
|
|
|
152 |
|
|
|
|
|
|
|
|
|
|
|
|
|
mean(G1) 142.75 |
mean(G2) 150.75 |
mean(G3) 147.5 |
|
mean(G4) 152.75 |
var(G1) 3.688 |
|
var(G2) 1.688 |
var(G3) 1.25 |
var(G4) 3.688 |
|
|
Теперь найдем несмещенные оценки дисперсий: |
|||
Var(G1) 4.917 |
Var(G2) 2.25 |
Var(G3) 1.667 |
|
Var(G4) 4.917 |
|
|
|
Вычисляем общую несмещенную дисперсию:
Var(G1) Var(G2) Var(G3) Var(G4)
3.438
4
Вычислим параметр q:
10