- •Семинар n 1
- •Конспект 1 Основные понятия в математической статистике.
- •Семинар n 2
- •Конспект 2.
- •Семинар n 3
- •Лирическое отступление:
- •Андрей Крюков «Ясный взгляд весны»
- •Семинар n 4
- •Конспект 3. Дисперсия и её свойства s2, σ2.
- •Семинар n 5
- •Конспект 4 Некоммутативность. Ассоциативность.
- •Семинар n 6
- •Семинар n 7 Учителя:
- •Менеджеры:
- •Семинар n 8
- •Семинар n 9
- •Семинар n 10
Семинар n 10
Коэффициент корреляции φ.
Коэффициент корреляции φ устанавливает взаимосвязь между двумя переменными, которые обладают дихотоническими признаками.
Дихотомия – противопоставление.
Например: 0 – отсутствие, 1 – наличие признака.
Задача:
Влияет ли семейное положение на успешность учёбы студентов мужчин. Психолог опросил 12 студентов-мужчин об их семейном положении (0 = холост, 1 = женат) и об успешности обучения (0 = наличие академических задолженностей, 1 = успешное обучение).
N п/п |
Семейное положение |
Успешность обучения |
N п/п |
Семейное положение |
Успешность обучения |
1 |
0 |
0 |
7 |
0 |
0 |
2 |
1 |
1 |
8 |
1 |
1 |
3 |
0 |
1 |
9 |
0 |
0 |
4 |
0 |
0 |
10 |
0 |
1 |
5 |
1 |
1 |
11 |
0 |
0 |
6 |
1 |
0 |
12 |
1 |
1 |
Обозначим семейное положение переменной x, а успешность обучения переменнойy.
Формула для расчёта коэффициента корреляции φ:
φ=pxy – px * py
px(1-px) *py(1-py) (знаменатель под корнем)
px– частота или доля признака имеющего 1 по переменной x.
1 - px– частота или доля признака, имеющего 0 поx.
py– частота или доля признака имеющего 1 по переменнойy.
1 – py– частота или доля признака имеющего 0 поy.
pxy– частота или доля признака имеющая 1 одновременно поxи поy.
Для вычисления частот подсчитывают количество единиц в переменной х. Полученную величину делят на N.
N– это общее число элементов переменной.
В нашей задаче N= 12.
Аналогично подсчитывают количество единиц в переменной “y” и делят наN.
Доля студентов имеющих 1 по x.
px = 5 = 0,4167
12
(1 – px) = 0,5833
Доля студентов имеющих 1 по y.
py = 5
10
(1 – py) = 0,5.
pxy– доля студентов, имеющих 1 поxи поy=4= 0,3333
12
φ=. 0,3333 – 0,4167 * 0,5 =. 0,12455 = 0,507
0,4167 * 0,5833 * 0,5 * 0,5 (знаменатель под корнем) 0,24650
Для коэффициента корреляций φне существует таблицы критических значений. Критические значенияφвычисляются по формуле:
φкрит = |r| *n - 2(вся дробь под корнем)
1 – r2
r – коэффициент корреляции.
n – число коррелируемых признаков.
0,507 * _12 – 2__(дробь под корнем) = 1,86
1 – 0,5072
Вычисление критического значения проверяется по таблице t-критерия Стьюдента. Для этого определяют количество степеней свободы по формуле:
df=n-2 (то есть у нас 12-2 = 10 степеней свободы)
p<0,05 еслиt-критерий больше, чем 2,228.
Поскольку вычисленное критическое значение меньше табличного, значит, на уровне значимости p< 0,5 мы отклоняем альтернативную гипотезуn1 и принимаем нулевую гипотезуn0. Это значит, что успешность обучения не различается в зависимости от семейного положения.
Между успешностью обучения и семейным положением никакой связи нет.
Критерий Немени.
Этот критерий основан на ранжировании всей выборки. Если в выборке Kгрупп поnэлементов, то наименьшему наблюдению приписывается ранг «1» и так далее.
Затем суммируются ранги в каждой группе и вычисляются значения разностей сумм рангов.
Критерий Немени позволяет оценивать различия средних значений между группами. При этом группы должны быть равны по величине. Количество групп должно быть не меньше 4, но не больше 10.
Задача:
Проводим обследование 4х групп спортсменов высокой квалификации по 5 человек в группе: 1 – футболисты, 2 – гимнасты, 3 – теннисисты, 4 – пловцы. Изучалось время реакции выбора в миллисекундах (мс).
Регулируемый фактор – спортивная специализация. Результирующий признак – длительность времени реакции.
1 ранг |
2 ранг |
3 ранг |
4 ранг | |||||||
балл |
ранг |
балл |
ранг |
балл |
ранг |
балл |
ранг | |||
203 |
12 |
213 |
16 |
171 |
5 |
207 |
13 | |||
184 |
7,5 |
246 |
18 |
203 |
14 |
252 |
2 | |||
169 |
4 |
184 |
7,5 |
260 |
19 |
176 |
6 | |||
216 |
17 |
282 |
20 |
193 |
10 |
200 |
11 | |||
209 |
15 |
150 |
9 |
160 |
3 |
145 |
1 | |||
|
55,5 |
|
70,5 |
|
51 |
|
33 |
Проверим правильность ранжирования. Для этого сложим: 55,5 + 70,5 + 51 + 33 = 210.
И по формуле
k*c (k*c + 1)
2
k– число строк.
c– число столбцов.
20 * 21= 210.
2
Результаты совпадают. Всё верно. Найдём разности сумм рангов.
Разности рангов |
1-2 |
1-3 |
1-4 |
2-3 |
|55,5 – 70,5|= 15 |
|55,5 - 51|= 4,3 |
|55,5 - 33|= 22,5 |
2-4 |
|
|70,5 - 51|= 19,5 |
|70,5 -33|= 37,5 |
3-4 |
|
|
|57 - 33|= 18 |
p< 0,05 еслиD<48,1
По таблице критических значений мы находим, что при k= 4, аn= 5 (k – число строк).
p< 0,05 если критерий Немени больше 48,1.
Все разности у нас меньше критических значений. Следовательно мы принимаем нулевую гипотезу h0 и утверждаем, что различие во времени реакции между группами спортсменов оказались случайными.
Тип спортивной специализации на эти значения не влияет.
Тест 5. 18.04
1. г)
2. д)
3. г)
4. д)
5. д)
6. в)
7. г)
8. в)
9. г)
10. в)
11. а)
12. в)
13. б)
14. а)
15. б)
16. б)
17. г)
18. г)
19. в)
20. г)
21. г)