Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическая статистика. Семинары..docx
Скачиваний:
9
Добавлен:
09.06.2015
Размер:
108.72 Кб
Скачать

Семинар n 10

Коэффициент корреляции φ.

Коэффициент корреляции φ устанавливает взаимосвязь между двумя переменными, которые обладают дихотоническими признаками.

Дихотомия – противопоставление.

Например: 0 – отсутствие, 1 – наличие признака.

Задача:

Влияет ли семейное положение на успешность учёбы студентов мужчин. Психолог опросил 12 студентов-мужчин об их семейном положении (0 = холост, 1 = женат) и об успешности обучения (0 = наличие академических задолженностей, 1 = успешное обучение).

N п/п

Семейное положение

Успешность обучения

N п/п

Семейное положение

Успешность обучения

1

0

0

7

0

0

2

1

1

8

1

1

3

0

1

9

0

0

4

0

0

10

0

1

5

1

1

11

0

0

6

1

0

12

1

1

Обозначим семейное положение переменной x, а успешность обучения переменнойy.

Формула для расчёта коэффициента корреляции φ:

φ=pxypx * py

px(1-px) *py(1-py) (знаменатель под корнем)

px– частота или доля признака имеющего 1 по переменной x.

1 - px– частота или доля признака, имеющего 0 поx.

py– частота или доля признака имеющего 1 по переменнойy.

1 – py– частота или доля признака имеющего 0 поy.

pxy– частота или доля признака имеющая 1 одновременно поxи поy.

Для вычисления частот подсчитывают количество единиц в переменной х. Полученную величину делят на N.

N– это общее число элементов переменной.

В нашей задаче N= 12.

Аналогично подсчитывают количество единиц в переменной “y” и делят наN.

Доля студентов имеющих 1 по x.

px = 5 = 0,4167

12

(1 – px) = 0,5833

Доля студентов имеющих 1 по y.

py = 5

10

(1 – py) = 0,5.

pxy– доля студентов, имеющих 1 поxи поy=4= 0,3333

12

φ=. 0,3333 – 0,4167 * 0,5 =. 0,12455 = 0,507

0,4167 * 0,5833 * 0,5 * 0,5 (знаменатель под корнем) 0,24650

Для коэффициента корреляций φне существует таблицы критических значений. Критические значенияφвычисляются по формуле:

φкрит = |r| *n - 2(вся дробь под корнем)

1 – r2

r – коэффициент корреляции.

n – число коррелируемых признаков.

0,507 * _12 – 2__(дробь под корнем) = 1,86

1 – 0,5072

Вычисление критического значения проверяется по таблице t-критерия Стьюдента. Для этого определяют количество степеней свободы по формуле:

df=n-2 (то есть у нас 12-2 = 10 степеней свободы)

p<0,05 еслиt-критерий больше, чем 2,228.

Поскольку вычисленное критическое значение меньше табличного, значит, на уровне значимости p< 0,5 мы отклоняем альтернативную гипотезуn1 и принимаем нулевую гипотезуn0. Это значит, что успешность обучения не различается в зависимости от семейного положения.

Между успешностью обучения и семейным положением никакой связи нет.

Критерий Немени.

Этот критерий основан на ранжировании всей выборки. Если в выборке Kгрупп поnэлементов, то наименьшему наблюдению приписывается ранг «1» и так далее.

Затем суммируются ранги в каждой группе и вычисляются значения разностей сумм рангов.

Критерий Немени позволяет оценивать различия средних значений между группами. При этом группы должны быть равны по величине. Количество групп должно быть не меньше 4, но не больше 10.

Задача:

Проводим обследование 4х групп спортсменов высокой квалификации по 5 человек в группе: 1 – футболисты, 2 – гимнасты, 3 – теннисисты, 4 – пловцы. Изучалось время реакции выбора в миллисекундах (мс).

Регулируемый фактор – спортивная специализация. Результирующий признак – длительность времени реакции.

1 ранг

2 ранг

3 ранг

4 ранг

балл

ранг

балл

ранг

балл

ранг

балл

ранг

203

12

213

16

171

5

207

13

184

7,5

246

18

203

14

252

2

169

4

184

7,5

260

19

176

6

216

17

282

20

193

10

200

11

209

15

150

9

160

3

145

1

55,5

70,5

51

33

Проверим правильность ранжирования. Для этого сложим: 55,5 + 70,5 + 51 + 33 = 210.

И по формуле

k*c (k*c + 1)

2

k– число строк.

c– число столбцов.

20 * 21= 210.

2

Результаты совпадают. Всё верно. Найдём разности сумм рангов.

Разности рангов

1-2

1-3

1-4

2-3

|55,5 – 70,5|= 15

|55,5 - 51|= 4,3

|55,5 - 33|= 22,5

2-4

|70,5 - 51|= 19,5

|70,5 -33|= 37,5

3-4

|57 - 33|= 18

p< 0,05 еслиD<48,1

По таблице критических значений мы находим, что при k= 4, аn= 5 (k – число строк).

p< 0,05 если критерий Немени больше 48,1.

Все разности у нас меньше критических значений. Следовательно мы принимаем нулевую гипотезу h0 и утверждаем, что различие во времени реакции между группами спортсменов оказались случайными.

Тип спортивной специализации на эти значения не влияет.

Тест 5. 18.04

1. г)

2. д)

3. г)

4. д)

5. д)

6. в)

7. г)

8. в)

9. г)

10. в)

11. а)

12. в)

13. б)

14. а)

15. б)

16. б)

17. г)

18. г)

19. в)

20. г)

21. г)