Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка по математике.doc
Скачиваний:
117
Добавлен:
19.03.2016
Размер:
2.89 Mб
Скачать

Задания для домашней работы:

1. Используя критерий Пирсона, при уровне значимости 0,05 установить, случайно или значимо расхождение между эмпирическими частотами и теоретическими , которые вычислены исходя из гипотезы о нормальном распределении генеральной совокупности

14

18

32

70

20

36

10

10

24

34

80

18

22

12

2. В эксперименте психологу необходимо использовать шестигранный игральный кубик с цифрами на гранях от 1 до 6. Для чистоты эксперимента необходимо получить «идеальный» кубик, то есть такой, чтобы при достаточно большом числе подбрасываний каждая его грань выпадала бы примерно равное число раз. Задача состоит в выяснении того, будет ли данный кубик близок к идеальному? Для решения этой задачи психолог подбрасывал кубик 60 раз, при этом количество выпадений каждой грани распределилось следующим образом:

Грани кубика

1

2

3

4

5

6

Количество выпадений

12

9

11

14

8

6

3. Известны результаты психологического тестирования в виде двух выборок, объёмы которых соответственно равны 6. При уровне значимости 0,05 проверить нулевую гипотезу об однородности при конкурирующей гипотезе .

12

10

8

15

14

11

13

9

16

17

7

18

4. Используя критерий Уилкоксона, при уровне значимости 0,05 проверить нулевую гипотезу об однородности двух выборок, объёмы которых соответственно равны 30 и 50, при конкурирующей гипотезе , если известно, что сумма порядковых номеров вариант первой выборки в общем вариационном ряду =1150.

Тема №16 «Корреляционно-регрессионный анализ»

Цель: научиться составлять выборочные уравнения линейной регрессии в случае сгруппированных данных, вычислять выборочный коэффициент линейной корреляции и проводить оценку его значимости, проверять значимость уравнения линейной регрессии с помощью дисперсионного анализа, делать прогноз значений зависимой переменной.

Краткие теоретические сведения:

Основная задача корреляционного анализа – выявление связи между случайными переменными и оценка её тесноты.

Статистической зависимостью называется зависимость, при которой изменение одной из величин влечёт изменение распределения других величин.

Частным случаем статистической зависимости является корреляционная зависимость, при которой изменение одной из величин изменяет среднее значение других.

В психологических исследованиях имеет место статистический разброс данных: при одном и том же значении одной величины другая вели­чина принимает несколько значений и наоборот. Графическое изображение экспериментальных данных называется диаграммой рассеяния.

Необходимы ответы на вопросы:

1) какой вид имеет тенденция,

2) какая теснота между тенденцией и разбросом данных.

Для этого необходимо не сгруппированные данные подвергаются первичной обработке. Составляется корреляционная таблица.

где , – середины интервалов, , , .

Для ответа на первый вопрос используем аппроксимацию. Наиболее простой вариант – квадратическая аппроксимация, которая обосновывает метод наименьших квадратов.

Суть его состоит в том, что сумма квадратов отклонений между экспериментальным и теоретическим значениями должна быть минимальной:

.

Если , тогда .

Из теории функции нескольких переменных известно, что для минимума необходимо равенство нулю всех частных производных:

Решив данную систему относительно неизвестных коэффициентов мы получим уравнения, которые называются уравнениями регрессии:

- выборочное уравнение регрессии на ,

- выборочное уравнение регрессии на .

Для линейной зависимости:

или

,

где и – выборочные коэффициенты регрессии на и на .

Для их нахождения используются формулы и данные корреляционной таблицы:

, .

Для ответа на второй вопрос вводим еще одну характеристику, учитывающую разброс данных вокруг линии регрессии, то есть тесноту связи - выборочный коэффициент корреляции:

Знак  берётся равным знаку коэффициентов регрессии, которые оба или положительны или отрицательны. При этом один коэффициент регрессии по абсолютной величине больше 1, другой меньше 1. Коэффициент корреляции не имеет размерности и .

Так как выборка случайна, то отличное от нуля значение выборочного коэффициента линейной корреляции необходимо проверить на значимость.

1) на уровне = 0,05 выдвигаем нулевую гипотезу при конкурирующей ,

2) в качестве критерия проверки используем случайную величину ,

3) табличное значение находим по таблице распределения Стьюдента,

4) если , то принимаем нулевую гипотезу, а значит, генеральный коэффициент линейной корреляции равен нулю.

Основная задача регрессионного анализа – установление формы и изучение зависимости между переменными, оценка функции регрессии, прогноз значений зависимой переменной.

В регрессионном анализе рассматривается односторонняя зависимость случайной зависимой переменной от одной (или нескольких) неслучайной независимой переменной : , где - возмущение, характеризующее отклонение от функции регрессии.

Будем рассматривать только линейный регрессионный анализ.

определяется по МНК, а воздействие неучтённых случайных факторов и ошибок наблюдений в модели находится с помощью дисперсии возмущений или остаточной дисперсии, несмещённой оценкой этой дисперсии является выборочная остаточная дисперсия:

,

где – групповая средняя, найденная по уравнению регрессии, – выборочная оценка возмущения или остаток регрессии.

Доверительный интервал прогноза среднего значения:

,

где

,

находим по таблице распределения Стьюдента

При определении доверительного интервала для индивидуальных значений зависимой переменной вместо берём

.

Доверительный интервал для прогнозов индивидуальных значений определяется формулой:

.

Проверка значимости уравнения регрессии (используется дисперсионный анализ):

Вычисляем несмещённые оценки дисперсий зависимой переменной, обусловленных соответственно регрессией и воздействием неучтённых случайных факторов и ошибок, - число оцениваемых параметров уравнения регрессии, - число наблюдений по формулам:

,

, ,

, .

Гипотеза о значимости уравнения регрессии принимается, если

, где уровень значимости, и отвергается, если .