Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции13-15.doc
Скачиваний:
16
Добавлен:
17.11.2018
Размер:
733.18 Кб
Скачать

2. Критерий согласия Пирсона

Критериями согласия называются критерии о проверке статистических гипотез о виде распределения случайной величины. Проверяемая гипотеза имеет вид:

Н0= {Х ~ fX (x, r ),

где r - принятые в гипотезе параметры распределения. Пирсон предложил и обосновал следующий критерий проверки гипотезы Н0 по отношению к единственной альтернативной противоположной гипотезе.

Пусть по полученной выборке хВ={хi; i=1,n } построена гистограмма наблюдаемых частот Hxn = {hj,nj; j=1,m}. Построим так же теоретические частоты njт для интервалов hj при условии справедливости проверяемой гипотезы Н0. Теоретические частоты вычисляются через вероятность Рj нахождения случайной величины Х в интервале hj=(хj,xj+1) по формуле :

,

где F(xj) - функция распределения для случайной величины Х, h – шаг интервалов гистограммы, xj+0.5=0.5(xj + xj+1) центры интервалов hj гистограммы. Таким образом получим теоретические частоты njт = nj. Пирсон показал [9], что величина

при достаточно большом объеме выборки имеет «хи-квадрат» распределение с m-r-1 степенями свободы и может быть использована в качестве критерия для проверки гипотезы Н0. Задаваясь уровнем значимости можем однозначно определить правостороннюю критическую область критерия из уравнения Р(>кр )=Его решение представляет собой правостороннюю квантиль «хи-квадрат» распределения кр=кр(, m-r-1) и приведено в приложении 4.

Рис. 14.3 Критическая область критерия Пирсона.

Определив, таким образом критическую точку кр, сравним ее с наблюдаемым значением набл, получим правило проверки гипотезы:

  • если набл<кр гипотеза принимается

(отклонения теоретических и наблюдаемых частот незначительны),

  • если же набл>кр,, то гипотезу необходимо отвергнуть

(отклонения частот значительны).

Числовой пример: Проверим гипотезу о нормальном распределении полуденных температур месяца мая для выборки, приведенной лекции10, при уровне значимости гипотезы . Вычислив выборочные характеристики = 14,6 и S =7,5, примем их за оценки параметров нормального распределения. Таким образам проверяемая гипотеза такова:

.

Учитывая, что для нормальной случайной величины Х функция распределения имеет вид , где - функция Лапласа (приложение 2), то для теоретических частот получим формулу:

,

где хj и xj+1соответственно левая и правая границы каждого из интервалов hj разбиения данных в гистограмме. Все результаты приведем в таблице и на рис.14.4.

Таблица 8

hj

0-5

5-10

10-15

15-20

20-25

25-30

nj

3

6

8

7

3

4

31

njт

2,31

5,26

7,79

7,53

4,74

1,95

29,6

0,205

0,105

0.006

0,037

0,639

2,171

3,162

Рис. 14.4 Гистограмма наблюдаемых частот и кривая теоретических частот.

По заданному уровню значимости проверяемой гипотезы Н0 определим критическую точку распределения «хи-квадрат» используя приложение 4. Получим кр=обр(0,05, 6-2-1) = 7,8.

Поскольку набл =3,162 < кр= 7,8, то гипотеза принимается (нет оснований ее отвергнуть), т.к. отклонения частот незначительны

Примеры заданий на проверку различных статистических гипотез для самостоятельной работы студентов приводятся в [12].

Лекция № 15

Элементы корреляционного анализа

Две случайные величины и могут быть независимыми между собой, зависимыми строго функционально или зависимыми статистически. При статистической зависимости между случайными величинами распределение одной из величин зависит от того, какое значение имеет другая случайная величина. Степень статистической зависимости величин и характеризует коэффициент корреляции Пирсона , обладающего следующими свойствами:

1. ,

2. для независимых величин и коэффициент равен нулю,

3. для линейно зависимых величин он равен единице.

Сама же статистическая зависимость описывается для непрерывных случайных величин функциями плотности условного распределения или . Однако, нахождение этих функций и их практическое использование обычно затруднено и малоэффективно. Чаще статистическая зависимость рассматривается в более простом виде, в виде функциональной зависимости числовых характеристик одной из величин от значения другой величины. Такая зависимость называется корреляционной и описывается функциями регрессии или . Так например, наиболее часто используется регрессия в форме условного математического ожидания:

.

Корреляционная зависимость приближает статистическую зависимость функциональной зависимостью и имеет следующий вид:

.

Здесь - объясняемая переменная, - значение объясняющей переменной , а - случайная величина ошибки (невязки) корреляции с нулевым математическим ожиданием при любом значении х. Дисперсия же ошибки не нулевая, но при «хорошей» функции регрессии она не должна быть большой, и не должна зависеть от х. Построение таких функций регрессии является задачей регрессионного анализа.

Для приближенного построения функции регрессии будем искать наилучшее в определенном, но довольно широком, m-параметрическом классе функций таким образом, что бы дисперсия ошибки как функция от параметров была минимальной. Такое приближение называется среднеквадратической регрессией в классе . Для приближенного построения функции регрессии можно так же воспользоваться данными наблюдений за величинами X и Y, полученными в выборке объема n. Такие функции регрессии ищутся так же в кассе , имеют минимальное суммарное отклонение от наблюдаемых значений, строятся методом наименьших квадратов и называются выборочной среднеквадратической регрессией.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]