Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Загребаев Лектсии по теории вероятностеы и математическоы статистике 2015

.pdf
Скачиваний:
6
Добавлен:
12.11.2022
Размер:
4.61 Mб
Скачать

В математическом плане задача ставится следующим образом. Пусть случайные величины X и Y подчинены нормальному закону. Будем считать, что дисперсии этих случайных величин неизвестны,

но одинаковы: σ2x = σ2y = σ2. Пусть n и m объемы выборок из ге-

неральных совокупностей X и Y соответственно. Необходимо проверить нулевую гипотезу о равенстве математических ожиданий:

H0: M[X ] = M[Y ]

относительно альтернативной

H1: M[ X ] M[Y ];

 

 

 

 

n

 

 

 

 

 

 

m

 

 

 

 

= 1 Xi ;

 

 

 

1

Yi

 

X

Y

=

 

 

 

 

 

 

 

n i=1

 

 

 

 

m i=1

Для дисперсии выберем несмещенную оценку:

 

1

 

n

 

 

 

1

 

m

Sx2 =

 

 

)2 , Sy2

=

 

 

 

 

)2.

(Xi X

 

(Yi Y

 

 

 

 

 

 

n 1 i=1

 

 

m 1 i=1

Так как по условию σ2x = σ2y = σ2 ,

 

то для оценки σ2 целесооб-

разно использовать эту информацию и в качестве оценки дисперсии взять взвешенное значение от обеих выборок:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2 =

Sx2 (n 1)

+ Sy2 (m 1)

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n + m

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если гипотеза

 

H0 справедлива, то случайная величина

 

 

 

 

 

 

 

 

 

X

 

Y

подчинена нормальному

 

закону

с

параметрами

 

 

 

 

 

] = 0,

 

M[ X

Y

 

 

 

 

 

 

 

 

 

2

 

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D[X Y ] = σ

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Действительно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M[X

 

Y ] = M[X ] M[Y ] = 0;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D[X ]

 

 

D[Y ]

 

 

 

1

 

1

 

2

 

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D[X Y ] = D[X ]

+ D[Y ] =

 

 

 

 

 

+

 

 

 

 

= D

 

+

 

 

= σ

 

 

 

 

+

 

 

 

 

,

 

 

n

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

m

 

 

n

 

 

m

величина σ2 неизвестна. Понятно, что в этом случае оценка дисперсии разности средних значений может быть выражена формулой

2

 

 

 

1

 

1

2

 

1

 

1

Sx2 (n 1) + Sy2 (m 1)

 

SX

 

 

=

 

+

 

S

 

=

 

+

 

 

 

 

.

Y

 

 

 

 

 

n + m

2

 

 

 

n

 

m

 

n

 

m

 

131

При этом легко показать, что

2

 

 

 

2

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M[SX

 

 

] = σ

 

 

 

+

 

 

= D[X Y ].

Y

 

 

 

 

 

 

 

 

n

 

m

 

 

 

 

 

Известно, что, если величина X Y подчинена нормальному закону, то статистика

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t =

X

Y

=

 

 

 

 

 

X Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SX

 

 

 

 

 

1

 

1 Sx2 (n 1) + Sy2 (m 1)

 

 

Y

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n + m 2

 

 

 

 

 

 

 

 

 

n

 

m

 

 

 

подчиняется распределению Стьюдента с числом степеней свободы k = n + m 2.

При заданном α по таблицам функции Стъюдента находим tкр , при этом выбор значения tкр зависит от рассматриваемой конкури-

рующей гипотезы.

Если рассматривается гипотеза H1: M[ X ] M[Y ], то tкр на-

ходится по приложению 2 критических точек распределения Стъюдента для двухсторонней критической области такое, чтобы

выполнялось равенство

P(

 

t

 

> tкр) = α. Далее вычисляем по выбор-

 

 

кам значение tнабл =

 

 

 

 

x y

 

nm(n + m 2)

, и если его

(n 1)sx2 + (m 1)s2y

n + m

 

 

модуль больше tкр , то

гипотеза H0

отвергается, в противном слу-

чае она принимается.

 

 

 

 

 

H1:

M[X ] > M[Y ] ,

то строится

Если рассматривается гипотеза

правосторонняя критическая область. При этом критическая точка находится также по таблицам приложения 2, но для односторонней

критической области. Если tнабл < tправост.кр нет оснований отвергнуть нулевую гипотезу.

Если рассматривается гипотеза H1: M[X ] < M[Y ], то строится

левосторонняя критическая область. При этом критическая точка находится также по таблицам для односторонней критической области и в силу симметрии распределения Стьюдента полагают

tлевост.кр = −tправост.кр . Если tнабл > −tлевост.кр , нет оснований отвер-

132

гать нулевую гипотезу. Если tнабл < −tлевост.кр , нулевую гипоьезу

отвергают.

Пример. Решим поставленную задачу о земельных участках при неизвестной дисперсии цен.

Дано: m =5 , x = 7500 уе. . , n = 7 , y = 8000 уе. . ,

sx2 = 3,5000000 ( уе. )2 , s2у = 7000000 ( уе. )2.

 

α = 0,05

 

 

 

 

Решение:

 

 

 

 

рассчитаем tнабл =

x y

 

nm(n + m 2)

= −0,39.

(n 1)sx2 + (m 1)s2y

 

n + m

 

 

 

Число степеней свободы k = n + m 2 = 10.

 

1. Для конкурирующей гиротезы H1:

M[ X ] M[Y ] по таблице

критических точек распределения Стьюдента находим tкр = 2,23.

Так как | 0,39 | < 2,23 , нулевую гипотезу принимаем.

2. Для конкурирующей гиротезы H1: M[X ] > M[Y ] по таблице критических точек распределения Стьюдента находим tкр = 1,81.

Так как –0,39 < 1,81, нулевую гипотезу принимаем.

3. Для конкурирующей гипотезы H1:

M[X ] < M[Y ] критиче-

ская точка tлевост.кр = −tправост.кр , то есть

tлевост.кр = −1,81. Таким

образом, и в этом случае нет оснований отвергнуть принятую гипотезу так как –0,39 > –1,81.

Замечание. Для нахождения критических точек с помощью программы Excel нужно воспользоваться функцией СТЬЮДРАСПОБР

(Вставка → Функция → Мастер функций → Статистические

→ СТЬЮДРАСПОБР).

Критические точки для двустронней критической области находятся, если задать число степеней свободы и уровень значимости (вероятность).

133

Рис. 15.2. Диалоговое окно функции СТЬЮДРАСПОБР

Из рисунка видно, что значение tкр = 2, 228139238 совпадает с округленным табличным значением tкр = 2,23, найденным ранее.

Для односторонней критической области в окне для задания вероятности следует задать 2 0,05.

Рис. 15.3. Диалоговое окно функции СТЬЮДРАСПОБР

134

Лекция 16. СРАВНЕНИЕ ДВУХ ДИСПЕРСИЙ НОРМАЛЬНЫХ ГЕНЕРАЛЬНЫХ СОВОКУПНОСТЕЙ

Одyим из методов исследования, который применяется для тестирования нового товара или новых свойств уже привычного продукта, являетcя холл-тестирование. Этот метод позволяет выработать наиболее эффективную ценовую политику, стратегию позиционирования товара и т.д. Холл-тестирование проводится в арендуемом и специально оборудованном помещении и основывается на мнении группы людей – респондентов. Рассмотрим следующий пример. Рекламное агенство подготовило два рекламных ролика какого-нибудь товара «совершенно необходимого» для жителей России, например поясов для похудения. Необходимо выбрать один из них, прежде чем запустить телевизионную рекламу в эфир. С этой целью респондентам в количестве n = 10 человек предложено по десятибалльной шкале оценить рекламный ролик. Обозначим оценки рекламных роликов X и Y. Обработка анкет респондентов дала следующие результаты: средний балл x = y = 7, исправленные

выборочные дисперсии sx2 = 4, s2y = 6. Судя по этим данным, целе-

сообразно предпочесть первый ролик, так как разброс мнений меньше. Однако в телевизионной аудитории (генеральной совокупности) ситуация может быть иной, например дисперсии могут совпадать. Если это так, то для выбора ролика придется применить ка- кие-либо дополнительные критерии. Следовательно, возникает задача о сравнении двух дисперсий нормальных генеральных совокупностей по данным выборки. В общем плане задача ставится так.

Пусть генеральные совокупности X и Y распределены нормально

ипо независимым выборкам из этих совокупностей, соответственно объемами n и m получены исправленные выборочные дисперсии sx

иsY . Понятно, что в силу ограниченности выборок значения этих

величин могут не совпадать, даже если дисперсии генеральных совокупностей одинаковы. Возникает вопрос случайно это расхождение, значимо ли оно? Иначе говоря, требуется при заданном уровне

значимости α проверить нулевую гипотезу о том, что дисперсии генеральных совокупностей совпадают.

135

 

1

n

1

m

Так как Sx2 =

 

 

)2 и Sy2 =

(Yi Y )2 являют-

(Xi X

 

 

 

n 1 i=1

m 1 i=1

ся, несмещенными оценками дисперсий генеральных совокупностей X и Y соответственно, то выполняются соотношения

M[S2

] = D

X

и M[S 2

] = D .

X

 

Y

Y

Тогда нулевую гипотезу о равенстве дисперсий генеральных совокупностей X и Y можно записать следующим образом:

H

:

M[S 2

] = M[S 2

] или

H

:

D

X

= D .

0

 

X

Y

 

0

 

 

Y

В качестве критерия в данном случае выбирают отношение

большей дисперсии к меньшей: F = Sб2 . Показано, что при спра- Sм2

ведливости нулевой гипотезы величина F подчиняется распределению ФишераСнедекора со степенями свободы k1 = n1 1 и

k2 = n2 1. При этом n1 объем выборки, по которой вычислена большая исправленная дисперсия, а n2 – меньшая. Оказывается, что

распределение Фишера–Снедекора зависит только от числа степеней свободы k1 и k2 и не зависит от других параметров.

Распределение Фишера–Снедекора

Если U и V – независимые случайные величины, распределенные по закону χ2 со степенями свободы k1 и k2 , то величина

F= U /k1 V /k2

имеет распределение, называемое F-распределением, или распределением Фишера–Снедекора, плотность которого определяется выражением

0,

при x 0;

 

 

 

f (x) =

 

 

x(k12)/2

 

 

, при x > 0.

C0

 

 

 

 

 

 

(k

 

+ k x)

(k +k

2

)/2

 

2

1

 

 

 

1

 

 

 

 

136

 

 

 

Гk1 + k2

kk1

/2kk2 /2

 

 

 

 

2

1

2

 

где C

=

 

 

 

, Г – гаммфункция.

 

 

 

 

 

0

 

Г(k1 /2)Г(k2 /2)

 

 

 

 

 

Рис. 16.1. Плотность распределения Фишера – Снедекора

Критическая область строится исходя из вида конкурирующей гипотезы.

Рассмотрим несколько случаев:

1. H1: D[X ] > D[Y ].

Необходимо вычислить отношение большей исправленной дисперсии к меньшей, т.е.

fнабл = sб2 .

sм2

Затем по таблице критических точек распределения ФишераСнедекора, по заданному уровню значимости α и числам степеней свободы k1 и k2 ( k1 – число степеней свободы большей исправлен-

ной дисперсии) найти критическую точку fкр , исходя из условия

P(F > fкр) = α .

Если fнабл > fкр , то гипотезу H0 отвергаем.

При данной конкурирующей гипотезе критическая область односторонняя.

137

2) Конкурирующая гипотеза имеет вид

H1: D[ X ] D[Y ].

В этом случае строят двустороннюю критическую область, исходя из требования, чтобы вероятность попадания в эту область в предположении справедливости нулевой гипотезы была равна при-

нятому значению α. В литературе по математической статистике доказано, что наибольшая мощность критерия достигается тогда, когда вероятность попадания в каждый из двух интервалов крити-

ческой

области

 

равна

α

. Правую критическую точку

 

 

 

α ; k , k

 

 

 

2

 

f

2

= f

2

 

находят по таблице критических точек распре-

 

 

кр

2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

деления ФишераСнедекора. Оказывается, находить левую критическую точку нет необходимости. Если fнабл < fкр нет оснований

отвергать нулевую гипотезу. Если же fнабл > fкр , то нулевую гипотезу отвергают – точка попала в критическую область с вероятно-

стью α.

Пример. Решим поставленную задачу о выборе рекламного ролика для различных конкурирующих гипотез при уровне значимости

α = 0,05

Дано: n = m = 10 , x = 7 , y = 7 ,

sx2 = 4 , s2у = 6.

 

 

 

 

 

Число степенй свободы k1 = k2 = n 1 = 9.

 

 

 

 

 

Решение.

 

 

s2

 

 

 

 

 

 

 

6

 

Рассчитаем наблюдаемое значение критерия

fнабл =

б

=

 

=

sм2

4

= 1,5.

 

 

 

 

 

 

 

 

 

 

1. Для конкурирующей гиротезы

H1 : M[X ] M[Y ] строится

двустронняя критическая область. По таблице критических точек распределения ФишераСнедекора для α2 = 0,025 мы должны

найти правую критическую точку. Однако для такого значения ошибки первого рода таблицы критических точек в приложении нет! Воспользуемся статистическми функциями программы Excel!

138

Вставка → Функция → Мастер функций → Статистические → FРАСПОБР.

Рис. 16.2. Диалоговое окно функции FРАСПОБР

Обратим внимание, что в программе Excel функция

FРАСП( x, k1, k2 ) = P(X > x) = 1F(X < x), т.е. дает вероятность «хвоста» за точкой x . Следовательно функция FРАСПОБР дает

по заданной вероятности попадания в «хвост» координату начала «хвоста». Таким образом, 4,025 = fправосткр – правосторонняя кри-

тическая точка. Для нахождения левосторонней точки нужно задать вероятность попадания в «хвост» P = 0,975.

Рис. 16.3. Диалоговое окно функции FРАСПОБР

139

Получим левостороннюю критическую точку fлевосткр = 0,248. Так как fнабл = 1,5 не попадает в критические области, то гипотезу о равенстве дисперсий – принимаем.

 

 

2. для конкурирующей гипотезы H1:

D[Y ] > D[ X ] строится од-

ностронняя критическая область.

 

 

 

 

 

 

 

 

 

 

По заданному уровню значимости α = 0,05

и по степеням сво-

боды

k1 = k2 = n 1 = 9 по таблицам Фишера-Снедекора находим

критическую точку

fкр = 3,18.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k2

 

 

 

Уровень значимости α = 0,05

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k1

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

3

4

230

6

7

8

 

 

9

 

 

 

1

 

161

200

 

216

225

19,30

234

237

239

 

241

 

 

 

….

 

 

 

9

 

5,12

4,26

 

3,86

3,63

3,33

3,37

3.29

3,23

 

3,18

 

 

 

 

 

 

 

 

И в этом случае

fнабл < fкр , таким образом, гипотезу о равен-

стве дисперсий генеральных совокупностей принимаем. Судя по полученным результатам, оба рекламных ролика на потребителя произведут одинаковое впечатление, значит, окончательный выбор нужно сделать исходя из других соображений.

Лекция 1 7 . ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ. КРИТЕРИЙ ПИРСОНА

Ранее рассматривались способы проверки гипотез о различных параметрах закона распределения, причем сам закон распределения считался известным. Однако во многих задачах именно сам закон

распределения неизвестен, и предположнение о его виде гипотеза, требующая проверки.

Рассмотрим такой пример. Чтобы правильно определить график загрузки касс в супермаркете, менеджеру желательно знать закон распределения времени обслуживания покупателей. (Скорее всего,

140

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]