Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая_Статистика_КР8

.pdf
Скачиваний:
37
Добавлен:
12.06.2015
Размер:
887.23 Кб
Скачать

19

3) Распределение Фишера (F-распределение). Пусть χ2 (l) и χ2 (k) – незави-

симые случайные величины, имеющие χ2 -распределение соответственно с l и k степенями свободы. Распределение случайной величины

F(l,k)=

χ

2

(l) / l

(4.3)

 

 

χ2 (k) / k

 

 

называется F-распределением с l и k степенями свободы или распределением Фишера, а сама величина (4.3) F(l,k)-величиной.

В Приложении 3 содержатся такие значения f γ величины F(l,k), при которых вероятность P(F(l,k)< f γ )=γ .

5. Интервальные оценки параметров распределения

Вычисленная на основании имеющихся у нас выборочных данных оценку θ~(x1 , x2 ,..., xn ) параметра θ является лишь приближенным значением неизвестно-

го параметра θ даже в том случае, когда эта оценка состоятельна (т.е. стремиться с ростом n к θ ), несмещенная (т.е. совпадает с θ в среднем) и эффективна (т.е. обладает наименьшей степенью случайных отклонений от θ ). Чтобы получить представление о точности и надежности оценки, используют интервальную оценку параметра. Вычисляют такую величину δ , которая с «практической достоверностью» (т.е. с заранее заданной вероятностью близкой к 1) гарантировала бы вы-

полнение неравенства θ~ θ <δ . Т.е. выполнялось бы следующее соотношение

P(

 

θ~ θ

 

<δ ) =γ ,

(5.1)

 

 

или, что то же, находят интервал вида (θ~1 ,θ~2) , который с заранее заданной веро-

ятностью (близкой к единице) накрывал бы неизвестное нам истинное значение θ искомого параметра.

P(θ δ

<θ <θ +δ ) =γ.

(5.2)

 

 

 

θ~1

θ~2

 

При этом заранее выбираемая исследователем вероятность γ , близкая к

единице, называется доверительной вероятностью или надежностью интервальной оценки.

Интервал (θ~1 ,θ~2) называется доверительным интервалом или интервальной оценкой характеристики θ . Число ε называется точностью оценки θ~ или предельной ошибкой выборки, числа θ~1 и θ~2 называются доверительными границами.

Надежность γ принято выбирать равной 0,95; 0,99; 0,999. Тогда событие,

состоящее в том, что интервал (θ~1,θ~ 2) накроет характеристику θ , будет практически достоверным. Также практически достоверным является событие, состоя-

20

щее в том, что погрешность оценки θ~ меньше δ , или, иначе, точность оценки θ~ большеδ .

5.1. Интервальные оценки параметров нормального распределения

Далее приведем формулы для построения доверительных интервало для параметров нормального распределения, т.е. когда выборка производится из генеральной сосвокупности, имеющей нормальное распределение с параметрами a и σ 2 . Также будут приведены формулы для построения доверительной вероятности генеральной доли признака.

5.1. Интервальная оценка математического ожидания при известной дисперсии

Если известно среднее квадратическое отклонение σ, то доверительный интервал для математического ожидания имеет вид:

x

t σ

< a < x + t σ

,

(5.3)

 

 

n

 

 

n

 

 

 

где а – оцениваемое математическое ожидание, х – выборочное среднее, п – объем выборки, t – такое значение аргумента функции Лапласа Φ0 (t) , при котором

Ф0 (t) = γ 2.

Формула (12) имеет следующий смысл: с вероятностью γ можно быть уверенным в том, что вычисленное по выборке x дает значение математического

ожидания с точностью t

σ

, или, иначе, с вероятностью γ

можно быть уверен-

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

ным в том, что интервал ( x t

σ

 

; x t

σ

 

 

) накроет неизвестное математическое

 

 

 

n

 

 

 

 

 

 

n

 

 

ожидание.

 

 

 

 

 

 

 

 

 

 

 

 

 

Предельная ошибка выборки вычисляется по формуле

 

 

 

 

δ = t σ .

 

(5.4)

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

Приведем схемунахождения точности δ и доверительных границ, отве-

чающих надежности γ :

 

 

 

 

 

 

 

 

 

 

 

 

 

Табл.Ф.Лапласа

 

tσ

 

 

 

δ(нижшяя _ граница)

 

(5.5)

 

 

 

X

 

γ t δ

=

 

 

 

 

+δ(верхняя_ граница)

.

 

 

 

 

 

X

 

 

n

 

Пример 5.1. Случайная величина распределена по нормальному закону с параметром σ = 2. Сделана случайная выборка с возвратом объема n = 25. Найти с надежностью γ = 0,95 точность выборочной средней и интервальную оценку для

неизвестного математического ожидания a.

21

Решение.

По схеме (5.5) находим

 

Табл.Лапласа

 

1,96

2

 

 

 

 

 

 

 

X 0,784

γ = 0,95

t =1,96

δ =

 

 

 

 

= 0,784

 

+0,784 .

 

 

 

 

X

25

 

 

 

 

 

 

 

 

 

Таким образом,

P(x 0,784 < a < x + 0,784) = 0,95 или P( x a < 0,784) = 0,95.

Это означает, что с вероятностью 0,95 можно быть уверенным в том, что интервал

( x 0,784; x + 0,784 ) накроет параметр a. ►

Пример 5.2. На контрольных испытаниях n =15 ламп была определена средняя продолжительность горения лампы, X = 3000 ч. Считая, что срок службы лампы распределен нормально с σ = 16 ч. Определить доверительную вероятность того, что точность средней равна 10 ч.

Решение

По формуле (5.4) получаем t =δ nσ .

Подставляя числовые данные, находим t = 2,4. Теперь, зная t , по табл. функции Лапласа найдем вероятность Φ0 (2,4) = 0,4918 2 = 0,9836; это и есть до-

верительная вероятность γ .

5.2. Интервальная оценка математического ожидания при неизвестной дисперсии

Пусть {x1, x2 ,..., xn} выборка из генеральной совокупности объема N, x

выборочное среднее, s2 — исправленная выборочная дисперсия, s = s2 выборочное среднее квадратическое отклонение.

В таблице1 приведены все формулы для вычисления доверительного интервала математического ожидания нормально распределенной случайной величины при неизвестной дисперсии.

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 1.

 

 

 

 

 

 

Предельная ошибка выборки

 

 

 

Пара-

метр

Оценка

Повторная выборка

 

 

Бесповторная выборка

 

 

 

 

n > 30

 

n 30

 

n > 30

 

 

n 30

 

 

 

a

 

 

n

 

s

 

s

 

s

1n

 

s

 

n

 

x =

1 xi

δ = t

δ = tn1

δ = t

δ = tn1

1

 

 

 

n i=1

 

n

 

n

 

n

N

 

n

 

N

22

 

Здесь t определяется из условия Φ0 (t) =γ

2 ( Φ0 (t) — нормированная

функция Лапласа), tn1 определяется из условия

P(| ξ |< tn1) = γ (с.в. ξ имеет

распределение Стьюдента с n-1 степенями свободы).

Пример 5.3. Дана выборка значений нормально распределенной случайной вели-

чины: 2, 3, 3, 4, 2, 5, 5, 5, 6, 3, 6, 3, 4, 4, 4, 6, 5, 7, 3, 5. Найти с доверительной веро-

ятностью γ = 0,95 границы доверительных интервалов для математического ожидания.

Решение.

Объем выборки п = 20. Найдем х =4,25, s =1,37. По таблицам определим tn1 (0,95; 19) = 2,093.

Тогда

4,25

2,093 1,37

< a < 4,25 +

2,093 1,37

; 3,64 < a < 4,86 довери-

 

20

 

 

20

 

 

 

 

 

 

 

тельный интервал для математического ожидания. ►

Пример 5.4. Из многочисленного коллектива работников фирмы случайным образом отобрано n=25 работников. Средняя заработная плата этих работников составила 700 ден.ед. при выборочном среднеквадратическом отклонении 100 ден.ед. Предполагается, что распределение работников фирмы по размерам заработной платы подчиняется нормальному распределению. Требуется с доверительной вероятностью 0,95 определить интервальную оценку для:

1)среднемесячной заработной платы на фирме;

2)суммы затрат фирмы на заработную плату отдела, состоящего из 520 сотрудников.

Решение

Среднемесячная зарплата на фирме характеризуется генеральной средней a. Требуется определить интервальную оценку a с доверительной вероятностью γ

=0,95.

По условию задачи n=25, x = 700 , s =100 .

Согласно таблице 1 поскольку выборка является повторной для вычисления предельной ошибки выборки воспользуемся формулой δ = tn1 sn , т.е.

δ = t251 10025 .

По таблице распределения Стьюдента находим t0,95 (24) = 2,064 и δ = 41,28 .

Т. о. с вероятностью 0,95 можно гарантировать, что средняя заработная пла-

та на фирме находится в пределах (700 41,28; 700 + 41,28) или (658,72; 741,28).

23

2) Сумма затрат фирмы на заработную плату отдела составит 520 a ден.ед. Поэтому с вероятностью 0,95 можно гарантировать, что затраты фирмы на заработ-

ную плату не выйдут за пределы интервала (342534,40; 385465,60). ►

Пример 5.5. Службой контроля проверен расход энергии в течение месяца в 10 квартирах 70-квартирного дома, в результате чего были получены значения

(кВт·ч): 125, 78, 102, 140, 90, 45, 50, 125, 115, 112.

Определить с надежностью 0,95 доверительный интервал для оценки среднего расхода электроэнергии в доме.

Решение

Поскольку выборка является бесповторной и n =10 < 30 согласно таблице 1

 

s

 

 

 

 

 

 

 

 

 

предельная ошибка выборки равна δ = tn1

 

 

1

 

n

 

. Здесь n =10 , N = 70. При

 

 

 

 

 

 

 

n

 

 

 

 

N

 

 

 

γ = 0,95 получим t101 = 2,26.

 

 

 

 

 

 

 

 

 

 

 

 

Находим x = 98,2 и s2 =1033,29; s = 32,145.

 

 

 

 

 

 

 

 

 

 

32,145

 

 

 

Тогда предельная ошибка выборки δ = 2,26

1

10

= 21,27.

 

10

 

70

 

 

 

 

 

 

 

 

 

Т.о. с вероятностью 0,95 можно гарантировать, что средний расход электроэнергии находится в интервале (98,2 21,27;98,2 + 21,27 ) или (76,93;119,47).

Пример 5.6. По результатам опроса 25 клиентов банка были вычислены средняя

величина их

вклада x =10000ден. ед и среднее квадратическое отклонение

s =1600 ден.

ед. Предполагая нормальное распределение результатов наблюде-

ний, найти вероятность того, что генеральная средняя величина будет заключена в пределах от 0,9x до 1,1x .

Решение

 

 

 

 

 

 

 

Из формулы (5.2) ясно, что 0,9x = x δ . Отсюда δ = 0,1x = 0,1 10000 =1000 .

Такой же результат будем иметь,

если приравнять 1,1x

верхней границе равной

 

 

 

 

 

 

s

 

 

 

 

 

 

. По условию примера

x +δ .

Из формулы δ = tγ ,n1

 

 

получаем tγ ,n1 =δ

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

s

t

γ ,251

=1000

 

25

 

= 3,125. Зная что

t

= 3,125 по таблице находим, что γ 0,99

 

 

 

 

1600

 

 

 

 

 

γ ,251

 

 

 

 

 

. ►

5.3.Интервальная оценка генеральной доли признака.

ω= mn — выборочная доля признака A, где m — число элементов выборки объема n, обладающих признаком A. Как было указано выше ω является несме-

24

щенной и состоятельной оценкой для генеральной доли p признака A ( p = MN , где

N — объем генеральной совокупности, M — количество элементов генеральной совокупности, обладающих некоторым признаком A).

В таблице 2 приведены формулы для вычисления доверительного интервала генеральной доли признака p .

Следует заметить, поскольку вывод формул для интервальной оценки генеральной доли признака опирается на локальную и интегральную теоремы МуавраЛапласа, формулы приведенные в таблице 2 верны при достаточно большом n (порядка нескольких десятков, лучше сотен).

 

 

 

 

 

 

 

 

 

Таблица 2.

Параметр

Оценка

 

Предельная ошибка выборки

 

 

 

 

Повторная выборка

Бесповторная выборка

 

 

 

 

P

ω = m

 

 

 

 

 

 

 

 

 

δ = tγ

ω(1ω)

 

δ = tγ

ω(1ω) (1

n

)

 

 

 

n

 

 

 

n

 

 

n

N

 

Здесь tγ определяется из условия Φ0 (tγ ) =γ 2 (Φ0 (tγ ) —функция Лапласа).

Пример 5.7. В партии, содержащей 5000 изделий, проверено 400. Среди них оказалось 300 изделий высшего сорта. Найти с надежностью 0,95 доверительный интервал для доли изделий высшего сорта в случаях повторной и бесповторной выборок.

Решение

 

 

 

 

 

 

γ = 0,95 . Находим tγ

по таблице

По условию m = 300;

n = 400; N = 5000;

функции Лапласа. tγ =1,96. Выборочная доля ω

= 300 = 0,75.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

400

 

 

 

 

 

 

 

 

 

Для случая повторной выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δ = tγ

 

ω(1ω)

=1,96

0,75(10,75)

= 0,0424 .

 

 

 

 

 

 

 

 

 

 

400

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Тогда

 

доверительный интервал

согласно формуле

ω δ < p <ω +δ

0,75 0,0424 < p < 0,75 + 0,0424 0,7076 < p < 0,7924.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для бесповторной выборки используем формулу δ = tγ

ω(1ω)

(1

n

) .

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

Тогда предельная ошибка выборки δ =1,96

 

0,75(10,75)

(1

400

) = 0,0407

400

 

 

 

 

 

 

 

 

 

 

5000

 

 

 

 

 

и доверительный интервал 0,7093 < p < 0,7907 .

Т.о. с вероятностью 0,95 можно ожидать, что доля изделий высшего сорта находится в интервале от 0,7076 до 0,7924 в случае использования повторной выборки, от 0,7093 до 0,7907 в случае использования бесповторной выборки.►

25

5.4. Объем выборки

При решении статистических задач часто требуется определить необходимый объем выборки для достижения требуемой надежности доверительного интервала в предположении, что в генеральной совокупности изучаемые данные имеют нормальное распределение.

Пример 5.8. Найти минимальный объем выборки из нормальной генеральной совокупности, при котором с надежностью, не меньшей γ = 0,9 , погрешность сред-

ней, найденной по этой выборке, будет меньшеδ = 0,3 , если среднее квадратическое отклонение σ = 2 .

Решение

Т.к. среднее квадратическое отклонение известно для решения задачи воспользуемся формулами (5.3) и (5.4). Обратим внимание на то, что при заданных δ

и σ с ростом объема выборки n увеличивается вероятность P( X a <δ) =γ . В этом нетрудно убедится, проанализировав формулу (13). Поэтому неравенство

P(

 

 

 

a

 

<δ) γ выполняется для n t2σ 2

δ 2 ,

при этом n должно быть целым

 

 

 

X

числом.

 

 

 

 

 

 

В данном случае σ = 2, δ = 0,3, а

tγ -

это число, при котором значение

функции Лапласа Φ0 (tγ ) =γ 2 . По табл. этой функции найдем, что при γ = 0,9

число tγ =1,65. Тогда n 1,6522 4 =121. Таким образом, минимальный объем вы-

0,3

борки, при котором P( X a < 0,3 ) 0,9, равен 121. ►

Из приведенных в таблицах 1 и 2 формул найдены формулы для вычисления минимальных объемов выборок в предположении, что исследуемая генеральная совокупность подчиняется нормальному закону распределения с неизвестным математическим ожиданием и неизвестной дисперсией занесены в таблицу 3. Таблица 3 также содержит формулы для вычисления минимального объема выборки в случае исследования генеральной доли признака.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 3

 

 

 

 

 

 

 

 

 

 

 

Метод отбора

Для средней

 

 

 

 

Для доли

 

 

Повторный

 

n =

tγ 2s2

 

 

 

 

 

n =

tγ 2ω(1ω)

 

 

 

 

 

δ 2

 

 

 

 

 

 

δ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

Бесповторный

n =

tγ 2s2 N

 

 

 

n =

 

tγ 2ω(1ω)N

 

 

Nδ

2

+tγ

2

s

2

 

 

Nδ

2

+tγ

2

 

ω)

 

 

 

 

 

 

 

 

 

ω(1

Пример 5.9. Найти объем повторной и бесповторной выборок из 10000 банок консервов для определения доли банок, не соответствующих стандарту. Предпо-

26

лагается, что предельная ошибка выборки равна 0,05 с доверительной вероятно-

стью 0,99.

Решение

По условию N =10000;δ = 0,05; γ = 0,99.

Для повторной выборки согласно таблице 3 n = tγ 2ω(12ω) .

δ

Находим по таблице функции Лапласа. tγ =2,58.

Тогда n

=

 

2,582

ω(1ω)

= 2662,56ω(1ω) .

 

 

 

 

 

 

 

 

 

 

 

 

0,052

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как

ω неизвестно, выберем его таким,

чтобы

значение выражения

ω(1ω)

было

 

максимальным,

 

т.е.

 

 

ω = 0,5.

 

Тогда

n = 2662,56 0,5 0,5 = 665,64 665.

 

 

 

 

 

 

 

 

 

 

 

 

Аналогично для бесповторной выборки n =

t2ω(1ω)N

=

 

Nt2

 

.

Nε

2

+t

2

(1ω)

 

Nε

2

 

 

 

 

 

 

 

 

 

 

 

ω

 

 

 

+t2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ω(1ω)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Очевидно, и в этом случае наибольшее значение выражения ω(1ω)

соот-

ветствует максимальному значению n .

 

 

 

 

 

 

 

 

 

 

 

 

Тогда n

 

 

2,5820,5 0,5 10000

. ►

 

 

 

 

 

 

 

 

 

 

=

 

 

624

 

 

 

 

 

 

 

 

 

 

10000 0,052 + 2,5820,5 0,5

 

 

 

 

 

 

 

 

 

 

5.5. Интервальная оценка дисперсии нормального распределения

Для построения интервальной оценки параметра σ 2 воспользуемся тем

фактом, что статистика

ns2

подчинена χ2 - распределению (хи-квадрат) с n 1

 

σ 2

 

степенями свободы. Поэтому, определив из таблиц процентные точки χ2 - распределения с n 1 степенями свободы χ12+γ (n 1) и χ12γ (n 1), имеем неравенст-

 

< ns2

2

2

во χ12γ (n 1)

< χ12+γ (n 1).

 

2

σ 2

2

 

 

 

Разрешая это неравенство относительно σ 2 , получаем, что случайный доверительный интервал

 

 

 

 

 

 

27

 

 

 

 

2

 

 

2

 

 

 

 

ns

 

ns

 

 

(5.6)

 

 

;

 

 

 

 

2

 

2

 

1)

 

 

 

χ1γ (n 1)

 

χ1+γ (n

 

 

 

2

 

 

2

 

 

 

 

накрывает неизвестное значение σ 2 с заданной вероятностью γ .

Пример 5.10. При анализе точности фасовочного автомата было проведено n = 24 контрольных взвешиваний пятисот граммовых пачек кофе. Известно, что ошибки в расфасовке автомата подчиняются нормальному распределению с пара-

метрами a = 0 и неизвестной дисперсией σ 2 . По результатам измерений рассчитано выборочное среднее квадратическое отклонение s = 0,8г. требуется с дове-

рительной вероятностью γ = 0,95 оценить точность фасовочного автомата,

т.е.

определить интервальную оценку σ .

 

 

 

 

 

 

 

 

 

 

Решение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

24 0,8

 

24 0,8

 

 

 

 

По

 

формуле

(5.6)

имеем

 

 

;

 

 

 

или

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ10,95 (24 1)

 

χ1+0,95 (24 1)

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

24 0,82 24 0,82

 

 

 

 

 

 

 

 

 

 

 

 

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

38,1

11,7

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак,

с доверительной вероятность γ = 0,95 можно утверждать,

что среднее

квадратическое отклонение σ будет находится в интервале (0,632;1,146) . ►