- •С. Б. Волкова математическая статистика и планирование эксперимента
- •§ 2. Интервальные оценки . . . . . . . . . . . . . . . . . . . . . . . . . 50
- •§ 3. Проверка статистических гипотез . . . . . . . . . . . . . . . . 58
- •§ 2. Доверительные интервалы для параметров
- •§ 3. Полные факторные эксперименты типа 2k.
- •§ 4. Оптимизация планов. Поиск экстремума
- •Предисловие
- •Введение
- •§ 1. Математическая модель статистического эксперимента
- •§ 2. Случайные величины
- •Глава 1. Элементы математической статистики
- •§ 1. Выборочный метод. Точечные оценки
- •§ 2. Интервальные оценки
- •§ 3. Проверка статистических гипотез
- •2. Проверка гипотезы о равенстве дисперсий двух нормально распределенных случайных величин.
- •§ 4. Однофакторный дисперсионный анализ
- •§ 5. Элементы теории корреляции
- •Глава 2. Планирование эксперимента
- •§ 1. Пассивный эксперимент
- •7. Оценивание функции отклика и ее параметров.
- •§ 2. Доверительные интервалы для параметров функции отклика и гипотеза адекватности
- •§ 3. Полные факторные эксперименты типа 2k . Анализ факторных экспериментов
- •4. Насыщенное и ненасыщенное планирование.
- •§ 4. Оптимизация планов. Поиск экстремума функции отклика
- •Для распределения 2 с n степенями свободы
- •Критические точки критерия 2:
- •Критические точки критерия 2:
- •Литература для дополнительного чтения
- •Светлана Борисовна Волкова математическая статистика и планирование эксперимента
- •162600, Г. Череповец, пр. Луначарского, 5.
§ 2. Интервальные оценки
1. Доверительные интервалы. Недостаток точечных оценок состоит в том, что неизвестно, с какой точностью они приближают оцениваемый параметр. Если для большого числа наблюдений точность обычно бывает достаточной для практических выводов, то для выборок небольшого объема вопрос о точности является существенным. Этот вопрос решается с помощью так называемой интервальной оценки. Именно, для неизвестного параметра подбирается интервал так, чтобы с большой вероятностью выполнялось соотношение . На практике 1 и 2 определяются выборкой значений случайной величины, т. е. 1 1(x1, x2, ..., xn), 2 2(x1, x2, ..., xn), а значит, являются случайными величинами. Отсюда следует, что есть событие, имеющее определенную вероятность.
Определение. Пусть 0 < < 1. Если выполняется неравенство l , то и называют доверительными границами, а сам интервал – доверительным интервалом для параметра с надежностью .
Надежность интервальной оценки в соответствии с практической задачей принято выбирать в пределах от 0,95 до 0,999. Тогда вероятность того, что данный параметр не попадет в доверительный интервал, находится в пределах от 0,001 до 0,05. Если считать такое событие практически невозможным, то практически достоверно попадание параметра в доверительный интервал . Следовательно, можно положить с точностью .
2. Доверительный интервал для математического ожидания нормального распределения при известной дисперсии. Пусть случайная величина распределена по нормальному закону и известна дисперсия . Обозначим и, используя выборку x1, x2, ..., xn, найдем интервальную оценку для параметра a, имеющую заданную надежность . Элементы выборки являются независимыми случайными величинами, распределенными так же, как и , поэтому их сумма, а значит, и среднее арифметическое распределено по нормальному закону, причем , (см. п. 6 § 1). Значит, функцией распределения для является , где .
Отсюда при любом > 0 имеем , так что интервал является доверительным интервалом для параметра a с надежностью .
Подберем теперь так, чтобы выполнялось равенство , или, что равносильно, . Так как функция непрерывна и на промежутке возрастает от 0 до 1/2, то для любого числа , удовлетворяющего условию 0 < < 1, существует единственное число такое, что . Положим , тогда , так что доверительный интервал для параметра a с заданной надежностью имеет вид
.
Пример. Случайная величина распределена по нормальному закону и имеет дисперсию 2 4. Имеется выборка объема n 25, для которой получено . Найдем с надежностью 0,95 доверительный интервал для неизвестного параметра .
Имеем . Используя таблицу значений функции (табл. 2), находим . Следовательно, , доверительный интервал: (11,516; 13,084), a 12,3 0,8.
3. Законы распределения 2 и Стьюдента. Определение 1. Случайная величина называется распределенной по закону 2 (хи‑квадрат), если она представляется в виде суммы , где случайные величины 1, 2, ..., n попарно независимы и распределены по нормальному закону с параметрами Mk 0, Dk 1 (k 1, 2, …, n).
Число n называют числом степеней свободы распределения 2.
Обычно пишут , т. е. для обозначения случайной величины, распределенной по закону 2, используют одно и то же выражение, хотя она зависит как от числа слагаемых n, так и от самих слагаемых.
Можно доказать, что случайная величина 2 непрерывна; ее плотность вероятностей f (x) при x m 0 равна нулю (поскольку 2 не принимает отрицательных значений), а при x > 0 она имеет довольно сложное выражение: , где – так называемая гамма-функция.
Рассмотрим важные случаи распределения 2.
(а) Пусть – попарно независимые случайные величины, распределенные по нормальному закону, Mk ak, Dk (k 1, 2, …, n). Тогда величины также попарно независимы и распределены по нормальному закону. При этом для каждого k 1, 2, …, n имеем M 0, D 1. Поэтому – случайная величина, распределенная по закону 2 с n степенями свободы.
(б) Пусть и – независимые случайные величины, распределенные по закону 2 соответственно с m и n степенями свободы. Тогда имеем и , где все 1, 2, ..., mn – попарно независимые случайные величины, распределенные по нормальному закону, причем Mj 0, Dj 1 ( j 1, 2, …, m + n). Поскольку , получаем, что сумма распределена по закону с числом степеней свободы m + n.
(в) Пусть – случайная величина, распределенная по нормальному закону, , – выборка значений и s2 – исправленная выборочная дисперсия, получающаяся для этой выборки по формуле (5) § 1. Рассмотрим при n > 1 случайную величину
.
Случайные величины в скобках распределены по нормальному закону (т. к. xk и распределены по нормальному закону), при этом , однако < 1. К тому же эти случайные величины зависимы, т. к. . Однако можно доказать, что существуют независимые случайные величины 1, 2, ..., n–1, линейно выражающиеся через x1, x2, ..., xn (а значит, распределенные по нормальному закону) и такие, что , причем Mk 0, Dk 1 (k 1, 2, …, n – 1). Поэтому случайная величина распределена по закону 2 с n – 1 степенями свободы.
Определение 2. Случайная величина называется распределенной по закону Стьюдента с n степенями свободы, если она представляется в виде , где и – независимые случайные величины, из которых первая распределена по нормальному закону с параметрами M 0 и D 1, а вторая – по закону с n степенями свободы.
Можно доказать, что случайная величина, распределенная по закону Стьюдента, непрерывна и имеет плотность вероятностей .
При эта функция стремится к , так что при неограниченном возрастании n распределение Стьюдента приближается к нормальному.
4. Доверительный интервал для дисперсии нормального распределения. Пусть случайная величина распределена по нормальному закону. Построим интервальную оценку для неизвестной дисперсии M c заданной надежностью , используя выборку значений , которые опять предполагаются независимыми случайными величинами, распределенными так же, как и .
Для этого рассмотрим случайную величину , распределенную по закону с n – 1 степенями свободы (см. п. 3 (в)). Пусть F – функция распределения этой случайной величины.
Поскольку функция F возрастает и непрерывна (т. к. является непрерывной случайной величиной), существуют и однозначно определены положительные числа y и z такие, что
, . (1)
Отсюда следует , т. е. . Неравенства , равносильны соответственно неравенствам и , так что получаем , значит, доверительный интервал для дисперсии с надежностью имеет вид
.
Для нахождения y и z, удовлетворяющих условию (1), используют таблицу корней уравнения . Так как и , то для отыскания y нужно положить , а для отыскания z нужно положить .
Пример. Пусть для определения неизвестной дисперсии случайной величины, распределенной по нормальному закону, сделана выборка объемом n 18. Найдем доверительный интервал для 2 с надежностью 0,96.
Имеем: , и в таблице 3 на пересечении строки, соответствующей числу степеней свободы 17, и столбца, соответствующего q 0,02, находим y = 7,3; , и по таблице находим z 31,0. Искомый доверительный интервал имеет вид .
5. Доверительный интервал для математического ожидания нормального распределения при неизвестной дисперсии. Пусть – случайная величина, распределенная по нормальному закону, и параметры M a и D 2 нам неизвестны. Пусть по результатам n испытаний найдены выборочное математическое ожидание и исправленная выборочная дисперсия s2. Введем в рассмотрение случайные величины и . Первая распределена по нормальному закону, причем M0 0, D0 , а вторая – по закону с n – 1 степенями свободы (см. п. 3 (в)). Следовательно, случайная величина распределена по закону Стьюдента с n – 1 степенями свободы. По заданной надежности можно найти такое число , чтобы выполнялось равенство:
. (2)
Неравенство в скобках равносильно двойному неравенству , которое, в свою очередь, равносильно следующему: . Поэтому (2) равносильно равенству , так что доверительный интервал для параметра a с надежностью имеет вид
.
Для решения уравнения (2) составлена таблица корней уравнения . Число x ищется на пересечении строки с номером, соответствующим числу степеней свободы случайной величины t, и столбца, соответствующего значению .
Пример. Пусть получена выборка объема n 25 значений случайной величины , распределенной по нормальному закону, и пусть для этой выборки , . Найдем доверительный интервал для параметра M a с надежностью 0,95.
Имеем . В таблице 4 на пересечении строки, соответствующей числу степеней свободы 24, и столбца, соответствующего 0,95, находим ;
.
Таким образом, требуемый интервал – .