Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
дз3.doc
Скачиваний:
18
Добавлен:
20.04.2015
Размер:
331.26 Кб
Скачать

10.3 Сравнение двух случайных выборок

Порядок выполнения работы: 1. Рассчитать по каждой серии оценку математического ожидания (МО), дисперсии, среднего квадратического отклонения (СКО). Для упрощения расчетов и организации контроля рекомендуется провести кодировку данных каждой серии по формуле Ui = (Xi - C) / h, где C - приблизительная середина диапазона изменения данных в серии; h подбирается так, чтобы Ui получились целыми. Для контроля вычислений весь расчет повторяют с другим значением C, результаты должны совпадать с точностью до возможных ошибок округления. ЗАМЕЧАНИЕ. Для упрощения расчетов по п.7 желательно чтобы одно из значений C в каждой из серий совпадали. 2. Для каждой серии измерений найти доверительные интервалы для МО и СКО. 3. Проверить гипотезу о равенстве дисперсий в двух сериях измерений. Если гипотеза отвергается, перейти к п.7. 4. Если гипотеза о равенстве дисперсий принимается, вычислить сводную оценку дисперсии (СОД) и перечислить доверительный интервал для СКО, используя СОД. 5. Проверить гипотезу о равенстве МО в двух сериях измерений. Если гипотеза отвергается, перейти к п.7. 6. Если гипотеза о равенстве МО принимается, вычислить сводную оценку МО и, соответственно, пересчитать доверительный интервал для МО. 7. Проверить гипотезу о нормальном распределении объединения двух серий измерений, используя интервалы равной вероятности. ВНИМАНИЕ. Оценка МО объединения серий совпадает со сводной оценкой МО, оценка же дисперсии объединения серий может не совпадать с СОД и её нужно рассчитать заново. 8. Построить гистограмму объединения двух серий измерений, используя интервалы равной длины. Количество интервалов взять равным L. 9. Сделать выводы. При нахождении доверительных интервалов принять доверительную вероятность P=0.95. При проверке статистических гипотез принять уровень значимости равным 0.05.

Конец формы

3 Сравнение двух случайных выборок (нахождение оценок параметров распределения, проверка статистических гипотез)

3.1 Теоретическое введение

3.1.1 Точечные оценки параметров распределенияРаспределение случайной величиныХхарактеризуется рядомпараметров(математическое ожидание, дисперсия и т.д.). Эти параметры называютпараметрами генеральной совокупности. Важной задачей математической статистики является нахождение по случайной выборке приближенных значений каждого из параметров, называемыхточечными оценками параметров, или простооценками. Таким образом,оценкой параметра β называется функцияf(X1,X2, ... ,Xn) от случайной выборки, значение которой принимается в качестве приближенного для данного параметра и обозначается:

β ≈ =f(X1,X2, ... ,Xn).

(3.1)

Пусть задана повторная случайная выборка X1,X2, ... ,Xn. За оценку математического ожидания aпринимается среднее арифметическое элементов выборки:

(3.2)

Оценкой дисперсииσ2принеизвестном математическом ожиданииявляется величинаS2, которую называютэмпирической дисперсией:

(3.3)

Оценкой среднего квадратического отклоненияσ при этом является, соответственно, величина

(3.4)

Для практических расчетов формулу (3.3) целесообразно преобразовать к следующему виду:

(3.5)

Вычисление среднего значения и оценки дисперсииS2упрощается, если отсчет значенийXiвести от подходящим образом выбранного начала отсчетаСи в подходящем масштабе, т.е. сделать линейную замену (кодирование):

Xi = C + hUi(i= 1, 2, ... ,n).

(3.6)

При такой замене формулы (3.2), (3.3), (3.4) принимают следующий вид:

(3.7)

(3.8)

Для контроля правильности вычислений весь расчет следует повторить при другом начале отсчета С: результаты должны совпадать с точностью до величины возможных ошибок округления.

3.1.2 Доверительные интервалы параметров нормального распределенияДоверительным интерваломпараметра β называется интервал со случайными границами (– ε1;+ ε2), который накрывает истинное значение параметра β с заданной вероятностьюP, которая называетсядоверительной вероятностью. Величина α = 1 –Pназываетсяуровнем значимости. При этом обычно требуют, чтобы вероятности выхода за границы доверительного интервала в обе стороны были равны между собой, а именно:P(β <– ε1) =P(β >+ ε2) = (1 –P)/2 = α/2. Это дополнительное требование обеспечивает единственность решения задачи. Пусть задана повторная случайная выборкаX1,X2, ...,Xnиз нормальной генеральной совокупности. Это означает, что результаты эксперимента независимы и подчиняются нормальному закону распределения с одинаковыми параметрамиXi ~ N(a; σ). С вероятностьюPматематическое ожидание принадлежит интервалу

aє (– ε,+ ε);

(3.9)

(3.10)

где – оценка математического ожидания (3.2);– оценка среднего квадратического отклонения σ (3.4);t1–α/2(k) – квантиль распределения Стьюдента сkстепенями свободы;n– объем выборки;k– число степеней свободы при вычислении оценкиS. Часто доверительный интервал для математического ожидания записывают символически:

α=± ε.

(3.11)

Доверительный интервал для среднего квадратического отклонения σ при доверительной вероятности P= 1 – α имеет следующий вид:

(3.12)

где S– оценка среднего квадратического отклонения σ (1.6) при неизвестном математическом ожидании; χP2(k) – квантиль распределения Пирсона сkстепенями свободы;k– число степеней свободы оценкиS.

3.1.3 Проверка статистических гипотезПустьХ– наблюдаемая случайная величина.Статистической гипотезой Нназывается предположение относительно параметров или вида распределения случайной величиныХ. Проверяемая гипотеза называетсянуль-гипотезойи обозначаетсяН0. При постановке нуль-гипотезы сразу ставитсяальтернативная гипотеза Н1, т.е. то предположение, которое следует принять, если нуль-гипотеза будет отвергнута. Правило, позволяющее принять или отвергнуть гипотезуН0– некоторая функция результатов экспериментаQ(X1,X2, ... ,Xn),распределение которой вполне определено при условии истинности гипотезы Н0. Пусть заданы две независимые выборки из двух нормальных генеральных совокупностей. Первая выборка имеет объемn1, элементы выборкиХi(1)~ N(a1; σ1); вторая – объем n2, элементы выборкиХi(2)~ N(a2; σ2). Необходимо проверитьгипотезу о равенстве дисперсийэтих двух генеральных совокупностей, т.е.Н0: σ12= σ22. Математические ожиданияa1иa2неизвестны. В этом случае по каждой выборке находят несмещенные оценки дисперсийS12иS22с числами степеней свободыk1=n1– 1 иk2=n2– 1 соответственно. Гипотезу проверяют по критерию Фишера, функция критерия

F = S12/S22

(3.13)

имеет F-распределение Фишера сk1иk2степенями свободы, т.е.F=F(k1,k2). Если альтернативная гипотезаН1: σ12≠ σ22, то критерий Фишера рассчитывается как отношение большей по величине оценки дисперсии к меньшей:

F = (Sбол)2/(Sмен)2> 1.

(3.14)

Гипотеза принимается при выполнении неравенства

F < F1–α/2(kSбол,kSмен),

(3.15)

в противоположном случае гипотеза отвергается. Здесь kSбол– число степеней свободы большей оценки дисперсии;kSмен– число степеней свободы меньшей оценки дисперсии. Если гипотеза о равенстве дисперсий принимается, то за оценку общей σ может быть взята, полученная по формуле для сводной оценки дисперсии:

(3.16)

где S12,S22– несмещенные оценки дисперсии первой и второй выборок соответственно. Пусть заданы две независимые выборки из двух нормальных генеральных совокупностей. Первая выборка имеет объемn1, элементы выборкиХi(1)~ N(a1; σ1); вторая – объемn2, элементы выборкиХi(2)~ N(a22). Математические ожиданияa1иa2неизвестны. Проверяемгипотезу о равенстве математических ожиданийэтих двух генеральных совокупностей, т.е.Н0:a1=a2. По каждой выборке находим оценки математических ожиданий1и2. При этом дисперсии σ12и σ22неизвестны, но гипотеза о равенстве дисперсий принимается;S12иS22– несмещенные оценки дисперсий первой и второй выборок. Находим сводную оценку дисперсии (3.16). Гипотеза проверяется по критерию Стьюдента, функция критерия

(3.17)

имеет t-распределение Стьюдента сkCBстепенями свободы, т.е.t=t(kCB); ­ ­kCB=k1+k2– число степеней свободы при вычислении оценки. При альтернативной гипотезеН1:а1а2, гипотеза принимается при выполнении неравенства

|t| <t1–α/2(kCB),

(3.18)

в противоположном случае гипотеза отвергается. Если гипотеза о равенстве математических ожиданий принимается, то за оценку общего математического ожидания может быть взята сводная оценка математического ожидания, которая определяется как средняя по обеим выборкам:

.

(3.19)

Доверительный интервал для математического ожидания при этом можно пересчитать, заменив в формулах (3.10) – (3.11) наCB;SнаSCB;kнаkCB=k1+k2,nнаn1+n2.

3.1.4 Проверка гипотезы о виде распределения генеральной совокупностиЕсли распределение случайной величиныХне известно, можно рассмотреть гипотезу о том, чтоХимеет функцию распределенияF(x). Критерии значимости для проверки таких гипотез называютсякритериями согласия. ПустьX1,X2, ... ,Xn– выборка наблюдений случайной величиныХ. Проверяется гипотезаН0, утверждающая, чтоХимеет функцию распределенияF(x). Проверку гипотезыН0при помощи критерия χ2проводят следующим образом. По выборке находят оценки неизвестных параметров предполагаемого закона распределения случайной величиныХ. Область возможных значений случайной величиныХразбивают наlинтервалов. Подсчитывают числаniпопаданий результатов экспериментов в каждыйi-й интервал. Используя предполагаемый закон распределения случайной величиныХ, находят вероятностирiтого, что значениеХпринадлежитi-му интервалу. Затем сравнивают полученные частотыni /nс вероятностямирi. Критерий согласия Пирсона требует принятия гипотезы о пригодности проверяемого распределения с уровнем значимости α, если значениевзвешенной суммы квадратов отклонений

.

(3.20)

меньше квантиля распределения χ2-распределения сk = l– 1 степенями свободы, т.е. χ2< (χ1–α)2(k), в противоположном случае эта гипотеза отвергается, как противоречащая результатам эксперимента. Если при этом некоторые параметры распределения оценивают по результатам той же выборки, то квантиль χ2-распределения следует брать дляk = l– 1 –mстепеней свободы, гдеm– число оцениваемых параметров.

3.1.5 Построение гистограммы (эмпирической функции распределения)Для наглядного представления о выборке часто используют график, называемыйгистограммой. Для построения гистограммы интервал, содержащий все элементы выборки, разбивают наlнепересекающихся интервалов (как правило, равной длины). Подсчитывают числаniпопаданий результатов экспериментов в каждыйi-й интервал и строят столбиковую диаграмму, откладывая по оси ординат значения средней плотностиni/(nhi), гдеhi– длинаi-го интервала. Площадь каждого столбика равнаni /n, что соответствует относительной частоте попадания элементов выборки вi-й интервал. Площадь под всей ступенчатой фигурой равна единице. При увеличении объема выборки и уменьшении интервалов группировки гистограмма приближается к функции плотности генеральной совокупности. Гистограмма является эмпирической функцией плотности, она дает приближенную функцию плотности генеральной совокупности (ее оценку) по случайной выборке.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]