Гусев / Методы научных исследований
.pdfЧто бы принять или отвергнуть гипотезу задаются уровнем значимости p (обычно одним из значений: 0,05;0,1;0,01). Уровню значимости соответствует некая доверительная вероятность β = (1 − p). По β , используя гипотезу о распреде-
лении оценки θ x , находятся доверительные границы θp и
2
θ1−p 2 , которые составляют критические значения гипотезы.
Значения θ x больше чем θ1−p 2 и меньше θp 2 образуют «кри-
тическую область». Если найденное при выборке значение θо попадает в интервал от θp 2 до θ1−p 2 , то гипотеза допускает
такое значение в качестве случайного и поэтому нет основания ее отвергать. Если же найденное значение θо попадает в критическую область, то по гипотезе оно является практически невозможным. Но так как оно появилось, то отвергается сама гипотеза.
3.6. Оценка математического ожидания нормально распределенной случайной величины
При отсутствии грубых и систематических ошибок математическое ожидание случайной величины совпадет с истинным результатом наблюдений.
Если не известна дисперсия генеральной совокупности σx2 , то используют выборочную дисперсию Sx2 . Ошибка от замены тем меньше, чем больше объем выборки n . На практике эту погрешность не учитывают при n ≥ 50 .
При небольших объемах выборки для построения доверительного интервала математического ожидания используют распределение Стьюдента t :
t = |
x − mx |
n |
Sx |
51
Если дисперсия Sx2 и среднее x определены по одной и то же выборке, то число степеней свободы плотности вероятности f (t) распределения Стьюдента равно f = (n −1).
Распределение Стьюдента зависит только от числа степеней свободы, с которым определяется выборочная дисперсия Sx2 . При числе степеней свободы стремящемся к бесконечности f → ∞, выборочная дисперсия стремится к дисперсии генеральной совокупности Sx2 →σx2 и распределение Стьюдента сближается с нормальным.
Вероятность того, что случайная величина попадет в интервал (t p2 ;t1−p2 ), определяется выражением:
P(t p2 ≤ t ≤ t1−p2 )=1− p = β .
Доверительные оценки для математического ожидания составляют:
mx ≤ x ± Snx t1−p .
3.7. Сравнение двух дисперсий
При сравнении двух дисперсий проверяется гипотеза: являются ли сравниваемые выборочные дисперсии оценками одной и той же генеральной дисперсии?
Пусть имеются две выборки случайной величины x объёмами соответственно n1 и n2 :
′ |
′ |
|
′ |
|
′ |
|
′ |
, |
x1 |
, x2 |
, x3 |
,...xi |
,......xn1 , |
||||
|
′′ |
′′ |
|
′′ |
|
′′ |
′′ |
, |
x1 , x2 |
, x3 |
,...x j |
,.....xn2 |
Средние значения каждой выборки равны x1 и x2 . Выборочные дисперсии:
∑n1 (xi′ − x1 )2
Sx21 = |
i=1 |
|
→ f1 = n1 −1 |
; |
|
n1 −1 |
|||
|
|
|
|
52
|
n |
|
|
|
∑2 |
(x′j′ − x2 )2 |
|
Sx22 = |
j=1 |
|
→ f2 = n2 −1. |
|
n2 −1 |
||
|
|
|
Необходимо определить, являются ли выборочные дисперсии Sx21 и Sx22 значимо различными или же их можно рассматривать как взятые из генеральных совокупностей с равными дисперсиями.
Предположим, что первая выборка сделана из генеральной совокупности с дисперсией σx21 , а вторая с σx22 . Проверяется гипотеза о том, что различие между σx21 и σx22 случайное, и дисперсии равны между собой σx21 =σx22 . Такая гипотеза называется «нуль - гипотезой» - Н0.
Что бы отвергнуть эту гипотезу необходимо доказать значимость различия Sx21 и Sx22 при выбранном уровне значимости p . В качестве критерия значимости используется критерий Фишера - F :
F = |
S 2 |
/σ 2 |
|
x1 |
x1 |
. |
|
2 |
2 |
||
|
Sx2 |
/σ x2 |
|
Распределение Фишера зависит от числа степеней свобо- |
ды, с которыми определяются выборочные дисперсии - f1 и
f2 . |
|
В Н0 -нулевой гипотезе σx21 =σx22 |
и σx21 σx22 =1, и следова- |
тельно: F = Sx21 Sx22 ; |
β = (1 − p) доверитель- |
При доверительной вероятности |
|
ная оценка величины F имеет вид: |
|
Fp2,(f 1; f 2) ≤ F ≤ F1−p2,(f 1; f 2)
или
S 2 S 2 ≤ F − ( ) ;
x1 x2 1 p, f 1; f 2
S2 S2 ≥1/ F − ( ) .
x1 x2 1 p, f 1; f 2
53
Если полученное дисперсионное отношение попадает в критическую область, то различие между дисперсиями надо считать значимым.
4. Метрологические проблемы анализа и моделирования в технических задачах
Математическое моделирование системы возможно, если значения выхода y будет измерено или хотя бы количественно упорядоченно.
Измерение - познавательный процесс, в котором на основе эксперимента получается информация о численном значении изучаемой величины. При этом сравнение одной величины Qi с другой однородной величиной εi приводит к результату:
γi = Qi εi .
Если свойства явления таковы, что к нему применимы понятия «больше или меньше», то такие свойства называются интенсивностями. Если большей интенсивности поставить в соответствие большее число, то установление таких правил ведет к количественному упорядочению. И соответственно оно переходит в измерение, если выполняется условие о равенстве промежутков между последовательными интенсивностями.
Система чисел или иных элементов, принятая для оценки измерения величин, называется шкалой. Шкалы делятся на: номинальные (классификационные), порядковые (ранговые) и количественные (метрические).
Простейшие - номинальные шкалы, допускают только взаимно-однозначные преобразования. Они позволяют разделить объекты на классы без указания их взаимного порядка. Например, классификация специальностей в ВУЗе - 2901, 2903, 2908. При этом название заменяется кодом.
54
Порядковые шкалы - упорядочивают объекты в определенной последовательности, однако без четкой единицы измерения. К ним можно отнести шкалы педагогических оценок, баллы, выставляемые за выступления в некоторых видах спортивных состязаний (гимнастика, фигурное катание) и т.д. Порядковые шкалы не дают возможность установить точные количественные соотношения между элементами, но числовые оценки по этим шкалам можно использовать для математического моделирования и даже для оптимизации объекта.
Количественные или метрические шкалы предполагают наличие эталонного единичного объекта, в качестве базы для сравнения явлений между собой и наиболее полно соответствуют процессу измерения.
Результаты измерения γi содержат погрешностиошибки измерения, которые возникают по различным причинам.
Ошибку измерения y можно представить как разность между истинным Yи и измеренным Yм значением величины:
y = Yи −Yм .
Ошибки измерения классифицируют на пять групп [1]:
1.Ошибки объекта исследования - изменением объекта во времени, его неоднородность в пространстве, влияние процесса измерения на состояние объекта.
2.Ошибки оператора, связанные с уровнем его квалификации и психофизиологическим состоянием (болезнь, усталость, реакция на раздражители).
3.Инструментальные ошибки, связанные с погрешностью измерительных приборов.
4.Методические ошибки - связанные с неправильными или упрощенными представлениями о закономерностях процесса, со степенью разработки методики проведения измерительных операций.
55
5.Ошибки, возникающие от влияния внешней среды на объект.
Совокупность ошибок составляет погрешность измерения h , которую можно условно разделить на две части: систематическую h(yi ) и случайную ξ(yi ).
Систематическая погрешность - определяется ошибками, величина которых во всех измерениях, проводящихся одним и тем же методом с помощью одних и тех же приборов, одинакова или изменяется по некоторому детерминированному (т.е. одной и той же причине вызывающее одно и тоже след-
ствие) закону. |
|
|
|
Знание |
источника |
возникновения ошибки и |
закона |
h(yi )= f (xi |
) позволяет устранить систематическую ошибку. |
||
Случайные ошибки |
ξ(yi ) - величина которых, |
во всех |
измерениях, проводящихся одним и тем же методом с помощью одних и тех же приборов, изменяется, причем вероятность появления ошибки ξ(yi ) меньше некоторой величины ξ(ya ) подчиняется соответствующему закону распределения:
F(ξ)= P(ξ ≤ ξa ).
Ошибка ξ(yi ) отражает объективный закон действительности и связана с воздействием на измеряемый параметр всех неучтенных факторов. Часто принимается гипотеза о том, что случайные ошибки независимых измерений подчиняются нормальному закону распределения.
Иногда различают и грубые ошибки, являющиеся следствием нарушения условий измерения. Они, как правило, исключаются из рассмотрения (см.п.2.3.3.)
Оценка истинного значения измеряемой величины всегда связана с определением ошибки измерения. Даже если измеряемая величина A не является случайной, то наличие в измеренном показателе случайной составляющей переводит ее
56
в категорию случайных величин. Поэтому для оценки значения A применимы все положения из математической статистики.
Любая физическая величина A имеет свое истинное значение a , хотя оно и неизвестное наблюдателю. На числовой оси a занимает определенное место. Если измеряемое значение величины A составит величину xa с некоторой погрешностью δx , то измерение можно считать удовлетворительным, если истинное значение a покрывается интервалом
(xa −δx ; xa +δx ).
Однако надо иметь ввиду, что местоположение измеряемой величины x на числовой оси тоже носит случайный характер и подчиняется соответствующему закону распределения. Следовательно, утверждение о покрытии измеряемым интервалом истинного значения a также носит случайный характер, вероятность которого соответствует доверительной вероятности β . Таким образом, ситуация с измерением может рассматриваться, как типичная задача проверки статистических гипотез.
Обычно принимается (если нет веских оснований для противоположного суждения), что ошибки измерения подчиняются нормальному распределению и вероятность β покрытия точки истинного значения a случайным x - интервалом (xa −δx ; xa +δx ) равна площади под кривой плотности распределения между точками границ интервала
Вероятность того, что случайный интервал полностью окажется либо правее, либо левее значения a составляет по β2 . Вероятность β - это вероятность ошибки первого рода при формулировании нуль-гипотезы: точка a находится вне x - интервала. Поэтому в соответствии с правилом проверки статистических гипотез, задается доверительная вероятность, с которой готовы принять гипотезу о накрытии неизвестного
57
значения измеряемой величины некоторым доверительным интервалом. Серединой доверительного интервала служит измеренное значение xa , а его ширина зависит от выбранной вероятности ошибки первого рода (или, что эквивалентно - от доверительной вероятности).
Ширина доверительного интервала вычисляется по распределению плотности вероятности. Уже отмечалось, что ошибки измерений распределяются, как правило, по нормальному закону. Но использование в данном случае распределения Гаусса не представляется возможным, та как неизвестно среднеквадратичное отклонение σ . Поэтому, для ограниченного числа измерений n используют распределение Стьюдента - t с плотностью:
|
д(n / 2) |
|
1 |
|
t 2 |
− |
n |
||
f (t) = |
|
+ |
2 |
|
|||||
|
|
. |
|||||||
|
π(n −1)д((n −1) / 2) |
|
|
|
|
||||
|
|
|
|
n −1 |
|
|
|
-∞≤ t ≤+∞
Распределение Стьюдента определяется только объемом выборки (числом измерений) n . Ширина доверительного ин-
тервала x и |
среднеквадратичное отклонение среднего |
|||||||
арифметического |
Sx связаны соотношением: |
|
||||||
|
t(1−p),n = |
x = |
|
|
x |
(4.1.) |
|
|
|
|
|
|
|
|
|||
|
|
Sx |
S |
|
/ n |
|
|
|
|
|
x |
|
|
||||
где t(1−p),n - критерий (коэффициент) Стьюдента, завися- |
||||||||
щий от доверительной вероятности |
и числа изме- |
|||||||
рений. |
|
|
|
|
|
|
|
|
Sx - среднее квадратичное отклонение. |
|
|||||||
Некоторые значения коэффициентов |
t(1−p),n |
приведены в |
таблице 4.1. Вероятность β попадания истинного значения a в заданный доверительный интервал:
P([x −t(1−p )n * Sx ]≤ a ≤ [x −t(1−p)n * Sx ]) =1− p .
58
|
|
|
|
Таблица 4.1 |
|
|
Коэффициенты Стьюдента |
|
|
||
N |
Доверительная вероятность β =1− p |
|
|||
|
0.9 |
0.95 |
|
0.99 |
|
2 |
6.30 |
12.2 |
|
63.2 |
|
3 |
2.9 |
4.3 |
|
9.9 |
|
7 |
1.94 |
2.8 |
|
4.6 |
|
10 |
1.83 |
2.3 |
|
3.3 |
|
40 |
1.68 |
2.1 |
|
3.0 |
|
60 |
1.67 |
2.0 |
|
2.6 |
|
∞ |
1.64 |
2.0 |
|
2.6 |
|
При решении практических задач в качестве доверительной вероятности обычно используют значения 0,90; 0,95 или 0,99. Выбор конкретного значения β зависит от решаемой задачи и получаемого решения.
Обычно стремятся получить доверительный интервал возможно более узким. Но если доверительная вероятность и погрешность каждого измерения заданы, то, как видно из соотношения (4.1.), на величину δx можно повлиять только числом измерений - n , так как ширина доверительного интервала пропорциональна корню квадратному из n .
В таблице 4.2. приведены размеры доверительного интервала x (в долях от σ x - среднеквадратичного отклонения) в зависимости от числа измерений при отмеченных выше доверительных вероятностях.
|
|
|
Таблица 4.2 |
|
Число измерений при доверительной веро- |
||
x = x σx |
|
ятности β |
|
|
0,9 |
0,95 |
0,99 |
2 |
3 |
7 |
11 |
1 |
9 |
18 |
31 |
0,2 |
154 |
387 |
668 |
0,1 |
648 |
1540 |
2659 |
59
Методика обработки результатов измерений предлагает формализованные процедуры, позволяющие оценить точность и достоверность полученных экспериментальных данных, и состоит в следующем [1]:
-определение приборных ошибок;
-выделение промахов (или грубых ошибок)
-определение ошибок прямых измерений;
-определение ошибок косвенных измерений;
-выделение доверительного интервала измеряемой величины;
-определение суммарной ошибки измерения;
В прямых (непосредственных) измерениях величина приборной ошибки δx определяется разрешающей способностью измерительного прибора и характеризуется классом точности i :
i = δx 100 ,
xmax
где xmax - предельное значение величины x которое можно измерить прибором.
Зная класс точности можно определить приборную ошибку:
δx = i * xmax /100 .
Класс точности прибора устанавливается по технической характеристике (паспорту). При отсутствии данных величина приборной ошибки не рассчитывается, а принимается равной половине цены деления шкалы.
Ошибки косвенных измерений δR величины R = f (x, y, z...), в случае, когда результаты прямых измерений независимы, вычисляются по формуле (4.2):
δR == ( |
dR |
)2 |
δx2 |
+ ( |
dR |
)2 |
δy2 |
+ ( |
dR |
)2 |
δz2 |
, |
(4.2) |
|
|
|
|||||||||||
|
dx |
|
|
dy |
|
|
dz |
|
|
|
60