Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3 курс / Фармакология / Миронов_А_Н_,_Бунатян_Н_Д_и_др_Руководство_по_проведению_доклинических

.pdf
Скачиваний:
23
Добавлен:
24.03.2024
Размер:
4.71 Mб
Скачать

Выборочная средняя и стандартное квадратичное отклонение Sx, являющиеся точечными оценками соответствующих параметров M и s генеральной совокупности, вычисляются по следующим формулам:

(1)

(2)

где xi — i значение оцениваемого признака, n — объем выборки, ∑ — знак суммирования по всем элементам выборки (i=1, … , n).

— выборочная дисперсия признака.

(3)

Величину отклонения выборочного показателя от его генерального параметра называют статистической ошибкой, для измерения этой ошибки некоторой статистики служат дисперсия или квадратичная (стандартная) ошибка статистики (нельзя путать соответственно с выборочными дисперсией и средним квадратичным отклонением).

Стандартная ошибка средней арифметической Sx может быть найдена по формуле:

(4)

На практике достаточно часто приходится сравнивать изменчивость признаков, выраженных разными единицами. В этих случаях используют относительные показатели вариации, например, коэффициент вариации CV. Этот показатель представляет собой среднее квадратичное отклонение, выраженное в процентах, от величины средней арифметической:

Этот показатель также является выборочным, и его ошибка может быть оценена по формуле:

(5)

Обычно варьирование признака считается средним, если величина коэффициента вариации находится в пределах от 10 до 25%.

Нормальный закон распределения полностью задается двумя статистическими параметрами — средним значением и стандартным отклонением (или дисперсией).

По известным выборочным характеристикам можно построить интервальную оценку, или доверительный интервал, в котором с той или иной вероятностью находится генеральный параметр. Вероятности, признанные достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей, называют доверительными. Обычно в медико-биологических исследованиях приемлемым является значение доверительной вероятности P=0,95. С доверительной вероятностью тесно связано понятие уровень значимости a, который вычисляется как разность a=1 – P.

Как известно из центральной предельной теоремы, независимо от распределения исходной совокупности, из которой извлечены выборки, выборочные средние имеют приближенно нормальное распределение. Таким образом, доверительный интервал для выборочного среднего значения находится между границами — t×sx и +t×sx, где t — коэффициент Стьюдента, величина, зависящая от объема выборки и от выбранного уровня значимости, определяется по таблицам распределения Стьюдента (таблица 1).

891

В данном случае число степеней свободы при пользовании таблицей вычисляется как f=n – 1. Иллюстрацию см. на рисунке 2.

Надо обратить внимание, что в некоторых руководствах по биометрии предлагается при построении доверительного интервала для генеральной средней в качестве значений t брать критические значения стандартного нормального распределения (таблица 7) или, другими словами, предельные значения распределения Стьюдента (таблица 1 для числа степеней свободы, равного бесконечности). Тогда наиболее часто используемым доверительным вероятностям соответствуют следующие табличные значения коэффициента: P1=0,95 соответствует Z=1,96; P2=0,99 — Z=2,58; P3=0,999 — Z=3,29. Однако такой метод применим только в том случае, если дисперсия изучаемой совокупности известна заранее. В случае неизвестной и оцененной по выборке дисперсии для построения доверительного интервала при оценке значения коэффициента Стьюдента по таблицам необходимо учитывать число степеней свободы.

При достаточно большом объеме выборки (n>30) можно считать, что истинное значение средней при уровне вероятности P=0,95 находится в пределах ±2×sx. При этом вероятность выхода истинного значения средней за пределы этих границ равна уровню значимости 0,05.

Пример 1.

Изучали влияние предварительного введения потенциального антигипоксанта на содержание креатинфосфата (ммоль/г) в ткани сердца и концентрацию молочной кислоты в крови (ммоль/л) у животных, подвергшихся действию острой гипоксии (подъем в барокамере на высоту 8000 м). Результаты приведены в таблице 11. Группа 1 — интактные животные, группа 2 — животные, перенесшие 30-минутную гипоксию, группа 3 — животные, перенесшие 30-минутную гипоксию на фоне введения антигипоксанта.

 

 

 

 

 

 

 

Таблица 11

Содержание креатинфосфата,

Исходное содержание

Прирост концентрации

 

мM/г

 

молочной кислоты, мM/л

молочной к-ты, мM/л

Группа 1

Группа 2

Группа 3

Группа 1

Группа 2

Группа 3

Группа 2

Группа 3

1

2

3

4

5

6

7

8

12

8

8

0,7

0,8

0,8

4

4

13

8

9

1,4

0,9

0,9

5

3

14

9

9

1,8

2,5

2,3

4

3,5

15

10

11

1,5

1,2

2,0

3,5

2

14

7

12

1,1

1,3

1,4

5

1

13

7

12

1,6

1,5

1,6

5

1,5

13

9

13

1,7

1,6

1,3

3,5

1

10

9

13

1,3

2,1

1,7

4

1,5

11

11

12

1,4

2,0

1,5

2

2

16

6

11

2,2

1,0

1,6

5

2

В качестве примера для расчета рассмотрим данные 1-го столбца таблицы 11. Выборочное математическое ожидание вычисляется по формуле

Выборочная дисперсия данного показателя равна Dx=3,2; среднее квадратичное отклонение

892

— ошибка коэффициента вариации; sCV=3,12 — ошибка вы-

борочной средней.

Коэффициент Стьюдента t в данном случае для числа степеней свободы f=10–1=9 и уровня значимости 5% равен 2,26 (таблица 1), 95% доверительный интервал для средней арифметической заключен между границами 13,1±2,26×0,57, таким образом левая граница интервала равна 11,81, а правая — 14,39.

Часто при анализе результатов доклинических исследований, предполагающих дизайн параллельных групп, средние групповые значения сопоставляются между собой или с показателями группы контроля; на основе такого сопоставления и делаются определенные выводы, ради которых проводятся исследования. Если исследователь просто сопоставляет средние значения, рассчитанные по малым выборкам, без учета их случайной природы, возникает реальная опасность ошибочных заключений. Необходимо иметь в виду, что разность средних арифметических двух выборок, каждая их которых имеет свою ошибку, также является случайной величиной со своей стандартной ошибкой. Сопоставление выборочных средних арифметических, рассчитанных на основе ограниченного количества наблюдений, позволяет оценить лишь доверительные границы, в пределах которых при данном уровне значимости находится разность истинных средних значений, — метод доверительных интервалов. Такие сопоставления методами математической статистики могут также делаться с помощью тестирования статистической гипотезы о равенстве средних значений выборок.

2.Статистические гипотезы и их проверки

Опреимуществе той или иной из сравниваемых групп судят обычно по разности между средними значениями, средними долями, другими выборочными показателями или распределениями — величинами случайными и являющимися статистическими выборочными оценками соответствующих генеральных показателей. Вопрос о достоверности различий может решаться на основе проверки по выборочным характеристикам той или иной статистической гипотезы.

В области биомедицинских исследований широкое применение получила так называемая нулевая гипотеза . Смысл ее в случае сравнения групповых средних значений сводится к предположению, что разница между генеральными параметрами сравниваемых групп равна нулю и что различия, наблюдаемые между выборочными характеристиками, носят исключительно случайный характер. Так, например, если одна выборка извлечена из нормально распределенной генеральной совокупности с параметрами (среднее значе-

ние и стандартное отклонение) M1 и s1, а другая — из совокупности с параметрами M2 и s2, то нулевая гипотеза состоит в том, что M1 = M2, то есть M1 — M2 = 0. Противоположная нулевой — альтернативная гипотеза — состоит в том, что средние считаются либо просто

неравными M1 — M2 ≠ 0 (двусторонний тест), либо исследователь ориентирован в направлении эффекта одного метода над другим, а возможность преимущества другого исклю-

чается, например, M1 > M2 (односторонний тест). При таком подходе не ставится задача количественной оценки имеющихся различий, достаточно лишь проверить, принадлежат ли обе группы с определенной вероятностью к различным генеральным совокупностям. Надо заметить, что при решении других статистических задач нулевая гипотеза будет иметь другую формулировку. Обычно нулевая гипотеза формулируется в соответствии с целью исследования как утверждение, которое хотелось бы отвергнуть, а альтернативная гипотеза — к которому хотелось бы прийти по результатам проведенного исследования.

Проверяется статистическая гипотеза с помощью величин или, другими словами, статистик, функции распределения которых известны и табулированы (например, t-распределение Стьюдента, распределение c2 и др.). Эти величины в каждом конкретном случае позволяют выявить, удовлетворяют ли выборочные показатели выдвинутой

893

гипотезе. Процедура проверки гипотезы связана с объемом выборки (или соответствующим числом степеней свободы f) и понятиями ошибки I и II рода. Так, вероятность ошибки I рода — возможность ошибочно отклонить нулевую гипотезу, то есть найти различия там, где их нет (ложноположительный результат). Приемлемая для данного эксперимента ошибка I рода называется уровнем значимости a. Уровень значимости, или вероятность ошибки I рода, допускаемой при оценке принятой гипотезы, может различаться (5; 1; 0,1 %), но в медико-биологических приложениях, если специально не оговорено другое значение, он обычно принимается равным 5%. Ошибка II рода возникает, когда мы принимаем нулевую гипотезу, а она неверна, другими словами, не находим существующее различие (ложноотрицательный результат). Вероятность ошибки II рода обозначается буквой β, обычно ее величина в исследовании 10–20 %.

Важным является также вопрос о справедливости нулевой гипотезы. Для оценки справедливости H0 рассчитывается показатель, который обычно обозначается буквой p. Он оценивает вероятность того, что значение критерия окажется не меньше критического значения при условии справедливости нулевой гипотезы, то есть при отсутствии различий между сравниваемыми группами. Поэтому, если в результате проверки нулевой гипотезы она было отвергнута на уровне значимости a, то для отражения наличия статистически значимых различий результат сравнения может быть записан в виде p<a. Это означает, что ошибка сравнения возможна не более чем в a×100 % случаев, а значит, маловероятна. Больше информации о результатах проверки статистической гипотезы содержится в записи вида двойного неравенства, например (0,01<p<0,05).

Для проверки гипотез в биометрии возможны два вида критериев: параметрические (построенные на основании параметров данной совокупности) и непараметрические (построенные непосредственно по вариантам данной совокупности и их частотам). Первые служат для проверки гипотез о параметрах совокупности, распределенных по известному закону (обычно в биометрии по нормальному закону), вторые — для проверки гипотез независимо от формы распределения совокупностей. Так, при нормальном распределении признака параметрические критерии обладают большей мощностью, чем непараметрические, поэтому, если известно, что сравниваемые выборки извлечены из приближенно нормально распределенных совокупностей, предпочтение следует отдавать параметрическим критериям. В случае значительных отклонений распределения признака от нормального закона, а также при малых объемах выборки рекомендуется применять непараметрические критерии. Если признаки выражаются не количественными переменными, а качественными с числом градаций больше двух, применение непараметрических критериев оказывается единственно возможным. Проверить, извлечена ли рассматриваемая выборка из нормально распределенной совокупности в свою очередь можно с помощью специальных статистических тестов. Кратко познакомим с некоторыми из них.

3. Проверка гипотезы о законах распределения

Гипотезу о законе распределения проверяют разными способами, например, с помощью коэффициентов асимметрии и эксцесса. С формулами для расчета этих показателей можно познакомиться, например, в [7, 9, 12, 19, 20]. При нормальном распределении эти показатели должны быть равны нулю. Однако на практике такое равенство почти не встречается, так как эти показатели также являются случайными величинами, имеющими ошибки. Поэтому для проверки нормальности распределения рекомендуется использовать соответствующие таблицы, в которых указаны критические точки для этих коэффициентов при различных уровнях значимости и объемах выборки n. Если наблюдаемые значения для коэффициентов асимметрии и эксцесса превосходят эти критические точки, гипотеза о нормальности распределения отвергается.

Кроме того, для оценки меры совпадения теоретической кривой распределения с фактическими данными на практике часто используется критерий согласия χ2 (Хи-

894

квадрат). Полученные в ходе эксперимента результаты представляются в виде вариационного ряда или ряда распределения. Вариационный ряд представляет собой двойной ряд чисел, показывающий для каждого значения признака (варианты), сколько раз оно(она) встречается в данной совокупности (частота варианты). Это определение в большей мере относится к так называемому безынтервальному вариационному ряду. Однако, если общую вариацию признака (в пределах от минимальной до максимальной варианты) разбить на промежутки и подсчитать частоту попадания вариант данной совокупности в эти интервалы, получится интервальный вариационный ряд. Графически вариационные ряды обычно представляются в виде гистограмм частотного распределения.

Данный критерий согласия эффективен при условии наличия не менее 50 элементов в выборке и при наличии хотя бы 1 попадания значения в каждый интервал вариационного ряда [19]. Если же в каком-нибудь интервале вариационного ряда не содержится частот, то этот класс объединяется с соседним классом. Общая формула этого критерия выглядит как:

(6)

где f — фактические частоты, оцененные по изучаемой выборке, ft — частоты, рассчитанные по теоретическому распределению.

Для оценки полученной величины Хи-квадрат необходимо знать число степеней свободы, которое зависит от того, какой тип теоретического распределения участвует в расчетах. Так при нормальном распределении число степеней свободы f=k–3, где k — число интервалов ряда. Вычисленное значение χ2 не должно превышать табличное (таблица 2) при данных значениях f и a, тогда мы имеем право сделать вывод о несущественном различии теоретического и эмпирического распределений. При полном совпадении эмпирических частот с вычисленными значение Хи-квадрат было бы равно 0.

Пример 2.

Проиллюстрируем применение критерия согласия Хи-квадрат для проверки нормального закона распределения, используя данные столбцов 4–6 таблицы 11 (исходное содержание молочной кислоты). Данные этих трех столбцов могут быть объединены в одну обобщенную выборку, поскольку исходно все животные были однородны. Таким образом, мы получаем выборку объемом n=30 (малый объем выбран для наглядности вычислений) и хотим проверить, является ли она выборкой из генеральной совокупности, распределенной по нормальному закону. Среднее значение нашей выборки равно 1,49 , а среднее квадратичное отклонение — 0,46. Ранжируя обобщенную выборку в порядке возрастания, видим, что значения изучаемого показателя варьируются от 0,7 до 2,5. Построим интервальный вариационный ряд: диапазон значений данного показателя [0,5; 2,5] разобьем на интервалы длиной 0,5 (получили 4 интервала) и определим частоту попадания вариант нашей выборки в соответствующие интервалы (см. таблицу 12, 1–2 столбцы). Поскольку табулировано (таблица 10) распределение нормальной случайной величины с нулевым математическим ожиданием и единичной дисперсией (стандартная нормальная переменная), проводим стандартизацию нашей переменной xi (вычитаем среднее значение из величин xi, делим результат на среднее квадратичное отклонение), полученное значение заносим в 3 столбец таблицы 12. Для значений стандартизованной переменной определяем соответствующие ординаты кривой нормального распределения (столбец 4). Теоретические частоты нормального распределения (столбец 5) получаем, умножая ординаты нормальной кривой из столбца 4 на произведение объема выборки (30) и ширины интервала (0,5), а затем деля результат на среднее квадратичное отклонение (0,46). Надо заметить, что это достаточно удобный, но не единственный способ расчета теоретических частот нормального распределения.

895

 

 

 

 

Таблица 12

Центр

Фактические

Стандартизованная

Ординаты

Теоретические

интервала xi

частоты

переменная

нормальной кривой

частоты

0,75

6

-1,61

0,1092

3,7

1,25

11

-0,52

0,3485

11,5

1,75

9

0,57

0,3391

11,2

 

 

 

 

 

2,25

4

1,65

0,1023

3,5

В таблице 12 и на рисунке 3 показаны распределения теоретических и фактических частот распределения. Каждое слагаемое для критерия согласия χ2 представляет собой разницу между соответствующими фактическими и теоретическими частотами, возведенную в квадрат и деленную на значение теоретической частоты, в нашем примере критерий χ2 =1,95. В данном случае выборочное и теоретическое распределения различаются несущественно, так как рассчитанная величина статистики χ2 не превышает табличное значение 3,84 (таблица 2), взятое для числа степеней свободы f=4–3=1 и уровня значимости a=5%. Таким образом, можно сделать вывод, что с вероятностью более 95% наша выборка извлечена из совокупности, распределенной по приближенно нормальному закону.

Кроме того, для проверки статистически значимых отклонений выборочного распределения от нормального закона используется и критерий Колмогорова—Смирнова. Более подробно с различными тестами для проверки гипотез о законе распределения можно ознакомиться, например, в [7, 9, 12, 18–20].

4. Первичная обработка результатов

Построение рядов распределения — один из возможных способов описания полученных данных. А средняя арифметическая и дисперсия — одни из основных характеристик варьирующих объектов. Однако надо иметь в виду, что они не являются универсальными; для статистического описания данных в качестве обобщающих характеристик совокупности полезными (особенно если совокупность не распределена по нормальному закону) могут оказаться и так называемые структурные показатели. На практике часто используют такие структурные показатели, как медиана, мода, квантили (квартили, децили, перцентили), минимальное значение, максимальное значение, размах вариации и др. Подробнее об этом можно прочитать в [1, 9, 13, 18–20].

Так, медиана определяется как средняя, относительно которой упорядоченный ряд распределения делится на две равные части: в обе стороны от медианы располагается одинаковое число вариант. Для ранжированного ряда с нечетным числом членов центральная варианта и будет его медианой. При четном числе членов ряда медиана определяется по полусумме двух соседних вариант, расположенных в центре ранжированного ряда.

Еще одна структурная характеристика — мода. Так называется величина, наиболее часто встречающаяся в данной совокупности. В случае нормального распределения значения средней арифметической, медианы и моды совпадают.

Квантили — конкретная варианта совокупности, отсекающая в пределах вариационного ряда определенную часть (указывается в процентах) его членов. На практике используются обычно перцентили PЗ, P10, P25, P50, P75, P90 и P97. Причем P25 и P75 соответствуют первому и третьему квартилям, между которыми содержится 50 % элементов выборки, а P50 равен медиане. Формулы для расчета моды и квантилей для интервальных вариационных рядов содержатся, например, в [9,15,16].

Размах вариации равен разности между максимальным и минимальным вариантами совокупности.

При первичной обработке данных часто возникает ситуация — отдельные варианты, полученные в эксперименте выборки, по своим значениям сильно отличаются от осталь-

896

ных ее членов. Возможно, это произошло из-за погрешностей в постановке эксперимента. Проверка, принадлежит ли эта сомнительная варианта (outlier) изучаемой совокупности, делается с помощью специальных статистических критериев [1, 7, 9, 12, 15]. Однако решение об исключении резко отличающихся измерений из анализа принимается не на основе статистического тестирования. Если причина такого отклонения установлена, наблюдение может быть исключено как некорректное. Если причина отклонения неизвестна, проводится анализ чувствительности: расчет проводится в присутствии отличающегося наблюдения и еще раз после его исключения. Статистическое тестирование различий в получаемых на основе двух наборов данных результатах позволяет сделать вывод о влиянии исключения сомнительного наблюдения (анализ чувствительности).

Одним из таких статистических критериев для выявления резко отличающихся наблюдений в случае нормально распределенной выборки является проверка разностей между сомнительными и соседними членами ранжированного ряда [9]. Для этого вычисляются статистики

или

Первая для проверки наименьших x1, вторая — для наибольших xn сомнительных вариант ранжированного ряда. Гипотезу о принадлежности сомнительной варианты изучаемой совокупности отвергают, если соответствующее рассчитанное значение статистики превзойдет табличное значение (таблицы 3а и 3б) для выбранного уровня значимости и объема выборки №.

Другим возможным критерием в случае нормально распределенной выборки для проверки единственного отличающегося наблюдения может быть Q-тест Диксона (Dixon Q-test). В случае множественных отличающихся наблюдений может использоваться критерий Grubbs' T-test. Для проверки последовательно вычисляется критериальная

статистика T для наиболее отличающегося значения ( — расстояние от сред-

него значения в единицах стандартного отклонения) и сравнивается с табличным значением. Если проверяемое значение T превзойдет соответствующее табличное значение и будет признано резко отличающимся, то при необходимости последующих проверок процесс повторяется, начиная с расчета нового среднего значения по выборке с исключенной на предыдущем шаге вариантой.

Пример 3.

Для оценки перцентилей рассмотрим выборку из примера 1, ранжируем ее в порядке возрастания, получаем ряд: 10 11 12 13 13 13 14 14 15 16.

Медианой выборки (P50) будет среднее значение 5-й и 6-й варианты, то есть она равна 13, мода также равна 13 (это значение встречалось чаще других), P25 оценим как 12, соответственно P75 можно оценить как 14. В данном случае мы можем только оценить значения квартилей, поскольку точно обеспечить разбиение порядковых статистик на 4 подмножества равного размера с помощью квартилей (Р25, Р50, Р75) можно лишь в том случае, когда объем выборки имеет вид n=4k+3 (k — любое целое число). В этом случае квартилям соответствуют следующие варианты ранжированно-

го ряда: Р25 = Xk+1; Р50 = X2k+2; Р75 = X3k+3.

Максимальная варианта нашей выборки равна 16, а минимальная 10, размах равен 6. Статистические результаты исследования можно записать в форме Так в нашем примере эта запись будет выглядеть как 13,1±1,79(10÷16). Иногда применяется запись вида то есть в скобках указывают границы 95% доверительного интервала для средней арифметической. В нашем случае получаем запись 13,1±1,79(11,81 14,39).

Допустим, что в данном примере в результате неконтролируемых нарушений условий фиксации ткани в жидком азоте вместо какого-то из значений (например,

897

последнего) было получено значение 6. Эта варианта является сомнительной, ее значение существенно меньше остальных, проверим возможность ее исключения. Ранжированный вариационный ряд в данном случае будет выглядеть как 6 10 11 12 13 13 13 14 14 15.

Рассчитаем для сомнительной варианты статистику t1:

Критическое значение для статистики t1 (уровень значимости равен 5% и n=10) равно 0,41 (таблица 3а), а значит, рассчитанное значение критерия превосходит табличное. Нулевая гипотеза может быть отвергнута на выбранном уровне значимости, и проверяемое значение признается резко отличающимся наблюдением.

5. Параметрические критерии для проверки гипотез о различии (сходстве) между средними значениями в двух параллельных группах и о значимости средних изменений показателя (парные сравнения)

Наиболее распространенным параметрическим методом оценки различий между сравниваемыми средними является критерий Стьюдента, или t-критерий. Так как согласно нулевой гипотезе М1 — М2 = 0, то t — критерий выражается в виде отношения разности выборочных средних к ошибке такой разности, то есть

или

(7)

где σd — ошибка разности средних значений, σx1, σx2 — ошибки сравниваемых средних арифметических.

Гипотезу о равенстве математических ожиданий отвергают, если фактически полученная величина t-критерия превзойдет или окажется равной табличному значению (распределение Стьюдента, таблица 1) для принятого уровня значимости и числа степеней свободы f. При этом делается заключение о наличие статистически значимых различий между средними значениями при соответствующем уровне значимости.

Формулы для расчета тестовой статистики t и числа степеней свободы f несколько различаются в зависимости от равенства или неравенства дисперсий сравниваемых совокупностей. Этот вопрос требует внимательного рассмотрения, особенно для выборок малого объема (n<20).

В случае равенства дисперсий или выборок достаточно большого объема ошибка разности средних Sd определяется по следующим формулам:

Для неравночисленных выборок при n1≠n2,

(8)

Для равночисленных выборок при n1 = n2 формула несколько упрощается:

(9)

а число степеней свободы для случая равных дисперсий равно f=n1+n2–2.

Если хотя бы одна из сравниваемых выборок мала, то сначала следует проверить гипотезу о равенстве дисперсий выборок. В зависимости от ответа на этот вопрос последующее сравнение средних арифметических производят двумя различными способами.

898

Для проверки гипотезы о равенстве генеральных дисперсий пользуются критерием Фишера. При этом вычисляют показатель Фишера, равный отношению большей дисперсии к меньшей:

(10)

Показатель Фишера всегда F>=1, а при равенстве дисперсий F=1. Чем значительней неравенство, тем больше будет значение показателя и наоборот. Функция F табулирована [7, 9, 12, 15, 16] и зависит от чисел степеней свободы f1=n1–1, f2=n2–1. Если вычисленное значение F превысит соответствующее табличное значение и гипотеза о равенстве дисперсий будет отвергнута, то это означает, что выборки взяты из совокупностей с разными дисперсиями.

Итак, в случае несущественно различающихся или равных дисперсий средние арифметические сравниваются по формулам (7–9), приведенным выше.

А при различных по величине дисперсиях выборок разница средних арифметических оценивается по формуле t с числом степеней свободы:

(11)

(число степеней свободы округляется до целого числа),

(12)

Пример 4.

Допустим, что в ходе исследования были получены значения определенного параметра, характеризующего эффект изучаемого воздействия, для двух групп животных. Используя данные примера 1 (2 и 3 столбец таблицы 11) покажем, как можно сравнить две независимые выборки из нормально распределенных совокупностей, для получения ответа на вопрос о существовании статистически достоверных различий между их средними значениями. Поскольку значения генеральных параметров неизвестны, определим выборочные средние и дисперсии для обеих выборок. В нашем случае n1=10; n2=10;. Прежде всего, проверим по критерию Фишера гипотезу о равенстве дисперсий обеих выборок, F-отношение равно 3,1/2,28=1,36. По таблицам находим критическую точку для отношения Фишера в случае уровня значимости 5% и числа степеней свободы f1=f2=9, ее значение равно 3,18. Наше рассчитанное F-отношение не превышает табличное, то есть на 5% уровне значимости нулевая гипотеза о равенстве дисперсий остается в силе.

А значит, расчет критерия Стьюдента будем проводить по формулам 7 и 9 (случай равенства дисперсий и равночисленных выборок). Для двустороннего критерия Стьюдента определяем модуль разности между выборочными средними, он равен 2,6. Найдем ошибку разности средних:

Тогда значение t критерия Стьюдента равно t=2,6/0,73=3,56.

Для уровня значимости 5% и числа степеней свободы f=10+10–2=18 по таблице 1 находим критическое значение, равное 2,1. Так как вычисленное значение критерия превосходит соответствующее табличное, нулевая гипотеза отвергается на уровне значимо-

899

сти p<0,05. На принятом уровне значимости разница между результатами исследования в двух сравниваемых группах оказалась статистически достоверной.

Для сравнения двух зависимых выборок или выборок с попарно связанными вариантами (перекрестный дизайн, исследования изменений ДО — ПОСЛЕ) проверяют гипотезу о равенстве нулю среднего значения их попарных разностей. В этом случае оценкой разности между генеральными средними будет средняя разность, определяемая из суммы попарных разностей, то есть

(13)

Оценкой генеральной дисперсии разности средних будет выборочная дисперсия

(14)

где di = X1i — X2i — попарные разности связанных вариант, n — число парных наблюдений. Ошибку средней разности определяют по формулам:

 

(di d)2

(15)

σd =

 

.

n(n −1)

 

 

Если члены генеральной совокупности распределяются нормально, то разности между ними будут также распределяться нормально. Поэтому для проверки нулевой гипотезы о равенстве средних значений рассчитывается тестовое отношение

t = d / Sd,

(16)

которое проверяется по таблицам Стьюдента (таблица 1) для выбранного уровня значимости и числа степеней свободы f = № – 1. Нулевая гипотеза отвергается для данного уровня значимости, если вычисленное значение превзойдет соответствующее табличное.

Пример 5.

Для примера сравнения выборок с попарно связанными вариантами рассмотрим результаты изменения содержания молочной кислоты в крови животных из примера 1. Для 2-й группы животных будем решать так называемую статистическую задачу «до и после», анализируя столбцы 5 и 7 таблицы 11. Таким образом, получаем две связанные выборки концентрации молочной кислоты в крови животных 2-й группы: исходно и после подъема в барокамере:

 

 

Таблица 13

Группа 2 — ДО

Группа 2 — ПОСЛЕ

Попарные разности di=X1i — X2i

0,8

4,8

4,0

0,9

5,9

5,0

2,5

6,5

4,0

1,2

4,7

3,5

1,3

6,3

5,0

1,5

6,5

5,0

1,6

5,1

3,5

2,1

6,1

4,0

2,0

4,0

2,0

1,0

6,0

5,0

900