Практическая работа № 4 по основам медико-биологической статистики.
Задание 1. Выучить, описать словами порядок действий, задаваемый формулами.
Техника построения вариационного ряда.
Собирают исходные данные для статистического анализа.
Далее призводится группировка исходных данных в статистические ряды – ряды числовых значений признака, расположенных в определённом порядке.
Статистические ряд:
1) атрибутивный;
(число людей с группой крови)
2) вариационный (или ряд распределения);
Двойной ряд чисел, показывающий, каким образом числовые значения признака () связаны с их повторяемостью (– частота или вес (веса) вариант(а),Относительные частоты или частости).
3) временной.
Находят:
1. ;
2. По формуле Старджеса (1926): К = ,(15-20)!
3. величина классового интервала ,
а) Если значения признак выражены целыми числами и классовый интервал окажется равным единице или может быть приравнён (приравнен) к единице, выборка распределяется в безынтервальный вариационный ряд.
б) , выборку следует распределять в интервальный вариационный ряд,
, если
При построении классового интервала следует добиваться того, чтобы минимальная варианта попадала в середину первого классового интервала., где– нижняя граница первого классового интервала.
Разнести варианты по классам. Допустимо в один и тот же класс помещать варианты, которые больше нижней, но меньше или равны его верхней границе.
Средние величины, показатели вариации вычисляются на безынтервальных рядах, то интервальный ряд приходится превращать в ряд безынтервальный. Это достигается заменой классовых интервалов центральными или срединными значениями они определяются по полу сумме нижних границ предыдущего и последующего классов.
Медиана (Ме). Значение относительно которого ряд распределения делится на две половины. Число членов ряда нечётное, то (Ме) — центральная варианта. Чётное число членов ряда — (Ме) (полусумма) полу сумма двух соседних вариант в центре ряда.
Если выборка распределена в интервальный вариационный ряд, то:
1. находят класс или интервал, где находится медиана. Кумулируют частоты ряда в направлении от меньших к большим до величины превосходящей . — нижняя граница медианного интервала.
(1)
Мода (Мо) — величина , которая встречается в данной совокупности наиболее часто.
, (2)
где — нижняя граница модального класса, т.е. класса с наибольшей частотой;
частота класса, предшествующего модальному;— частота класса, следующего за модальным;— величина классового интервала
Квантили – отсекают в пределах ряда определённую часть его членов.
Квартиль — величина, отсекающая членов ряда. Три квартиля делят ряд на четыре равночисленные части (кварты).
Дециль — величина, определяющая всех члены ряда. Девять децилей делят рядна десять равных частей.
Сотые доли числа вариант — называетсяперцентилемилипроцентилем.
99 Перцентилей делят всю совокупность наблюдений на 100 равночисленных частей.
Любой перцентиль определяется рядом последовательных действий, которые модно выразить в виде следующей формулы:
(3)
— нижняя граница класса, содержащего перцентиль; она определяется по величине
, превосходящей (или равной) числув ряду накопленных частот.
Здесь — выбранный перцентиль;частота класса, содержащего перцентиль;
— величина классового интервала;общее число наблюдений, или объём выборки.
Формула (3) применима и в случаях, когда выборочная совокупность распределяется в безынтервальный вариационный ряд, т.е. непосредственно по ранжированным значениям признака.
Значение квантилей.
1. Квантили, медиана – ценные характеристики варьирующих объектов, особенно при резко выраженных асимметрии в распределении частот по классам вариационного ряда.
2. Независимо от закона распределения квантили используются
1.как структурные средние;
2.как показатели вариации;
3. используются для установления границ тех или иных нормативов (при оценке физического развития человека, спортивных достижений отдельных индивидов
Задание 2.
Разобрать два примера.
Пример 1. Данные, полученные в конце 60-ч годов в СССР при исследовании ритмов сердечных сокращений у 861-ого спортсмена (в покое), количественно охарактеризовали длительность TP-сегмента ЭКГ, Результаты исследования сведены в таблицу №1.
х, с |
30- |
35- |
40- |
45- |
50- |
55- |
60- |
65- |
70- |
75- |
80- |
85- |
90-95 |
8 |
20 |
41 |
54 |
50 |
101 |
61 |
152 |
150 |
123 |
74 |
24 |
3 | |
8 |
28 |
69 |
123 |
173 |
274 |
335 |
487 |
637 |
760 |
834 |
858 |
861 |
В таблице №1:
х, с - длительностьTP-сегмента ЭКГ;
- число случаев («частоты»);
- «накопленные частоты», кумулированное число случаев от меньших к большим значениям классов.
Найдите, используя, представленные в таблице №1 данные, 50-й процентиль (перцентиль) сердечных сокращений у спортсменов по показателям длительности TP-сегментов ЭКГ.
Решение:
Определим
Величина К находится между = 335 и= 487. Нижняя граница этого интервала, содержащего перцентиль, равна 65.
Берём разность =430,5 – 335 = 95,5 и относим её к частоте класса, содержащего искомый перцентиль, т.е. к частоте
Учитывая величину классового интервала , подставляем известные значения в формулу:
.
Эта величина соответствует медиане данного распределения.
Она оказалась несколько больше средней арифметической, равной 65,87.
Если принять за норму сердечных сокращений у спортсменов величину, равную 50% всех членов ряда, то её границы определятся по и.
Найдём эти границы.
Сначала вычислим и.
Отсюда и
Пример 2. Измерены длинны= 100 иголок на ветви ели в миллиметрах. По этим данным определена средняя длина иголок (хвоинок)и их отклонения от среднего значения. Минимальное и максимальное отклонения составили соответственно -2,5 и 5,0. В соответствии с формулой Старджеса (1926){} диапазон отклонений разбит на= 8 ){} равных интервалов и подсчитано количество наблюдений, попавших в каждый интервал. Данные представлены (сведены в) в таблице:
Границы интервалов |
-3-2 |
-2-1 |
-10 |
01 |
12 |
23 |
34 |
45 |
3 |
10 |
15 |
24 |
25 |
13 |
7 |
3 |
Требуется при уровне значимости α = 0,01 проверить гипотезу о том, что отклонения длины иголочки ели от среднего значения согласуются с нормальным законом распределения.
Решение: Поскольку число наблюдений в крайних интервалах мало, объединим крайние интервалы с соседними.
В результате объединения получим таблицу:
Границы интервалов |
-3-1 |
-10 |
01 |
12 |
23 |
35 |
13 |
15 |
24 |
25 |
13 |
10 |
Для получения теоретических вероятностей попадания случайных отклоненийXв соответствующие интервалы необходимо знать параметры предполагаемого нормального распределения: математическое ожидание и дисперсию.
Оценки параметров генеральной совокупности сделаем по выборке (сведена в таблицу), воспользовавшись формулами:
где — середины соответствующих интервалов. В формулах предполагается Что интервалы имеют одинаковую длину, поэтому следует воспользоваться первоначальной таблицей. Расчёты дают:;;1,6.
Произведём вычисления вероятностей .
Для первого интервала:
.
По таблице интеграла вероятностей(и) находим:
,
Отсюда .
Аналогично:
1 |
2 |
3 |
4 |
5 |
6 | |
Границы интервалов |
-3-1 |
-10 |
01 |
12 |
23 |
35 |
13 |
15 |
24 |
25 |
13 |
10 | |
0,1933 |
0,2467 |
0,2119 |
0,1296 |
0,06338 |
Вычислим величину :
.
Число интервалов равно 6. По выборке оценивались два параметра, следовательно, число степеней свободы l=6-1-2=3. По таблице распределениянаходим
.
Поскольку , то нет оснований отвергать проверяемую гипотезу.
Задание 3. Провести самостоятельное статистическое исследование:
«Статистическое исследование длины хвоинки с ветки Picea abies ели обыкновенной»
«Проверка статистической гипотезы о том, что распределение в генеральной совокупности является нормальным (гауссовым законом распределения)»
Формулировка задачи исследования. Жизненный опыт говорит о том, что окружающие нас люди, животные и растения характеризуются некоторым разнообразием однородных признаков. Различные антропометрические данные, существование различных размеров обуви, головных уборов, одежды, перчаток и т.п. являются проявлением общей биологической закономерности. Наследуется не признак, а норма реакции. Есть все основания предполагать, что количественная характеристика признака (рост, масса) в однородной популяции должна содержать некоторое среднее значение и меру разброса около этого среднего.
Для нашего статистического исследования выберем веточку ёлки (Picea abies) и будем измерять длину иголок с этой ветки. В силу действия разнонаправленных, хаотически меняющихся факторов, которые могут повлиять на длину иголки, выглядят логичными предположение о том, что длина распределена на ветке ели по нормальному закону.