- •Оглавление
- •Условные обозначения
- •Предисловие
- •Задачи биостатистики
- •Основные понятия и определения биостатистики
- •Классификация признаков
- •Анализ медико-биологических данных на основе их графического представления
- •Анализ медико-биологических данных на основе числовых статистических характеристик
- •Свойства нормального распределения
- •Теория проверки статистических гипотез
- •I алгоритм
- •II алгоритм
- •Проверка гипотезы о нормальности распределения случайной величины
- •Параметрические критерии проверки статистических гипотез
- •Анализ относительных величин
- •Доверительный интервал
- •Доверительный интервал для разности генеральных средних двух независимых групп
- •Доверительный интервал для разности генеральных средних двух зависимых групп
- •Доверительный интервал относительных показателей
- •Непараметрические критерии проверки статистических гипотез
- •Анализ качественных признаков. Таблицы сопряженности
- •Оценка факторов риска
- •Оценка чувствительности и специфичности диагностических тестов
- •Оценка прогностического значения диагностических тестов
- •Однофакторный дисперсионный анализ
- •Линейная корреляция
- •Коэффициент корреляции рангов к. Спирмена
- •Линейная регрессия
- •Анализ выживаемости
- •Методы прогнозирования
- •Методы простой экстраполяции
- •Метод среднего абсолютного прироста
- •Метод среднего темпа роста
- •Прогнозирование на основе математических моделей
- •Оценка факторов риска и прогнозирование на основе логистической регрессии
- •Анализ качественных признаков на основе логлинейной модели
- •Байесовский подход к диагностике и прогнозированию. Последовательный анализ вальда
- •Определение размера выборки
- •Расчет объема выборки при эпидемиологических исследованиях
- •Представление статистических данных в научных публикациях
- •Заключение
- •Список литературы
- •Приложение 1. Критические значения коэффициента асимметрии As
- •Приложение 2. Критические точки двустороннего tкритерия Стьюдента
- •Приложение 3. Критические значения Uкритерия МаннаУитни
- •Приложение 4. Критические значения парного Ткритерия Уилкоксона
- •Приложение 5. Критические значения χ2
- •Приложение 6. Критические значения коэффициента корреляции рангов Спирмена
- •Приложение 7. Критические значения Fкритерия Фишера
- •Ответы к контрольным заданиям
Однофакторный дисперсионный анализ
Проблема. Результаты консервативного лечения аневризм, осложненных внутричерепной гематомой (ВЧГ), неудовлетворительные - летальность составляет 50-85%. До настоящего времени существуют различия в хирургической тактике при разрывах артериальных аневризм, осложненных ВЧГ. Сложность выбора тактики обусловлена сочетанием гематомы с выраженным ангиоспазмом, риском повторного кровотечения из аневризмы у тяжелых больных, различной оценкой симптомов компрессии и дислокации мозга, трудностью выделения доминирующей причины тяжелого состояния при сочетании гематомы с вентрикулярным кровоизлиянием, ишемией мозга. Оценка влияния различных факторов на результаты хирургического лечения позволит определить тактику ведения больных с аневризмами в сочетании с внутричерепными гематомами, выявить причины неблагоприятных исходов хирургического лечения и прогнозировать исход операции. В связи с этим одной из задач является определение зависимости срока госпитализации от тяжести состояния пациентов при поступлении, оцениваемой по шкале Hunt-Hess. |
Поставленную задачу можно сформулировать следующим образом: определить влияние многоуровневого фактора на случайную величину. Рассмотрим более простой случай - влияние рациона питания на привес животных. Было проведено исследование на 4 группах животных: первая группа потребляла обычный рацион, вторая – питалась только макаронами, третья – мясом, четвертая – овощами. Изучаемым фактором является рацион питания, который имеет четыре уровня, случайная величина – это привес животных. Нужно определить есть ли разница хотя бы между двумя средними в этих группах.
Прежде чем приступить к решению данной задачи, вспомним, что дисперсия является характеристикой разброса случайной величины относительно среднего.
В идеале, внутри каждой группы вес животных должен бы быть одинаковым, так как они питаются одинаковым рационом (например, все едят овощи). В реальности внутри групп будет наблюдаться разброс в привесе, в связи с тем, что кроме рациона на вес животных влияют другие факторы: особенности обмена веществ, поведенческих реакций, стрессоустойчивость и др. Эти факторы, которые мы будем называть неучтенными факторами, приводят к появлению внутригрупповой дисперсии Dвнутргр.
Средние по группам также имеют разброс (относительно общей средней), который объясняется влиянием изучаемого фактора - разных рационов. Это приводит к появлению межгрупповой дисперсии Dмежгр.
Рассмотрим случай, приведенный на рисунке 22. Видно, что внутри групп разброс показателя веса больше, чем разброс средних значений по группам. Можно предположить, что вес животных в этих группах не сильно зависит от рациона питания, а на него больше влияют неучтенные в данном исследовании факторы.
Рисунок 22. Внутригрупповая дисперсия
Другой случай представлен на рисунке 23.
В этом случае средние значения имеют больший разброс, чем данные внутри каждой группы. Показатели веса в различных группах расположились обособленно - можно сделать предположение, что рацион питания влияет на вес животных больше, чем неучтенные факторы.
Рисунок 23. Межгрупповая дисперсия
Таким образом, чтобы оценить влияние многоуровневого фактора на какую-то величину, необходимо сопоставить межгрупповую и внутригрупповую дисперсии. Межгрупповая дисперсия вносится изучаемым фактором, внутригрупповая дисперсия вносится какими-то другими (неучтенными) факторами.
Если то фактор не влияет
Если то фактор влияет
Если то неопределенность
Мы бы воспользовались этим правилом, если бы нам была доступна генеральная совокупность, но выборочные данные, в том числе выборочные дисперсии, ошибочны и в этом случае необходимо прибегнуть к теории проверки статистических гипотез.
Выдвигаем Н(0) – фактор не влияет на изучаемый признак
Задаемся уровнем значимости α
Вычисляем выборочную внутригрупповую дисперсию, как среднее значение дисперсий по группам
(43)
Где - дисперсия показателя в каждой изk групп
И выборочную межгрупповую дисперсию как отклонение средних в каждой группе от общей средней
(44)
ni –количество объектов в i –той группе
- общая средняя
Вычисляем критерий Фишера
(45)
Сравниваем с (Приложение 7) для заданного α и числа степеней свободы
(46)
где k – число групп, n-общее количество объектов обследования
Если вычисленное значение критерия Фишера меньше критического, то Н(0) принимается и делается вывод, что фактор не влияет на исследуемый показатель.
В противном случае принимается Н(1).
Вернемся к задаче влияния тяжести состояния пациентов при поступлении на срок госпитализации (по данным из таблицы 48). Выдвинем гипотезы: Н(0): срок лечения в стационаре не зависит от тяжести состояния пациента при госпитализации. Н(1): срок лечения в стационаре зависит от тяжести состояния пациента при госпитализации Таблица 48. Данные по сроку лечения
Таблица 49. Результаты статобработки
Т.к. Fвыч> Fкрит принимаем Н(1). Вывод: с вероятностью не менее 95% можно утверждать, что тяжесть состояния при госпитализации влияет на срок лечения в стационаре. |
Контрольное задание 11:
Используя факторный дисперсионный анализ определить, отличается ли число тромбоцитов у детей разного возраста:
Таблица 50. Данные к заданию
Число тромбоцитов |
Дети до года |
Дети от года до 3 лет |
Среднее Xi |
196 |
221 |
Дисперсия D i |
300 |
300 |
Дисперсия D межгр |
3 |