Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LR 2 CHAST SE.doc
Скачиваний:
10
Добавлен:
27.11.2019
Размер:
945.15 Кб
Скачать

Лабораторная работа №13 Элементы дисперсионного анализа (да)

Цель работы.

Студент должен знать: понятие дисперсионного анализа, понятие однофакторного и многофакторного ДА, понятия общей факторной и остаточной суммы.

Студент должен уметь: по результатам экспериментов рассчитать факторную и остаточную дисперсии и по критерию F проверить справедливость гипотезы о различии групповых средних в целом.

Практическое значение выполняемых исследований

Многие процессы в живой природе протекают в условиях воздействия некоторых факторов. В частности, существует множество экологических факторов, которые значимо или незначимо могут влиять на протекание экологических процессов. В этой связи знание и умение пользоваться методами проверки такого рода гипотез (т.е. элементами факторного анализа)- это существенный инструмент в руках эколога- исследователя.

Литература

1. В.М. Еськов, О.Е. Филатова Курс лекций по экологии.- Сургут: Изд. СурГУ, 2000.- 197 с.

2. В.М. Еськов, О.Е. Филатова, В.А. Рачковская Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.

3. Гмурман В.Е. Теория вероятностей и математическая статистика. Учебное пособие для вузов.- М.: Высш. школа, 1999.-479 с.

Бюджет времени

На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ

"Самоподготовка"

Для успешного выполнения этапа следует повторить материал лекций и соответствующие разделы рекомендованных источников.

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:

“Выполнение лабораторной работы”

Блок информации

Если известно, что некоторые генеральные совокупности X1, X2, ..., Xm распределены нормально и имеют одинаковую, но неизвестную дисперсию, то может возникнуть нулевая гипотеза Н0: M(X1)= M(X2)=... =M(Xm), т.е. о равенстве математических ожиданий. Это эквивалентно вопросу о значимости или незначимости различий выборочных средних при заданном уровне значимости а.

Существенно, что такая задача не может быть сведена к простому попарному сравнению математических ожиданий M(Xi), т.к. возможно нарастание различий при переходе от i-й к i+1-й выборке и тогда надо проверять равенство для всех M(Xi), что определяется числом сочетаний из m элементов по 2 в каждом. Это процедура весьма громоздкая при большом m и поэтому она сводится к сравнению дисперсий. Такой анализ называется дисперсионным анализом (основоположник Р. Фишер).

Дисперсионный анализ в биологии часто применяют для установления наличия существенного влияния некоторого качественного (он может оцениваться и количественно) фактора F. Последний может иметь m уровней F1, F2, ... ,Fm влияния на изучаемую величину Х. Например, на популяцию может влиять несколько факторов (уровень радиации, наличие токсических веществ А, В, С, удобрения и т.д.), причем виды воздействия и составляют уровни фактора F. Для расчета необходимо найти факторные дисперсии, которые порождаются воздействием факторов и величину остаточной дисперсии, которая обусловлена случайными величинами.

Суть метода заключается в том, что если различия между вычисленными дисперсиями значимы, то и фактор F (считается) оказывает существенное влияние на Х. Тогда и средние наблюдаемые значения M(Xi) на каждом уровне (групповые средние) тоже различаются значимо. В более сложном случае когда нужно выяснить какой из уровней фактора F оказывает наибольшее воздействие, то необходимо выполнить попарное сравнение средних статистическими методами. Можно также проверить предположение об однородности нескольких совокупностей (если M(Xi) одинаковы по предположению).

Наиболее сложные случаи связаны с исследованием воздействия нескольких факторов на нескольких постоянных или случайных уровнях и выяснением влияния отдельных уровней и их комбинаций. Это раздел многофакторного дисперсионного анализа.

ПОНЯТИЕ ОБЩЕЙ ФАКТОРНОЙ И ОСТАТОЧНОЙ СУММЫ

КВАДРАТОВ ОТКЛОНЕНИЙ

Пусть на количественный нормально распределенный признак Х воздействует F, который имеет р постоянных уровней. Будем предполагать, что число наблюдений (испыта-

Таблица наблюдений

Номер испытания

Уровни фактора Fj

F1

F2

...

Fp

1

x11

x12

...

x1p

2

x21

x22

...

x2p

...

...

...

...

q

xq1

xq2

...

xqp

Групповая средняя

...

ний на каждом уровне одинаково и равно q.

Пусть наблюдалось n=pq значений xij признака Х, где i- номер испытания (i= 1, 2, ..., q), j- номер уровня фактора (j= 1, 2, ..., p). Результаты наблюдений приведены в таблице.

Введем, по определению

(общая сумма квадратов отклонений наблюдаемых значений от общей средней ),

(факторная сумма квадратов отклонений групповых средних от общей средней, которая характеризует рассеяние "между группами"),

(остаточная сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней, которая характеризует рассеяние "внутри групп").

Практически остаточную сумму находят по равенству

Sост = Sобщ - Sфакт

Элементарными преобразованиями можно получить, формулы более удобные для расчетов

(*)

(**)

где - сумма квадратов значений признака на уровне Fj; - сумма значений признака на уровне Fj. Можно показать, что если ввести yij=xij-C, то

(***)

(****)

где ; .При этом Sост = Sобщ - Sфакт.

РАСЧЕТ ОБЩЕЙ,ФАКТОРНОЙ И ОСТАТОЧНОЙ ДИСПЕРСИИ

Разделив суммы квадратов отклонений на соответствующее число степеней свободы, получим общую, факторную и остаточную дисперсии:

где p- число уровней фактора, q- число наблюдений на каждом уровне, (pq-1)- число степеней свободы общей дисперсии, (p-1)- число степеней свободы факторной дисперсии, p(q-1)- число степеней свободы остаточной дисперсии.

Если нулевая гипотеза о равенстве средних справедлива, то все эти дисперсии являются несмещенными оценками генеральной дисперсии. Например, учитывая, что объем выборки n=pq, заключаем, что

-

исправленная выборочная дисперсия, которая, как известно, является несмещенной оценкой генеральной дисперсии.

Замечание. Число степеней свободы p(q-1) остаточной дисперсии равно разности между числами степеней свободы общей и факторной дисперсий. Действительно (pq-1)-(p-1)= pq-p= p(q-1).

Вернемся к задаче, поставленной ранее: проверить при заданном уровне значимости нулевую гипотезу о равенстве нескольких (p>2) средних нормальных совокупностей с неизвестными, но одинаковыми дисперсиями.

Пример. Произведено по 4 испытания на каждом из трех уровней. Результаты испытаний приведены в таблице №1. Методом дисперсионного анализа при уровне значимости 0,05 проверить нулевую гипотезу о равенстве групповых средних. Предполагается, что выборки извлечены из нормальных совокупностей с одинаковыми дисперсиями.

Таблица №1

Номер испытания

Уровни фактора Fj

i

F1

F2

F3

1

51

52

43

2

52

54

44

3

56

56

50

4

57

58

52

54

55

47

Решение. Для упрощения расчета вычтем С=52 из каждого наблюдаемого значения: yij=xij-52. Составим расчетную таблицу №2.

Таблица №2

Номер испытания

Уровень фактора Fj

Итоговый столбец

i

F1

F2

F3

yi1

yi2

yi3

1

-1

1

0

0

-10

100

2

0

0

2

4

-8

64

3

4

16

4

16

-2

4

4

5

25

6

36

0

0

42

56

168

8

12

-20

64

144

400

Пользуясь таблицей №2 и учитывая, что число уровней фактора р=3, число испытаний на каждом уровне q=4, найдем общую и факторную суммы квадратов отклонений, используя формулы (***) и (****):

Найдем остаточную сумму квадратов отклонений

Sост = Sобщ - Sфакт = 266 - 152 = 114

Найдем факторную и остаточную дисперсии

Сравним факторную и остаточную дисперсии по критерию F, для чего найдем наблюдаемое значение критерия

Учитывая, что число степеней свободы числителя k1=2, а знаменателя k2=9 и уровень значимости  = 0,05, по соответствующей таблице находим критическую точку

Fкр(0,05, 2, 9)=4,26

Так как Fнабл>Fкр- нулевую гипотезу о равенстве групповых средних отвергаем. Другими словами, групповые средние "в целом" различаются значимо. Если требуется сравнить средние попарно, то следует воспользоваться критерием Стьюдента.

Лабораторная работа №14.

Системный анализ и синтез в экологии. Расчет параметров порядка (3 метода)

Блок информации

Во многих науках (и особенно в биологии и медицине) задача выбора параметров порядка (ПП) и минимальной размерности фазового пространства состояний всегда основывалась на чистой эмпирике и стоила исследователям десятилетий а то и столетий научных изысканий. Однако сейчас именно эта задача и составляет основу системного синтеза и синергетики в целом, а ее решение сейчас требует формализации и более быстрых (по времени) методов выбора ПП.

Разработка различных методов системного анализа традиционно базировались на феноменологических данных, полученных в результате эксперимента или наблюдения. При этом обычно на конечном этапе развития медико-биологических наук производится структурная или параметрическая идентификация математических моделей, которые с определенной степенью точности могут описывать динамические процессы или даже краткосрочно или долгосрочно прогнозировать динамику биопроцессов с учетом известных начальных условий процесса и с использованием известных уже заранее видов математических моделей (идентифицированных ранее для сходных процессов). Обычно, такая идентификация уже была произведена ранее учеными в рамках каких-либо наук и стоила десятки лет упорного труда (а в медицине и сотен лет исследований).

Однако ситуация сильно усложняется, если динамика процесса очень сложная, а его протекание может зависеть от многих факторов, порой даже не поддающихся учету, анализу и исследованию вообще. Такая ситуация характерна для медико-биологических систем, динамика поведения которых может постоянно изменяться. Многие биосистемы имеют характерную хаотическую динамику поведения. В этом случае мы можем говорить в основном об аттракторах поведения биосистем в фазовых пространствах состояний а описывать динамику объекта в рамках дифференциальных, разностных или других уравнений весьма затруднительно или невозможно.

Особенно это касается задач сравнения массивов данных разных больных или больных с одинаковой нозологией, но в разных климатических условиях, или разных возрастов. В медицине для таких случаев ограничиваются статистическими методами, находят моду, медиану, доверительный интервал и т.д. Дальнейшее сравнение (для одного и того же объекта по данным полученным в разное время, группы объектов, но для разных времен, или для сходных болезней, но для разных групп больных), подобных медицинских процессов, условно называемых нами сейчас статистическими объектами (но они все-равно будут объектами с разными динамическими характеристиками) производят по параметрам статистической функции распределения или другими статистическими методами в рамках теории вероятности или математической статистики. Однако, если такие объекты имеют хаотическую динамику, то эти стандартные методы могут уже не срабатывать. Нужны методы системного синтеза.

Поэтому, в рамках этих новых наук сейчас возникают другие методы изучения биосистем и методы сравнения различных процессов или объектов. Эти методы базируются на теории хаоса и синергетике. Рассмотрение же этих новых подходов мы будем производить именно в рамках новой науки синергетики. Представим некоторые из этих подходов уже применяемых нами в медицине и биологии для решения задач диагностики и выбора оптимальных методов лечения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]