Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_

.pdf
Скачиваний:
3
Добавлен:
24.03.2024
Размер:
8.17 Mб
Скачать

Глава 8. Дисперсионный анаnи]

1. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ

АНАЛИЗ (ОДА)

Эго классический ОДА, не претерпевший со времени

использования его автором Р. Фишером практически ни­

каких изменений. Он - параметрический и предполагает,

что при расчете так называемого Е-критерия Фишера вы­

борки взяты из генеральных совокупностей, распределен­

Hыx по нормальному закону. В медицине, биологии это ус­

ловие очень часто нарушается, что послужило толчком для

разработки непараметрических аналогов ОДА: дЛЯ несвя­

занных выборок - критерии Краскела-Уоллиса и Джон­

кира, для связанных - критерии Фридмана и Пейджа.

Не стоит только думать, что применение классичес­

кого ОДА с использованием ЭВМ избавляет исследовате­

ля от четкого продумывания сyrи эксперимента или тща­

тельного подбора анализируемого материала. Данный вид статистической обработки данных всего лишь (как и боль­

шая часть уже описанных в данной книге видов статисти­

ческого анализа) подтверждает или отвергает КОНЦЩIЦИЮ, рожденную исследователем за письменным столом. Од­

нако он существенно отличается от корреляционного ана­

лиза уже тем, что здесь мы можем дать оценку, выражен­

ную в цифрах, причинно-следственным связям между ана­

лизируемыми признаками.

Обязательное условие при использовании AN ОУА/

MANOVA:

перед проведением аналитической работы прове­

рить .- соблюдается ли условие нормальности и

данные представляют собой случайные выборки из

нормально распределенных генеральных совокуп­

ностей;

также тщательно проверить, соблюдается ли усло­

вие однородности (гомогенности) дисперсий: име­

ют ли выборки равные дисперсии;

убедиться в том, что выборки независимы, т. е. нельзя

априори предсказать значение какого-либо наблю­

дения по значению другого.

80

Медицинская.статистик·а

Конечно, не стоит абсолютизировать подобные установ­

ки: на практике отступления от первых двух условий воз­

можны. В подтверждение этому в работах авторитетных ста­ тистиков [ Шеффе, Дж. Гласса, Дж. Стэнли, Д. Хауэлла

показаны примеры, демонстрирующие слабую чувстви­

тельность ОДА к нарушению условия нормальности и оп­

ределяющие допустимые пределы нарушения условия од­

нородности.

Как показывает наша практика, ОДА дает корректные

результаты даже при нарушении однородности дисперсий в том случае, если уравнены объемы выборок или отли­

чие их будет очень незначительным. И что характерно: и

первое, и второе допущение можно с лихвой перекрыть,

если сформировать выборки большого объема.

Нулев~я гипотеза ОДА свидетельствует о равенстве

средних величин у рассматриваемых совокупностей; со­

ответственно альтернативная гипотеза OТBepraeт значимые

отличия в средних, обусловленные воздействием рассмат­ риваемого фактора.

F-критерий Фишера рассчитывается по следующей

формуле:

02

F =--l!.!..

02

ч

Эта формула выражает отношение двух дисперсий:

межгрупповой (она в числителе дроби) и внугригруппо­ вой (в знаменателе дроби). Как правило, внутригруппо­ вая,дисперсия обусловлена случайными причинами, а воз­ действие фактора проявляется в наличии межгрупповой дисперсии. Особую роль пр'.. применении ОДА играет сум­ ма квадратов отклонений SS, так как с нее начинается рас­

чет дисперсий, входящих в приведенную формулу. Каж­

дая из этих дисперсий вычисляется как отношение соот;­ ветствующей суммы квадратов отклонений к количеству степеней свободы:

Глава 8: Дисперсионный анали]

81

S2

= SS~ . S2

= SS~

bg

d/bg' ~

d/wg'

где SS - сумма квадратов отклонении, соответствующая внyrpи - и межгрупповой дисперсии;

d/bg (или k - 1) - число степеней свободы межгруп­

повой дисперсии;

df (или N - k) - число степеней свободы внутри- lI\f

групповой дисперсии;

k - количество градаций (уровней) фактора, соответ­

ствующее числу выборок;

N - общее число наблюдений в выборках

Упражнение 24.

Применение однофаКТОРI1ОГО Аис"ереионноro·ан8ЛМ· за для выявления влияния фактора (пакет SPSS).

УслоВие. В течение нескольких дней ПОДОГlытные живот­

ные поДвергались радиоактивному облучению. Можно ли говорить об изменении радиоактивности крови в связи с длительностью облучения в разных группах животных?

День

Радиоактивность в уcnовных единицах

 

 

 

 

облучения

 

 

 

 

 

1-я группа

2-я группа

3-я группа

4-я группа

 

 

 

 

 

1-й

30

28

26

24

 

 

 

 

 

1-й

28

30

27

26

 

 

 

 

 

1-й

з4

32

30

28

 

 

 

 

 

1-й

42

40

38

34

 

 

 

 

 

2-й

36

38

34

32

 

 

 

 

 

2-й

28

ЗА

29

26

2-й

з4

32

30

28

 

 

 

 

 

2-й

36

ЗА

32

26

 

 

 

 

 

3-й

40

38

36

24

 

 

 

 

 

З-й

38

36

з4

32 .

 

 

 

 

 

3-й

·34

45

40

38

 

 

 

 

 

3-й

37

38

40

з6

 

 

 

 

 

82

Медицинская статистика

Решение:

1. Выдвигаем гипотезы:

об отсутствии влияния фактора времени на группу

животных,

о наличии такого влияния.

2.Запустим пакет SPSS и введем исходные данные, ис­

пользуя переменную Va,1 для записи фактора, принимаю­

щего значения от 1 до з. В последующие ячейки коло~ок таблицы запишем данные о группах животных.

З. Вначале проверим .нормальность распределений пе­

ременных и убедимся, что по критерию Шапиро-Уилкса

распределения не отличаются от нормального. Хотя, как уже

отмечалось, ОДА применим и в некоторых случаях наруше­

ния нормальности.

4.Для применения ОДА в главном меню пакета выбе­ рем: (Статистики) - (Сравнение средних) - (ОДJiофактор­

ный дисперсионный анализ).

5.В окне ОДА в поле (Перечень зависимых переменных) зададим исследуемые переменные, а в nO.(le (Фактор) зада­

дим 1.

6.Нажмем на кнопку (Параметры) и установим флажок

вполе (Гомогенность дисперсии), задавая тем самым про­

верку однородности дисперсии.

Нажмем на кнопку (Продолжить) и вернемся в окно (Од­ нофакторный дисперсионный анализ).

7. Нажа~ ОК, выполним саму проверку и перейдем в окно (Просмотр результатов).

Вначале проанализируем результаты таблицы (Провер­

ка гомогенности дисперсий): наихудший уровень значимос­ "ги встречается у переменной 1 и 2

З. Это дополнительно подтверждает корректность при­ менения ОДА к нашим данным.

Далее в таблице ANOVA найдем результаты ОДА, из КО­

торых следует, что влияние фактора (дня облучения) имеется

для переменных Vа,З (З-я группа животных) (FФишера З,165~

при р= 0,091 и Var4 (4':'я группа животных) (F= 4,259, при р=

= 0,05), а для двух первых групп показатели незначимы.

Глава 8. Дисперсионный анапи]

81

Резюме: фактор принадлежности к определенной груп­

пе и длительность облучения взаимосвязаны. Безусловно,

значения критерия Фишера для данного экспериментального

материала малозначимы, но этот факт объективно можно

или опровергнуть, или подтвердить в результате элементар­

ного расширения объема выборки, если позволяют условия

эксперимента.

• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •

)'11J'ёI)f(fI~flJf~ ~~. • • • • • • • • • • • • • • • • • • • • • •

Решение той же задачи с использованием пакета Statis-

tica.

Решение:

1.Запустив пакет, переКIIЮЧИМСЯ в модуль ANOVAj MANOVД (ОднофакторныйjМногофакторный дисперсион­

ный анализ) и введем данные аналогично решению преды­ дущей задачи.

2.В стартовом окне модуля зададим зависимые пере­

менные, а также факторную переменную.

3. Нажав ОК, выполним анализ и перейдем в диалого­

вое окно просмотра результатов. С помощью другой кноп­

ки (Сriецифическое влияние) получим ряд таблиц с резуль­

татами анализа. Первая из них содержит те же числа, что и

при использовании пакета SPSS, которые подтверждают

выводы, сделанные ранее: значим<?е подтверждается влия­

ние фактора (применительно к переменным 3-4).

• • • • • • • • • • • • • • • • • • • • • •

2. ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ

АНАЛИЗ (дм)

Двухфакторный дисперсионный анализ (ДДА) выяв­

ляет влияние на зависимую переменную уже двух рассмат­

риваемых факторов не только по отдельности, но в ИХ со-

вместном воздействии.

__ ':

Он В целом не меняет общую J!OfHКY дисперсионного

анализа, но несколько усложняет саму процедуру прове­

дення, так как появляется необходимость в оценке еще и

межфакторного взаимодействия. - -

84

Медмцмнская аатмамка

Подобная ситуация возникает в тех случаях, когда со­

вместное влияние двух факторов в отдельности проявля­

ется слабо. Именно в исследовании межфакторного взаи­

модействия и заключаются особенность и основное дос­

тоинство ДДА.

В литературе для обозначения ДДА можно встретить английскую аббревиатуру «TWQ-WAY 2 х 3 и т. д.», что оз­ начает: «Двухфакторный дисперсионный анализ с ДВУМЯ

уровнями первого фактора и тремя уровнями второго».

Статистические гипотезы для ДДА формулируются отдель­ но как для каждого фактора, так и для их совместного вли­ яHия (взаимодействия). для проверки статистических ги­

потез в ДДА, как и в ОДА, используется то жесоотноше­

'иие дисперсий, тот же самый критерий F Фишера.

Дисперсионный анализ может осущестШIЯТЬСЯ в УСЛОВИЯХ бесповторного и опыта с повторениями.

)'l1l'ctJfCII~IIJfE! ~Ei. • • • • • • • • • • • • • • • • • • • • • •

Рассмотрим наиболее трудный вид ДДА с повторения-

ми дnя выявления влияния факторов (пакет SPSS).

УслоВие. Врачом-гигиенистом исследовался процесс ок­

раски детских игрушек из дерева четырьмя видами краски

при четырех способах нанесения этой краски на изделие.

Необходимо ответить на вопрос: какая из комбинаций: крас­

ка + способ окрашивания дают наиболее устойчивое окра­

шивание?

Номер

Тип

Способ нанесения краски

 

участка

на изделие (0/0

бракованных

 

краситe.nя

 

цеха

 

изделий)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

1-Й

2-Й

 

З-й

4-й

 

 

 

 

 

 

 

 

 

 

 

 

 

1

Краситель

2,4

2,9

 

 

2

 

1,8

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2,1

2

 

 

1,9

 

1,7

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

2

1,9

 

 

1,6

 

1,7

 

1

Краситель

1,2

1,4

 

 

1,3

 

1,3

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1,4

1,3

 

 

1,4

 

1,4

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,2

 

 

1,3

 

1,2

 

3

 

1,2

 

 

 

 

Глава 8. Дисперсионный анализ

 

 

 

85

 

 

 

 

 

 

Окончание табл.

 

 

 

 

 

 

 

 

 

 

 

 

Номер

Тип

Способ нанесения краски

 

 

участка

на изделие (0/0 бракованны x

 

 

 

 

краситenя

 

 

цеха

 

изделий)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1-й

2-й

3-й

4-й

 

 

 

 

 

 

 

 

 

 

 

 

 

1

Краситель

1,4

1,4

1.3

1.2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1,2

1,6

1.3

1,2

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

1,3

1,4

1.2

1.3

 

 

 

 

1

Краситель

1,3

1,4

1,4

1,2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1,4

1,3

1,4

1,5

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

1,4

1,5

1.3

1,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение:

1.Выдвинем как обычно гипотезы:

влияния первого фактора «краситель»;

влияния второго фактора (способ окраски);

влияния взаимодействия этих факторов.

2.Запустим пакет SPSS и введем данные аналогично

задаче, используя на этот раз две факторные переменные

З. Не стоит забывать о проверке на нормальность.

4. Для применения ДДА в главном меню программы по­

следовательно выберем команды: (Статистики) .-. (Общая

линейная модель - ОЛМ) - (ОЛМ - Обобщенная фак­

торная).

5. В открывшемся диалоговом окне выполним следую­

щее:

В поле (Зависимая переменная) зададим переменную

Var2.

В поле (Контролируемые факторы) зададим факторы.

Нажмем на кнопку (Модель) и в открывшемся диало­

говом окне зададим следующие параметры:

-отметим поле (Полная факторная модель);

-в. поле (Сумма квадратов) выберем вариант, наи-

более часто применяемый при ,цдА; ...,

-поctавим флажок в поле (Включить в модель сво­

бодный член).

.&

Медицинская статистика

Нажав на кнопку (Продолжить), возвратимся в пре­

дыдущее окно.

Нажав на кнопку (Параметры) и (Показывать), флаж­

ками установим следующие параметры:

-(Дескриптивные статистики),

-(Оценки силы эффекта),

-" (Критерии однородности).

И, нажав кнопку (Продолжить), возвратимся в предыд-­

щее окно.

Нажмем ОК дЛЯ выполнения процедуры ДДА.

б. Последовательно изменяя зависимую переменную, повторим Гlроцедуру ДДА дЛЯ переменных.

7.После чего перейдем в окно (Просмотр результатов).

В таблицах (Тест Ливина проверки равенства ошибок

дисперсий) проверяем однородность дисперсий для

всех исследуемых переменных.

В таблицах (Проверки межфакторных эффектов) ана­

лизируем для зависимых переменных влияние каж­

дого из двух факторов в отдельности, а также меж­ факторного взаимодействия.

Имеем следующее: факторные нагрузки для красителей

2 и 3 оказались значимыми 23,14 при Р = 0,01 и 13,6 и р = 0,0001 соответственно, сочетанное факторное влияние

(краситель + способ окрашивания) ниже - 9,4 при р = 0,008,

другие сочетания факторов статистически незначимы.

Резюме: сочетание краски и способа нанесения краси­ теля влияет на стойкость красителя и снижение числа бра­

кованных изделий, но главным все же является сам краси­

тель. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ГлаВа 9

МНОГОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ

Многомерные статистические методы целесообразно

применять в двух основных с~учаях:

1) когда анализируемая совокупность имеет значитель­

ную размерность, с большим количества признаков;

2) когда эксплораторный анализ не обеспечивает ин­

формацией о структуре данных. Данные методы анализа:

позволяют уменьшить размерность и получить та­

кой же результат, а возможно, даже открыть иные

закономерности;

выявляют в рассматриваемой совокупности данных

так называемую «(латентную») структуру, которую

обычными методами анализа выявить просто невоз­

можно.

Оба этих направле'ния~ к великому сожалению, еще не

используются достаточно широко в медико-биологических

исследованиях, и врачи, и биологи о них (за исключени­

ем отдельных энтузиастов) очень слабо информированы.

В прикладной статистике этими методами долгое вре­

мя не могли пользоваться из-за отсутствия вычислитель­

ной техники для обработки больших массивов данных. Ак­

тивно эти методы стали развиваться со второй половины

88

МеДИЦИНСКillI СТilТИСТИКiI

хх в. при появлении быстродействующих компьютеров,

выполняющих за доли секунды необходимые вычисления,

на которые до этого уходили дни, недели, месяцы.

Мы рассмотрим два основных многомерных метода,

которые в медицинской статистике лредставлены не так

широко, как хотелось бы, разберем их достоинства и не­

достатки, это:

кластерный ан~из;

дискриминантный анализ;

факторный анализ.

1. КЛАСТЕРНЬIЙ АНАЛИЗ

Общая схема nрuмененuя lUасmерного tllltlAU3tl

в meouko-6uоllоzu"еск1lX UСCllедованuяx

Кластерный анализ - это математический метод ре­

шения задач классификации, разделения эмпирической выборки на ряд непересекающихся групп, таксонов.

Термин «кластер» (от англ. Cluster) - «гроздь, пучок, СКОruIение) с Qбщим свойством»; а термин «таксон» (от

англ. Taxon) обозначает систематизированную группу лю­

бой категории. И еще, элементы, объединенные в один

кластер, более схожи по сра~нению с остальными.

Кластерный анализ не использует никаких дополни­

тельных априорных предположений: например, о харак­ тере распределения вероятностей в генеральной совокуп­

ности и опирается, как правило, только на данные о са­

мой эмпирической выборке. Как правило, результаты

считаются окончательными и не пересматриваются для

данной эмпирической выборки, хотя при получении до­

полнительных данных или при выборе другого метода

классификация, вполне понятно, может быть иной.

Иногда можно встретить в литературе информацию, когда кластерный анализ относят к категории статис.­

тических методов, предназначенных для так называемой

классификации без обучения (в отличие от дискрими­ нантного анализа, который называют классификацией