Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_медицинских_данных_Применение_пакета_прикладных

.pdf
Скачиваний:
9
Добавлен:
24.03.2024
Размер:
15.15 Mб
Скачать

Глава

7.

Описание

количественных

признаков

-+

Прочедуры

 

"Критерий

К.-С., ср./ст. откл.

известны"

 

"Крит. Лиллиефорса, ср./ст. откл.

неизвестны"

"Критерий

Шапиро-Уилка W"

~Тобnицьt

частот

О

х

~ li1.ii

Переменные: 1YAR4-VAR5

Iабnиuы частот

j_tlЖI·__[!_и_с_т_о_гр_ам_м_"_

_,1

11111!

Описательные

стат.11стики

j

Отмена

1

j

Метод 1(8Тегормзоuии д.nА та.бhиu и графи

r. Все РАЗЛ. значения

~ с Тl.КСТ. значениями

r .':!.исnоравныхинтервалов:

~~

r Пpиtin. число

интервалов:

~~

r Р.аэмершаго:

г~

 

\ j

 

nponyw. данные:~

 

:ifi l/~

 

 

 

 

nponYШ,. данные

Г

Оэ~е111•1Р.!1Ш''"

 

~~~~~!{Е'":.,·~:

Критерии нормаnьности

 

 

11111

1\ритериинормальности

1

 

 

 

Ж1Чtt1'J!

С

г~

ИЛИ ~.G,МИН.ЗНаЧеНИА

i ~КfJ!"ТерИЙ:Jl...C. ср./СТ.ОТКА,ИЗВеСТНЬI

 

Г11ел111е категории

Р'с

текст. значениями

1#8

: ~ Р'Крит. Лиллиеm,орса.. ср./ст.откn. неизвестны

, r

 

 

 

 

 

1•jl"~ритери&Шаnиро-УиnкаWJ

J.

 

1ал.онные rруnnируощие коды (эна.чениА)

.=::.J 1 ; Иmопьэуйтемодули:Неnараметричеасеястетистиkа

 

r

 

 

 

 

 

\t "'I iиподгонкареmределений.Анализnpoueccoe или

 

 

Опре4еnеннЬ1е nоnьэова.телем котегори~jrросрики(В-6 иnиК-к}дrn:ino.aroнi.:и.apyrl'«

 

 

 

 

-

-

 

 

;респреде(lений

 

Г Построчное

у.оапен.ие nропущеннtюе АОННЬ&Х

 

 

j

 

Опции отображения -~···

 

 

~

КУмУnАтивные частоты

 

 

1"

Процент111.(относительные частоты)

1

Ji;'

Кумуnативные проценты

 

 

1.0.0% минус К)'МУ11АТИВНЫВ процВИТЬI

 

г

 

Г ftогит nреобраэование

 

 

Г

П11.обит nреобраэование

 

'r Gж:wн.\tН!trH'::llf':! ~н~рмщ1,~нt.fе

Чf.i~ oтt:t

jм,_ - · -

 

~ll!!ill

аиоrраммаразмахадnявсехпеременных(!)

 

lSJ

Нормальные вероятностныеграфики (Ю

1

1:SJ

Попунормальные вероятностные графикиQ.)

1

 

Нормальные гра!!)ики без трендаW

1

 

 

 

ЗМ гистограммы 00

 

Рш:. 7.4. Диалоговое окно подмодуля "ТаблиIJЫ

ле "Основные статистики и таблИIJы").

частот"

моду­

Оrметив

галочками

необходимые

критерии,

следует

активи­

зировать

прочедуры

нажатием

кнопки

"Критерии

нормально­

сти"

("Tests

fог

normality") .

·В

этом

случае

результаты анализа

(рассчитанные

значения

р)

могут

быть

выданы сразу для всех анализируемых

одном

окне

(рис. 7.5), что более удобно.

признаков

в

Интерпретация

результатов.

Напомним

основные

свой­

ства

нормального распределения признака:

 

нормальное распределение признака симметрично

относи­

тельно

своего

среднего

значения;

81

Глава

7.

Описание

количественных

признаков

тем

что

они

обладают

несколько

меньшей

статистической

мощ­

ностью

(чувствительностью),

т.е.

реже,

чем

параметрические

методы,

обнаруживают существующие

различия выборок,

пред­

почтительнее

применять

параметрические

методы.

Если

при

использовании

критериев

нормальности

р<О,05

(или

друтой

принятой

критической

величины),

то

следует

отклонить

нулевую гипотезу

признака считать

и принять альтернативную, т.е.

распределение

отличающимся от нормального.

В этом случае

сравнение

групп

по

этому

признаку

должно

проводиться

с

ис­

пользованием

исключительно

непараметрических

методов.

Замечание

1.

Иноzда

критерии

Лиллиефорса

и

Шапи­

ро-

Уш..ка

дают

разные результаты.

В

этом

случае

мы

ре­

комендуем

опираться

на

результат

теста

Шапиро-Уи.лка

как

на

бо.лее

надежный.

Замечание

2.

Ее.ли

zипотеза

о

норма.льном

распределе­

нии ные,

отклонена, но из8естно, что и.ли выпадающие, значения

выборка содержит аномаль­ признака ("Выбросы"), то

можно

предполагать,

что

пос.ле

их

удаления

повторное

при­

менение

теста

на

нормальность

даст

другой

результат.

Подробнее

о

работе

с

выпадающими

значениями

признака

см.

раздел

7.3.5.

Внимание!

Ее.ли

необходимо

представить

описание

цен­

тральных

тенденций

и

дисперсий

признака

не

тq.лько

8

це­

лом

по

8сей

группе,

но

и

8

подгруппах,

а

также

8

дальнейшем

про8одить

сопоста8.ление

подгрупп,

то

необходимо

ана.лизи­

ро8ать 8ид распределения признака 8 каждой из этих

групп ( пред8арите.льно указав ус.ло8ие отбора строк

под­ .либо

8ыде.ли8

их

8

отдельные

фай.лы

из

исходного

фай.ла

).

Описа­

ние

процедуры

разбиения

фай.ла

на

несколько

фай.ло8

(под­

zрупп)

см.

8

разделе

4.2.

7.2.

Описание

количественных

данных

в

З$висимости

от

вида

их

распределения

При

представлении

данных

в

научной

статье

или

отчете

обычно

следует обобщить наблюдения (объекты

т.е. привести описательную статистику

исследования) выборки,

(параметры распределе­

ния)

для

количественных

признаков.

Это

необходимо

для

того,

чтобы

читатель

мог

составить

представление

о

том,

каковы

ос-

83

Статистический анализ медицинских данных ...

новные характеристики выборки - gентральная тенденgия, рас­

сеяние по каждому из изучаемых признаков. Без этого читатель не сможет оgенить, в какой степени близка изучаемая выборка к его контингенту больных ( т.е. насколько обобщаемы результаты исследования). При описании малых выборок (в которых число наблюдений, или объектов исследования, не больше 20) реко­

мендуется приводить таблиgу с исходными данными, так как для таких выборок методы статистики, в том числе описательной, не

всегда адекватны.

При описании больших выборок требуется привести табли­ gу, в которой описаны gентральные тенденgии и рассеяние зна­

чений количественных признаков в данной выборке, или соот­

ветствующий рисунок.

Меры центральной тенденции (меры локализации, меры положения) показывают наиболее типичное значение для

данной выборки. К мерам gентральной тенденgии относятся:

-среднее значение (М) - среднее арифметическое;

-медиана (Ме) - значение, справа и слева от которого на оси

значений признака располагаются равные количества значе­

ний признака данной выборки;

-мода (Мо) - наиболее часто встречающееся значение при­

знака в выборке;

-среднее геометрическое значение - антилогарифм среднего

арифметического для логарифмированных данных.

Меры рассеяния показывают разброс значений признака в выборке. К мерам рассеяния относятся:

-размах - разность максимального и минимального значений

признака;

-интерпроgентильный размах (интервал) - значения каких­ либо проgентилей распределения, например 10-го и 90-го;

-интерквартильный размах (интервал) - значения 25-го и 75-го проgентилей. Такой интервал независимо от вида рас­ пределения включает 50% значений признака в выборке;

-среднее квадратическое (стандартное) отклонение (СКО, s,

SD). Показывает разброс данных по интервалу значений при­

знака относительно среднего значения.

IJентральные тенденgии и рассеяния количественных при­

знаков, имеющих приближенно нормальное распределение (и

только таких признаков!), следует описывать средним значением

(М) и средним квадратическим отклонением (s) в формате М

84

confi-

Глава 7. Описание количественных признаков

(s). Широко распространенное представление в виде м±s в на­

стоящее время использовать не рекомендуется.

lJентральные тенденgии и дисперсии количественных призна­

ков, не имеющих приближенно нормального распределения (а

это подавляющее большинство - около 80°1о! - распределений медико-биологических признаков), следует описывать медианой и

. интерквартильным размахом (25-й и 75-й проgентили) или дру­

гим интерпроgентильным размахом (например, 80°1о интерпро­ gентильный размах - между 10-й и 90-й проgентилями).

Пример: "Медиана 240 ммоль/л (интерквартильный рdЗмах от 200 до 290 ммоль/л)" или "уровень холестерина (ме,~г,шна и интерквартильный размах) составил 240 ммоль/л (от 200 до 290 ммоль/л)" или "медиана 240 ммоль/л (25-й проgен"1ИЛЬ =200

ммоль/л, 75-й проgентиль = 290 ммоль/л) ".

STAТISТICA:

--+ Модуль "Основные статистики и таблиgы"

( "Basic statistics / ТаЫеs") (см. рис. 7.1 )

--+ Подмодуль "Описательные статистики"

("Descriptive statistics") (см. рис. 7.2)

--+ Кнопка "Другие статистики"

("More statistics")

--+ Диалоговое окно для выбора

необходимых статистик (рис. 7.6)

Рекомендуется выполнить расчет следующих параметров, от­

метив (галочками) соответствующие опgии:

"Число наблюдений N" ("Valid N")

реднее"("Мean") едиана" ("Меd'1an")

"Стандартное отклонение" ( "Standard Deviation") "Стандартная ошибка среднего" ( "Standard error of mean") "95°1о доверительные rраниgы для среднего" ("95°1о dence limits of mean")

-"Минимум и максимум" ("Minimum and maximum")

-"Нижние и верхние квартили" ("Lower and upper quartiles")

-·"Размах" ("Range")

Для описания выборочного нормального распределения ко­

личественных признаков необходимо указывать как минимум

следующие параметры:

85

Глава 7. Описание количественных признаков

Размах представляет собой разность максимального и мини­ мального значений признака. Этот параметр бывает необходим в

том случае, если нужно принять решение о возможности рас­

сматривать дискретный признак (число возможных значений

которого достаточно велико) приближенно непрерывным. Так, если размах превышает 20, то допустимо приближенно считать

такой признак непрерывным. Например, число эритроgитов яв­

ляется по физическому смыслу дискретным признаком, так как при измерениях их числа дробные значения не фиксируются и даже не фиксируются значения с точностью менее миллиона. Однако поскольку число возможных значений достаточно велико,

то такой признак вполне обоснованно можно анализировать как непрерывный.

Замечание. Напомним, что параметры (статистики)

Вычисляются для Всей Выборки, которая 8 данный момент представлена 8 файле, если не заданы условия отбора строк

(см. раздел 4.1 ).

Результаты, полученные с помощью методов описательной ста­ тистики, удобно представлять в виде рисунков - диаграмм раз­ махов и диапазонов. Они удобны для представления как нор­

мальных, так и других распределений признаков. Приведем при­

меры подобного представления.

На рис. 7. 7 показана диаграмма размахов в виде линейного

графика. Нормальные распределения переменных (признаков), таких как в группе А, удобно представлять в виде отрезка [М - s;

М + s]. Распределения как нормальные, так и отличающиеся от нормальных (группа В), можно представлять в виде интерквар­

тильного интервала между 25-м и 75-м проgентилями, включаю­ щим 50% значений признака в выборке.

На рис. 7.8 показан другой способ представления распреде­

лений количественных данных - диаграмма диапазонов (так называемый коробочный график1 ) - для нормально (группа А) и ненормально (группа В) распределенных переменных (при­

знаков). Такой график наглядно демонстрирует сразу несколько

параметров распределения: gентральные тенденgии (среднее зна­

чение, медиана) и характеристики рассеяния объектов исследо­

вания (минимальное и максимальное значение признака, 25-й и

75-й проgентиль, 10-й и 90-й проgентиль).

1 Box-aпd-whisker (англ.).

87

Статистический анализ медицинских данных ...

Группа А

M±s

Группа В

Ме (интерквартильный размах)

о

1

2

3

4

5

6

7

Рис. 7.7. Представление распределений количественных данных

с использованием диаграмм размахов (линейный график) при нормальном распределении (группа А) и распределении, от­ личном от нормального (группа В).

Параметрами, представляющими наибольший интерес и опи­ сание которых должно сопровождаться указанием ДИ, обычно

являются:

-среднее значение признака (в случае нормального распреде­

ления признака);

-медиана (в случае распределения признака, отличного от нор­ мального; см. раздел 8.1.2);

-относительная частота (пропорция; см. раздел 9. 3).

Чтобы вычислить границы ДИ для среднего значения призна­

ка в случае нормального его распределения, используют значение

стандартной ошибки среднего значения (т) 1 • В отличие от

СКО стандартная ошибка среднего не является характеристикой, описывающей рассеяние наблюдений (объектов исследования)

1 Standard error of mean (SEM; англ.).

88

Глава 7. Описание количественных признаков

Максимум

точки данных

 

90-й процентиль

75-й процентиль

75-й процентиль

*Ме=М

*

м

 

 

Ме

25-й процентиль

 

25-й процентиль

 

 

10-й процентиль

Минимум

 

точки данных

 

 

Группа А

Группа В

 

Рис. 7.8. Представление распределений количественных данных

с использованием диаграмм диапазонов ("коробочный" график)

при нормальном распределении (группа А) и распределении,

оrличном or нормального (группа В).

выборки по области значений, т.е. описательной статистикой, а представляет собой меру точности ОIJенки среднего значения в

генеральной совокупности на основании данных исследуемой

выборки.

Интерпретаqия ДИ для среднего значения основывается на

следующих предположениях:

-выборка является случайной или хотя бы репрезентативной;

-в генеральной совокупности анализируемый признак имеет приближенно нормальное распределение;

-объекты исследования независимы, т.е. отобраны из гене­

ральной сов0купности по одному, независимо от ранее ото­

бранных объектов исследования.

89

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение