Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
8.17 Mб
Скачать

Глава 1. Введение в теориlO иsмерений

I

понимать, какую информацию вы хотите «выжать» из соб­

ственных экспериментальныхданных. В чем вы видите cyrb

своих исследований, потому что, кроме вас, на эти вол­

рось. не ответит и самый распрекрасный специалист-ста­

тистик, если, конечно, он дополнительно к своей профес­

сии, не владеет еще и вашей...

Построили же свою работу ~Ы так сознательно, по­ скольку личный опыт убеждает в том, что, если матема­

тические «навороты» «обрушиваются» на читателя с пер­

вых же страниц, ТО они в конечном счете сослужат авто­

рам книги медвежью услугу, отбивая всякую охоту у

читателя-нематематика к освоению пропагандируемых

приемов обработки статистических данных.

ГлаВа 2

СТАТИСТИЧЕСКИЕ ГИПОТЕЗbI

любое исследование начинается с формирования ста­

тистической гипотезы. Огрвариваются особенности ста­

тистических закономерностей при получении результатоц

экспери мента, анализируется допустимость распростране­

ния результата отдельных выборок на всю генеральную

совокупность.

В медицинской статистике различают следующие виды

гипотез:

Но - нулевая, гипотеза отсyrствия различий, измене­

ний, эффектов воздействия на совокупность; Н1 - альтернативная, гипотеза о наличии различий,

изменений, эффектов при воздействии на совокупность. Эти так называемые дuxоm()мuческuе гипотезы наибо­

лее часто составляют суть медицинских и биологических исследований. Редко, но не сказать об этом нельзя, гипо­ теза может включать и более двух возможных вариантов

решения.

В подавляюшем же большинстве случаев в медико­

биологических исследованиях исследователи пытаются

выявить различия в уровне, динамике, характере распре­

деления показателей в экспериментальной и контрольной

(фоновой) группах испытуемых, пациентов, лабораторных животных, анализов и т. д., т. е. пытаются сформировать

классический тандем: контроль-опьп.

Глава 1. Статистические rипоте1Ы

"

 

и если исследование правильно спланировано" то ре­ зультат практически всегда будет безупречным. Валид­

ность - главное определяющее серьезности исследования.

r

 

 

8anидность - способность применяемого метода"

отражать именно те качества, на выявление которых дан­

ный метод и был наllравлен. И если условия опыта не ме­

нять кардинально, то выбранный метод будет давать иден­

тичный результат и на других совокупностях.

для проверки статистических гипотез используются:

1. Пара.метрuческuе методы. (Требуют знания закона

распределения вероятностей как в выборке, так и в генеральной совокупности.)

2. Неnара.меmрuческuе .методы. (Не требуют знания за­

конов распределения вероятностей ни в выборке, ни в генеральной совокупности.)

Если исследователь серьезно относится к результату своего труда, он априори, до проведения статистической обработки данных и даже до начала проведения экспери­

мента, за письменным столом должен продумать, будет ли

анализируемая им совокупность данных отвечать требо­

ваниям нормальности, соответствовать закону Гаусса.

Дело в ТОМ, что математическая статистика и теория

проверки статистических гипотез, как ее ветвь,__ориенти­

.E.~aHЫ на специфику нормального закона распределения. И для корректного применения параметрических методов

действительно обязательно выполнение ряда условий, ко­ торыми начинающие аналитики и статистики пренебре­ гают. Большей частью эксперимент строится по такой при­

митивной схеме: сначала соберем как можно больше данных,

а уже потом с помощью профессионала-статистика как-ни­

будь обработаем.

Увы, при таком подходе иной раз с эксперименталь­

ным материалом сделать ничего серьеЗНОГQ уже нельзя

(в плане получения аналитических результатов И, самое

главное, нельзя никак исправить сам эксперимент.

12

Медицинская статистика

Если планируется ответственная-исследовательская ра­

бота и столь же серьезная обработка ее данных, то алго­

ритм действий исследователя должен содержать обязатель­

ные ответы на такие вопросы:

1) как близки распределения экспериментальных дан­

ных к нормальному закону;

2) какая шкала измерений наиболее применима в его

исследованиях, как минимум это должна быть ин-

'--~---.-. -

тервальная шкала; .

3) каковы ограничения на минимальный и (или) мак­

симальный объем выборки или согласованность объемов нескольких исследуемых выборок.

Когда требования нормальности распределения и ин­

тервальности используемой шкалы не выполняются или

их трудно осуществить, то стоит использовать непарамет­

рические методы проверки гипотез.

При получении результата работы можно допустить:

1) принятие верной нулевой гипотезы;

2)

3)

4)

отклонение верной нулевой гипотезы; принятие ложной нулевой гипотезы; отклонение ложной нулевой гипотезы.

,... Ко.гда П~Р~Ь!~_!!,I{_~РТЫ~ варианты решения правиль­

ны, а второй и третий - .ошибочны, то возникает риск

ошибки первого и второго рода.

Ошибка первого рода пояВляется, если игнорируется верная нулевая гипотеза НО. Ошибка второго рода возни­

кает, когда нулевая гипотеза Но оценивается как ложная.

Если обозначить вероятность ошибки первого рода. как (Х, а вероятность ошибки второго рода ~, то значение

вероятности правильного вывода в первом случае будет

равным:

р= 1 - а.

Значения (р) могут бьпь выражены как 0,95 или 0,05~ что по сyrи одно и то же. В большинстве медико-биоло­

гических исследований в качестве минимально допусти­

.мого используют уровень значимости р = 0,05 или 0,01,

иногда 0,001.

Глава 2. Статистические rипоте1Ы

'l

Для уменьшения вероятности совершения ошибки

первого рода можно:

-увеличить число наблюдений;

-увеличить числа повторных измерений в одной и

той же выборке;

-увеличить уровень значимости или статистической'

достоверности вывода;

-увеличить точность измерений за счет уменьшения' систематической ошибки.

Ошибки второго рода непосредственно влияют на мощ­

ность критерия при проверке гипотез, когда велика веро­

ятность не совершить ошибку второго рода. Вполне есте­

ственно, чтобы не совершить ошибку второго'рода, надо

стремиться использовать более мощный критерий для того

класса задач, которые решаются в конкретной ситуации.

Мощность критерия

v= 1 - 1.

Отсюда возникает естественный вопрос: какая же из

описанных ошибок более важна? Ответ односложным

быть не может, все зависит от ряда обстоятельств: от це­

лей, характера задачи, построения исследования.

~

Ошибка первого рода существенна в конфирматорном

(уточняюшем) эксперименте, а также тогда, когда непри­

нятие верной гипотезы об отсутствии различий имеет практическую значимость: принятие врачом ложной ги­

потезы об эффективности лечебного препарата или эф­ фективности противоэпидемических мероприятий может

иметь катастрофические последствия, оргвыводы о проф­

пригодности специалиста и т. Д.

Ошибка второго рода существенна в эксплораторном (разведочном) эксперименте. Orклонение гипотезы о раз­

личиях на начальной стадии эксперимента может (в луч­ шем случае!) неверно ориентировать исследователя на перс­

пективу.

В настоящее время, когда все стали считать деньги, в

том числе и на проведение исследований, и наука 8 по­

давляюшем большинстве случаев влачит жалкое суще-

14

МеДИЦИНСl(ая статистика

ствование, сократить затраты на эксплораторный экспе­

римент можно за счет:

1) уменьшения количества наблюдений;

2) задания более низкогоуровня значимости.

Конечно, в любом случае приятнее получить положи-

тельный результат, чем фиаско, Однако в целом ряде слу­

чаев отрицательный результат - тоже результат, поэтому

вероятность и значимость ошибок первого рода значитель­ но выше, чем ошибок второго рода.

В этой -.связи целесообразным, с нашей точки_зрения,

является такой подход к обработке эмпирического мате­

риала исследования:

1) от ЭКСJUIораторного эксперимента к конфирматор­

НОМУ;

2} от низких уровней достоверности к высоким;

3) от исследований на малых выборках к большим.

Глава 3

КОМПЬЮТЕРbl в МЕДИКО­

БИОЛОГИЧЕСКОЙ СТАТИСТИКЕ

для эффективного использования пакетов roroвых CI'3-

тистических программ любой квалифицированный врач

доложен владеть приемами работы на персональном ком­

пьютере. Мы рассчитываем, что читающий данную книгу

имеет и персональный компьютер, не новичок в его экс­

плуатации, хотя бы на уровне пользователя, имеет и про­

граммное обеспечение, о котором пойдет речь ниже'(JJY'I-

ше, если лицензионное!). И тем не менее все же напомним

базовые понятия.

Файловая система - это система хранения информа­

ции. Данная система иерархическая, она имеет три уров­

ня: 1) файлы, 2) папки, 3) логические диски.

Папка (Folder), или каталог (Directory), - это группа

файлов, объединенных под общим именем. Папки в опе­

рационной системе MS Windows делятся на два вида:

стандартные - специальные папки, в которых хра­

нится информация об управлении компьютером;

пользовательские - создаваемые самим пользова­

телем.

Лоrические диски - самые крупные разделы файловой

системы, вмещающие группы файлов и папок, емкостью от десятков до сотен мегабаЙТ.

,.

МеАицинская статистика

lfиrерфейс (Interface) - способ общения между пользо­ вателем и программоЙ. Он служит для упрамения про­

граммным обеспечение~ как с клавиатуры с использова­

нием комбинации клавиш, так и с помощью «мыши».

Рабочее 01010 (Window) - содержит стандартные эле­

менты упрамения.

WiпdОWS-ПРВJJожевия -. компьютерные программы для

работы в данной среде операционной системы. Описан­

ные ниже программы как раз и рассматриваются нами как

готовые статистические пакеты.

МевlO (Мепо) - наБОр процедур выбора, представлен:

текстами;

пиктограммами, значками.

Всовременных медицинских учреждениях примене­

ние компьютерных технологий, к сожалению, еще не ста­

ло обычным делом обработки и анализа данных, тем бо­

лее проверки статистических гипотез. Кое-кто в лучшем

случае использует для решения своих локальных задач ста­

тистические пакеты, так называемой описательной стати­

сти"и (и не более) популярной программы Ехсеl.

Как показывает наш опыт использования хорошо за­

рекомендовавших себя статистических пакетов SPSS,

STATISТICA (USA) дЛЯ решения задач по обработке теку­

щей (и даже научной!) информации, эти пакеты дают ис­ следователю гораздо больше простора для творческой ра­ боты: арсенал методик в них шире, чем в упомянутой нами

программе Excel. И самое главное - некоторые приемы

глубокой проработки информации экспериментальных данных в ней просто невозможны.

Выбор именно этих двух пакетов, на первый взгляд, су­

щественно отличающихся> друг от друга по пользователь­

скому интерфейсу, обусловлен прежде всего тем, что их не­

достатки - продолжение их непересекающихся достоинств.

В каком-то из них есть то, чего напрочь лишен другой. Предлагаемая нами подборка статистических приме­

ров и задач вводит врача, биолога, химика и близких к ним

по сyrисвоего труда специали~в в круг таких вариантов

Глава З. компыоерыы 8 медико-биолоrической статистике

17

обработки статистической информации, где применение

до сих пор мало используемых модулей из выбранных

нами статистических пакетов дает возможность получить

наиболее емкую информацию, взглянуть на эксперимент

с совершенно иной,. нетрадиционной точки зрения. Это

очень важно на данный момент, поскольку работа на ЭВМ

уже перестает быть уделом узкой, закрытой касты про­

граммистов, флер загадочности с их профессии сегодня сброшен окончательно.

ОСОБЕННОСТИ В ИСПОЛЬЗОВАНИИ ПАКЕТА SPSS

Пакет SPSS предназначен для выполнения всех эта­

пов статистического анализа данных. Аббревиатура SPSS

расшифровывается как StatiStical Package for Social Science

(статистический пакет для социальных наук). ОН'разра­

ботан в США в 60-х годах хх столетия в стенах Чикагско­

го университета, и первоначально предназначался для ре­

ализац~и сугубо специфических проблем психологии, со­

циологии, антропологии [95].

В настоящее время разработано 13 версий пакета SPSS,

И,как показала жизнь, все они многоцелевые и пригодны

для анали~ данных в областях науки и' практики, доста­

точно далеких от психологии и социологии.

В SPSS существует несколько десятков модулей, до­

полнительно подключаемых к пакету. Пакет дает возмож­

ность нее только обрабатывать данные, но и формиро­

вать отчеты о результатах обработки, имеет значитель­

ный арсенал наглядного представления результатов с

помощью графиков и диаграмм. К достоинствам пакета можно отнести русифицикацию версий, есть подробные руководства на Web-странице Интернета. К относитель-

/

ным недостаткам пакета можно отнести узкий набор ста-

тистических методов, входящих в базовую версию, пол­

ное отсутствие ряда статистических алгоритмов, широко

используемых у нас, в России. Графика (в сравнении с

тем же пакетом Statistica) - слабое звено SPS, и тем не

18

Медицинская статистика

менее он - в числе лидеров на рынке статистических ус­

луг в мире.

Примечание. Мы сознатenьноопускаем процеду­ ру инсталляции паке'Юв. Считаем, что они уже установ­ nены на компыоере.. Если это не так, то отсыпаем чита­

теля к nитературным первоисточникам в конце книги.

Итак, запускаем пакет SPSS любым способом, к при­

меру, из главного меню Создаем документ. Они, кстати,

могут быть различных типов: файлы исходных данных и файлы отчетов.

После запуска открывается стартовое oкн~. Выбираем одну из пяти возможностей, из которых основными, чаще используемыми являются две: а) Туре in data (Ввести дан­

ные), б) Ореп аn existing file (Orкpыть существующий файл). Интерфейс пакета SPSS имеет стандартные для

Windows- приложений текстовое и графическое меню.

Главное меню пакета включает следующие пункты:

File (Файл),

New (Создать, ), .

Ореп (OmKpblmb),

Save (Сохранить),

Save as (Сохранить как),

Print (Напечатать)

Edit (Правка, редактирование)

Cut (Вblрезать), СОРУ (Копировать),

Paste (Вставить), С/еаг (Очистить),

Find (Найти), Undo (Отменить),

View (Вид, просмотр),

Data (ДаННblе),

Transform (Прео6разовать),

Statistics (Статистики),

Graphs (Графики),

Utilities (Сервис, утилитbl),

Window (Окно),

Не/р (Помощь, справка).