5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_
.pdfВысшее образование
к.с. Жижин
МЕДИЦИНСКАЯ
СТАТИСТИКА
Учебное пособие
РОСТОВ-НА-ДОНУ
'l>еникс
2007
УДК 3 11 :614(075.8)
ББК 51.1 (2)я73
КТК 300
Ж70
Рецензенты:
Чернецкий О.Е., д. м. Н., профессор РостГМУ;
Соловьев М.Ю., К. М. Н., главный государственный сани тарный врач по Ростовской области
Жижии К.С.
Ж 70 Медицинская статистика: Учебное пособие /
к.с. ЖиЖИН. - Ростов Н/Д: Феникс, 2007. - 160 с.
-(Высшее образование)
впособии подробно описаны алгоритмы традиционных (и
не ставших еше традиционными) приемов обработки экспери
ментальной медико-биологической информации с ПО~lOшью по-
пулярных статистических пакетов: SPSS и Statistica. |
. |
Материал книги изложен простым языком, не содержит
сложных математических абстракций и носит прикладной ха
рактер. В ней подробно разобраны примеры из практики, кото
рые позволяют каждому исследователю по аналогии не только
скомпоновать собственные данные без помощи профессиона
ла-статистика, но и с первых же этапов эксперимента самосто
ятельно осуществить их обработку на достаточно квалифици
рованном. уровне.
Учебное пособие будет полезно не только врачам и биоло
гам всех профилей, но любому, кто постоянно или периодичес
ки работает с большими массивами разнообразной информа ции и использует для этой цели персональную ЭВМ.
УДК 311:614(075.8)
ББК 51.1(2)я73
ISBN 5-222-10063-4
©Жижин К.с., 2006
©Оформление: изд-во «Феникс&, 2006
ГлаВа 1 ---------
ВВЕДЕНИЕ В ТЕОРИЮ ИЗМЕРЕНИЙ
Необходимой состамяющей направленного, специаль
но организованного медико-биологического эксперимента (или обычного эмпирического исследования) является
измерение, позволяющее перейти от качественного уров
ня анализа к выявлению количественных соотношений и
закономерностей. Иногда в медицине встречаются и су
губо качественные переменнные, но они, как правило,
имеют спорадическую основу и появляются по сути пред
варительным, подготовительным этапом для перехода на
более высокий уровень - количественный.
Объясняется такой подход к статистическому анализу
совокупностей клинических и гигиенических данных во
многом тем, что сегодняшняя медицина - это медицина
третьего, надо сказать, самого низкого уровня диагности
ки и профилактики - нозОЛогического. Она изначаЛьно
ориентирована на количественные данные, а их надо бьmо
накопить, чтобы принять то или иное обоснованное реше ние..Качественные же характеристики до сих пор в таких СитУациях (особенно экстренных) большей частью оказы вались малопригодны, так как их очень сложно формали зовать и перевести на язык математических формул.
До сих пор основные понятия, используемые в меди
цине, биологии, - признак и переменная. Это измеримые
явления и до некоторой степени взаимозаменимы [1, 2].
4 |
Медицинская статистика |
С математической точки зрения переменные, извлекаемые из больших статистических массивов, обязательно случай
ные величины, конечно, если не нарушается условие рав
ной вероятности каждого 'случая попасть в изучаемую со
вокупность данных, которых заранее не известно, какое
именно значение они будyr иметь в данном конкретном
опыте.
Понятие измерения является глубоко дискуссионным,
но эта проблема, во-первых, не цель данной книги, а во вторых, вряд ли очередная дискуссия на тему измерений
что-либо существенное добавит к сyrи обсуждаемых во
просов.
Логически шкала - необходимый, обязательный эле
мент измерительной процедуры. Основными типами из
мерительных шкал, прим.еняемых в медико-биологичес
ких исследованиях, являются следующие:
•номинальная, или шкала наименований, - призва
на классифицировать свойства объекта, присваивать им числовые, буквенные и иные символьные харак-
теристики; .
•порядковая, или ранговая, - упорядочивает значе
ния признака;
•интервальная - показывает «размах» отдельных из
мерений признака;
•шкала отношений - выявляет соотношение изме ренных значений признака.
Часто o~eHЬ серьезной проблемой медико-биологичес ких (диагностических, гигиенических) исследований яв
ляется фактическое отсyrствие естественных ИlfГервальных
шкал и тем более шкал отношений для оцениваемых пе
ременных. Специалистами в вопросах математической
статистики Д1Iя этих целей разработаны специальные про иeдypы~ позволяющие построить интервальные шкалы. И
несмотря на то, что· такие приемы имеют искусственное
происхождение, эти издержки перекрываются обилием математических методов, имеющих глубокое теоретичес-
Глава 1. Введение в теорию измерений |
5 |
кое обоснование. В современной статистике наиболее ис
пользуемы такие:
•шкала стэнов (от англ. - десятка): десятибалльная шкала со средним Х= 5,5 и стандартным ,отклоне
нием (j = 2;
•шкала стэнайнов (от англ. - девятка): девятибалль ная шкала, имеющая среднее значение, равное 5, и
стандартное отклонение, приблизительно равное 2;
•процентилыJяя шкала.
r |
Примечание: последняя шкала давно используется |
|
для оценки роста, массы, окружности груди индивида.
Благодаря ей врачу не требуется суть закона распреде~
\,.ления изучаемых признаКО8. |
~ |
Врач, биолог, химик обычно имеют дело с выборкой
(частью или долей, значительно большей по численности группы, называемой reверальвой совокупностью). Конеч
ной целью любого исследования и анализа является пере
ложение выводов, полученных в выборке, на изучаемую генеральную -совокупность. И, естественно, в таком деле нельзя обойтись без статистических методов.
Выборки бывают везависимые (весвязавн:ые), если про
цедура оценки результатов измерения в них не оказыва
ется взаимопроникающей, H~ влияет на результаты дру
гой выборки. В том случае, когда такое влияние имеет
место, выборки называются зависимыми (связанными) [20].
Выборка должна быть репрезентативной, т. 'е. обладать способностью адекватно представлять генеральную сово
купность и· позволять переложить на последнюю выводы,
по~енные на ограниченном экспериментальном мате-'
риале. |
, |
И хотя выборка обычно всегда значительно меньше по
размеру, чем генеральная совокупность, но она не может не
быть близкой по статистическим характеристикам генераль
ной совокупности: среднее значение признакз, стандарт
ное orклонение (старое название - среднеквадратическое),
стандартная ошибка среднего значения признака и др.
• |
Медицинская статистика |
|
Добиться репрезентативности в силу разных причин
очень трудно. Для облегчения ситуации разработан ряд
приемов:
-представленность основных признаков в выборке должна быть в том же соотношении, что и генераль
ная совокупность. Трудности здесь состоят в том, что
практически всегда отсутствует информация о том,
какие признаки являются важными дЛя изучаемого
явления, а какие нет, и, самое существенное, - о
том, каковы закономерности распределения этих
признаков в генеральной совокупности;
-рандомизация (перемешивание) - случайный ОТ,,:
бор наблюдений, фактов из генеральной совокуп
ности. При случайном отборе в выборку с равной
вероятностью должны попадать буквально все ком
поненты совокупности (пациенты, лабораторные животные и т. д.): имеющие и не имеющие суще.
ственных дЛя изучаемого явления признаков. Это.
достаточно сложное дело, поскольку необходимо
следить за тем, чтобы объем выборки при таком от боре признаков не оказался равным генеральной со
вокупности. Необходимо также априорное знание закона распределения основных (изучаемых) при
знаков в генеральной совокупности. Получить та
кую информацию заранее подчас очень сложно,
если вообще возможно.
Из всего сказанного должно стать ясным, что ни один
из способов обеспечения репрезентативности выборки не свободен от недостатков, и тем не менее включение этих
вопросов в планирование эксперимента необходимо, в
противном случае исследование любого уровня теряет вся кий смысл, и особенно, если во главу угла ставятся жизнь
и здоровье человека...
Итак, с позиций классической математической стати стики измеряемые признаки обязателltНО ДОJIЖIIЫ бьпь слу
чайными величинами, только тогда дЛя изучения законо
мерных изменений таких величин смогут использоваться
Глава 1. Введение 8 теориlO измерений |
7 |
хорошо себя зарекомеНдовавшие законы распределения
вероятностей.
Таким образом, наиболее важным законом распреде ления является нормальный закон (закон Гаусса) в кото
ром плотность распределения вероятностей задается сле
дующей формулой, а графически выражается колоколо образной, или «нормальной» кривой [23, 88]:
|
|
|
|
[х-х]2 |
|
|
|
|
j(x) = |
1 |
.е-202 |
, |
|
|
|
|
.J21t·cr |
|
|
|
где f(x) - |
функция плотности распределения вероятнос |
|||||
тей, cr - |
стандартное ОТЮIонение, х -. среднее значение |
|||||
признака х. |
|
|
|
|
||
|
|
|
|
|||
|
Кстати, слово «нормаль» |
и обозначает кривую, поэто- |
||||
|
|
...._--- ~ - '. |
, |
|
|
|
му выражение «нормальная кривая» - |
в некотором роде |
тавтология, но оно укоренилось в теории вероятностей и математической статистике, и мы, отдавая дань традиции,
" не будем этот факт ревизовать и оспаривать.
Исторически, когда-то на заре возникновения теории
вероятностей как науки, с помощью нормального рас пределения совокупностей люди пытались рассчитать
шанс наибольшего выигрыша в азартные игры (игральные карты, кости), но потом оказалось, что если игра честная,
то как выигрыш, так и проигрыш равновероятны - 50·: 50. Важным и интересным оказалось другое: закону Гаус
са подчиняются распределения в различных отраслях зна
ний, далеких от азартных игр. Оказалось, закон «(работа ет» в любых ситуациях, где оперируют большим количе ством разнородных и независимых факторов.
Хотя «(НОр'малЬНЫЙ закон» имеет богатую историю, од
нако до сих пор не утихают дискуссии о правомерности
использования его в медицинских, биологических гума
нитарных и социально-экономических науках.
На практике значение нормального закона для врача,
биолога состоит в следующем: коль скоро полученные дан ные подчиняются нормальному закону, то для их обработ-
8 |
Медицинская статистика |
ки можно применять широкий спектр статистических ме тодов (описательная, конструктивная статистика, методы
параметрические, непараметрические, методы проверки
гипотез и планирования эксперимента и т. д.), В против
ном случае класс допустимых математических методов су
щественно сужается и риск получения некорректного вы
вода вырастает в большую методологическую проблему.
Мы не ставили в данной работе цель .охватить неохват
ное из арсенала современных статистических методов и
методик и поэтому отсылаем заинтересованного читателя
к библиографии в конце книги, которая позволит подроб но ознакомиться практически со 8семи вариантами обра ботки эмпирического материала. Часть литературных ис
точников, приведенных нами, не содержит сложных
математических выкладок и рассчитана на «математика
любителя» с подготовкой на уровне средней школы. Дру
гая часть - это серьезные систематические исследования
в статистике, требующие основательной математической
подготовки и хорошего .владения постановкой научного
эксперимента.
А сейчас самая парадоксальная фраза, способная по
разить педанта от математики:-.для поиимаиия материала
данной книги матемаТll'lеская подготовка в прииципе может
не понадобиться вообще: во-первых, все примеры даны в
«рецептурном» плане с четким алгоритмом действий - от
постановки задачи до, ее завершения.
Во-вторых, нами предлагаются к использованию ста
тистические пакеты уже готовых программ обработки дан
ных, освоив которые любой человек, заинтересованный в
качественной обработке собственных данных, сможет
опосредованно (по ходу работы) вникнуть и в их матема- |
|
. |
, . |
тическую суть, если у него, конечно, возникнет такая по-
требность.
И все же не стоит рассматривать нашу работу как «по варенную книгу» для дилетантов: чтобы понять изложен ное в ней, надо все же разбираться в азах и математики, и
статистики. Но куда важнее то, что вам самому надо четко