Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Stat1.doc
Скачиваний:
4
Добавлен:
26.08.2019
Размер:
540.16 Кб
Скачать

Введение в теорию измерений

Необходимой составляющей направленного, специально организованного медико-биологического эксперимента (или обычного эмпирического исследования) является измерение, позволяющее перейти от качественного уровня анализа к выявлению количественных соотношений и закономерностей. Иногда в медицине встречаются и сугубо качественные переменные, но они, как правило, имеют спорадическую основу и появляются по сути предварительным, подготовительным этапом для перехода на более высокий уровень — количественный/

Объясняется такой подход к статистическому анализу совокупностей клинических и гигиенических данных во многом тем, что сегодняшняя медицина — это медицина третьего, надо сказать, самого низкого уровня диагностики и профилактики — нозологического. Она изначально ориентирована на количественные данные, а их надо было накопить, чтобы принять то или иное обоснованное решение. Качественные же характеристики до сих пор в таких ситуациях (особенно экстренных) большей частью оказывались малопригодны, так как их очень сложно формализовать и перевести на язык математических формул.

До сих пор основные понятия, используемые в медицине, биологии, — признак и переменная. Это измеримые явления и до некоторой степени взаимозаменимы.

С математической точки зрения переменные, извлекаемые из больших статистических массивов, обязательно случайные величины, конечно, если не нарушается условие равной вероятности каждого случая попасть в изучаемую совокупность данных, которых заранее не известно, какое именно значение они будут иметь в данном конкретном опыте.

Понятие измерения является глубоко дискуссионным, но эта проблема, во-первых, не цель данной книги, а во-вторых, вряд ли очередная дискуссия на тему измерений что-либо существенное добавит к сути обсуждаемых вопросов.

Логически шкала — необходимый, обязательный элемент измерительной процедуры. Основными типами измерительных шкал, применяемых в медико-биологических исследованиях, являются следующие:

  • номинальная, или шкала наименований, — призвана классифицировать свойства объекта, присваивать им числовые, буквенные и иные символьные характеристики;

  • порядковая, или ранговая, — упорядочивает значения признака;

  • интервальная — показывает «размах» отдельных измерений признака;

  • шкала отношений — выявляет соотношение измеренных значений признака.

Часто очень серьезной проблемой медико-биологических (диагностических, гигиенических) исследований является фактическое отсутствие естественных интервальных шкал и тем более шкал отношений для оцениваемых переменных. Специалистами в вопросах математической статистики для этих целей разработаны специальные процедуры, позволяющие построить интервальные шкалы. И несмотря на то, что такие приемы имеют искусственное происхождение, эти издержки перекрываются обилием математических методов, имеющих глубокое теоретическое обоснование. В современной статистике наиболее используемы такие:

  • шкала стэнов (от англ. — десятка): десятибалльная шкала со средним Х= 5,5 и стандартным отклонением 0 = 2;

  • шкала стэнайнов (от англ. — девятка): девятибалльная шкала, имеющая среднее значение, равное 5, и стандартное отклонение, приблизительно равное 2;

  • процентильная шкала.

Врач, биолог, химик обычно имеют дело с выборкой (частью или долей, значительно большей по численности группы, называемой генеральной совокупностью). Конечной целью любого исследования и анализа является переложение выводов, полученных в выборке, на изучаемую генеральную совокупность. И, естественно, в таком деле нельзя обойтись без статистических методов.

Выборки бывают независимые (несвязанные), если процедура оценки результатов измерения в них не оказывается взаимопроникающей, не влияет на результаты другой выборки. В том случае, когда такое влияние имеет место, выборки называются зависимыми (связанными) .

Выборка должна быть репрезентативной, т. е. обладать способностью адекватно представлять генеральную совокупность и позволять переложить на последнюю выводы, полученные на ограниченном экспериментальном мате-риале.

И хотя выборка обычно всегда значительно меньше по размеру, чем генеральная совокупность, но она не может не быть близкой по статистическим характеристикам генеральной совокупности: среднее значение признака, стандартное отклонение (старое название — среднеквадратическое), стандартная ошибка среднего значения признака и др.

Добиться репрезентативности в силу разных причин очень трудно. Для облегчения ситуации разработан ряд приемов:

  • представленность основных признаков в выборке должна быть в том же соотношении, что и генеральная совокупность. Трудности здесь состоят в том, что практически всегда отсутствует информация о том, какие признаки являются важными для изучаемого явления, а какие нет, и, самое существенное, — о том, каковы закономерности распределения этих признаков в генеральной совокупности;

  • рандомизация (перемешивание) — случайный отбор наблюдений, фактов из генеральной совокупности. При случайном отборе в выборку с равной вероятностью должны попадать буквально все компоненты совокупности (пациенты, лабораторные животные и т. д.): имеющие и не имеющие существенных для изучаемого явления признаков. Это достаточно сложное дело, поскольку необходимо следить за тем, чтобы объем выборки при таком отборе признаков не оказался равным генеральной совокупности. Необходимо также априорное знание закона распределения основных (изучаемых) признаков в генеральной совокупности. Получить такую информацию заранее подчас очень сложно, если вообще возможно.

Из всего сказанного должно стать ясным, что ни один из способов обеспечения репрезентативности выборки не свободен от недостатков, и тем не менее включение этих вопросов в планирование эксперимента необходимо, в противном случае исследование любого уровня теряет вся-кий смысл, и особенно, если во главу угла ставятся жизнь и здоровье человека...

Итак, с позиций классической математической статистики измеряемые признаки обязательно должны быть случайными величинами, только тогда для изучения закономерных изменений таких величин смогут использоваться хорошо себя зарекомендовавшие законы распределения вероятностей.

Таким образом, наиболее важным законом распределения является нормальный закон (закон Гаусса) в котором плотность распределения вероятностей задается следующей формулой, а графически выражается колоколообразной, или «нормальной» кривой [23, 88]:

где — функция плотности распределения вероятностей, — стандартное отклонение, — среднее значение признаках.

Исторически, когда-то на заре возникновения теории вероятностей как науки, с помощью нормального распределения совокупностей люди пытались рассчитать шанс наибольшего выигрыша в азартные игры (игральные карты, кости), но потом оказалось, что если игра честная, то как выигрыш, так и проигрыш равновероятны — 50 : 50.

Важным и интересным оказалось другое: закону Гаусса подчиняются распределения в различных отраслях знаний, далеких от азартных игр. Оказалось, закон «работает» в любых ситуациях, где оперируют большим количеством разнородных и независимых факторов.

Хотя «нормальный закон» имеет богатую историю, однако до сих пор не утихают дискуссии о правомерности использования его в медицинских, биологических гуманитарных и социально-экономических науках.

На практике значение нормального закона для врача, биолога состоит в следующем: коль скоро полученные данные подчиняются нормальному закону, то для их обработки можно применять широкий спектр статистических методов (описательная, конструктивная статистика, методы параметрические, непараметрические, методы проверки гипотез и планирования эксперимента и т.д.), в противном случае класс допустимых математических методов существенно сужается и риск получения некорректного вывода вырастает в большую методологическую проблему.

Мы не ставили в данной работе цель охватить неохватное из арсенала современных статистических методов и методик и поэтому отсылаем заинтересованного читателя к библиографии в конце книги, которая позволит подробно ознакомиться практически со всеми вариантами обработки эмпирического материала. Часть литературных источников, приведенных нами, не содержит сложных математических выкладок и рассчитана на «математика-любителя» с подготовкой на уровне средней школы. Другая часть — это серьезные систематические исследования в статистике, требующие основательной математической подготовки и хорошего владения постановкой научного эксперимента.

А сейчас самая парадоксальная фраза, способная поразить педанта от математики:_для понимания материала данной книги математическая подготовка в принципе может не понадобиться вообще: во-первых, все примеры даны в «рецептурном» плане с четким алгоритмом действий — от постановки задачи до ее завершения.

Во-вторых, нами предлагаются к использованию статистические пакеты уже готовых программ обработки данных, освоив которые любой человек, заинтересованный в качественной обработке собственных данных, сможет опосредованно (по ходу работы) вникнуть и в их математическую суть, если у него, конечно, возникнет такая потребность.

И все же не стоит рассматривать нашу работу как «поваренную книгу» для дилетантов: чтобы понять изложенное в ней, надо все же разбираться в азах и математики, и статистики. Но куда важнее то, что вам самому надо четко понимать, какую информацию вы хотите «выжать» из собственных экспериментальных данных. В чем вы видите суть своих исследований, потому что, кроме вас, на эти вопросы не ответит и самый распрекрасный специалист-статистик, если, конечно, он дополнительно к своей профессии не владеет еще и вашей...

Построили же свою работу мы так сознательно, поскольку личный опыт убеждает в том, что, если математические «навороты» «обрушиваются» на читателя с первых же страниц, то они в конечном счете сослужат авто-рам книги медвежью услугу, отбивая всякую охоту у читателя не математика к освоению пропагандируемых приемов обработки статистических данных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]