- •Глава 1
- •1.1. Понятие "социальная статистика"
- •1.2. Взаимосвязь социальной
- •1.3. Предмет исследования в социальной статистике
- •1.4. Актуальность социальных проблем
- •1.5. Основные задачи социальной статистики
- •1.6. Практическое использование данных
- •1.7. Объекты социальной статистики
- •1.8. Обобщение информации по социальной сфере
- •Глава 2
- •2.1. Характеристики
- •2.2. Группировки населения и система показателей
- •Б) на 1 января 2000 г.
- •Динамика возрастной структуры населения России за период 1970-1999 гг.
- •23. Методы изучения динамики состава населения
- •Глава 3
- •3.1. Семья в системе общественных отношений
- •3.2. Семья и домохозяйство как элементы структуры населения
- •3.3. Типология семей и домохозяйств
- •3.4. Система показателей и прогнозирование структуры домохозяйств
- •Глава 4
- •4.1. Понятие "уровень жизни населения" его составляющие
- •4.2. Социальные нормативы и потребности
- •4.З. Задачи изучения уровня жизни
- •4.4. Системы показателей
- •VII. Малообеспеченные слои населения.
- •4.5. Общая оценка уровня жизни
- •4.6. Обобщающие показатели развития человеческого потенциала
- •Глава 5
- •5.1. Источники данных и задачи статистики при изучении доходов и расходов населения
- •5.2. Концепция доходов дж. Хикса и система макропоказагелей, характеризующая доходы, в снс
- •5.3. Межстрановые сравнения доходов населения на базе паритетов покупательной способности валют
- •5.4. Баланс денежных доходов и расходов населения, показатели на его основе
- •5.5. Формирование выборочной сети бюджетов домашних хозяйств
- •5.6. Программа наблюдения
- •5.7. Модели распределения населения по среднедушевому денежному доходу (расходу)
- •5.8. Дифференциация доходов
- •5.9. Методы измерения
- •5. 10. Индексация доходов
- •Глава 6
- •6.1. Потребление населения и его законодательное регулирование
- •6.2. Источники данных
- •6.3. Фонд потребления населением, основных продуктов питания
- •6.4. Изучение потребления
- •6.5. Методы изучения
- •6. 6. Прожиточный минимум
- •6.7. Динамика потребления населения и потребительских цен
- •6.8. Индекс потребительских настроений.
- •6,9. Модели потребления
- •Глава 7
- •7.1. Задачи статистики. Источники данных
- •7.2. Характеристика жилищных условий
- •2. Движение жилищного фонда:
- •3. Капитальный ремонт и реконструкция жилищного фонда:
- •4. Благоустройство жилищного фонда:
- •5. Обеспеченность населения жильем:
- •7.3. Показатели обслуживания
- •7.4. Статистика развития бытового и транспортного обслуживания населения, услуг связи
- •7.5. Оценка населением жилищных условий и социальной инфраструктуры
- •7.6. Рынок жилья
- •Глава 8
- •8.1. Бюджет времени населения, его структура
- •51 Тыс. Семей в марте 1985г.
- •8.2. Показатели использования свободного времени
- •Глава 9
- •9.1. Задачи статистики. Источники данных
- •9.2. Уровни занятости и безработицы
- •9.3. Трудоустройство населения
- •9.4. Состав безработных
- •9.5. Состав занятых
- •9.6. Содержание труда
- •9.7. Критическая зона рынка труда
- •Глава 10
- •10.1. Задачи статистики. Источники данных
- •10.2. Показатели здоровья населения
- •10.3. Характеристики здравоохранения,
- •10.4. Клиническая статистика
- •Глава 11
- •11.1. Источники информации
- •11.2. Уровень образования населения
- •11.3. Международные классификации
- •11.4. Российская система образования
- •11.5. Дошкольное обучение
- •11.6. Статистика школьного
- •11.7. Методика изучения
- •11.8. Профессиональное образование
- •11.9. Построение и анализ
- •Глава 12
- •12.1. Источники информации
- •12.2. Обеспечение населения информацией
- •12.3. Потребление населением услуг
- •Глава 13
- •13.1. Понятие
- •13.2. Методические основы
- •13.3. Правовая статистика
- •Глава 14
- •14.1. Задачи и структура. Источники данных
- •14.2. Показатели статистики
- •14.3. Характеристика
10.4. Клиническая статистика
Клиническая статистика изучает достоверность результатов клинических и лабораторных испытаний, связанных с выбором методов лечения, оценкой существенности различий в течение болезни и т. д. Выводы, основанные на данных клинической статистики, зависят от численности наблюдаемых единиц (л) и от методов их сбора. Установление значимых факторов достигается применением группировок, после чего с помощью, например, дисперсионного анализа определяется статистическая значимость различий между группами, т. е. делается вывод о значимости или незначимости фактора, положенного в основу группировки.
Исходная информация, как правило, содержит количественные и неколичественные переменные. Они обобщаются в "перекрестные таблицы» —таблицы сопряженности, чаще всего четырехклеточные, в которых для каждого объекта устанавливается: присутствуют или отсутствуют у него признаки А и Б (табл. 10.8).
Прежде чем собрать данные, необходимо установить объемы выборки, поскольку от того, сколько объектов охвачено, зависят выводы, Чаще всего клинические испытания основаны на сравнении двух групп (двух выборок) равного объема, и проверяется существенность различий долей. т. е. пропорций в этих группах— и . Для этого рассчитывается объем выборки, обеспечивающий достаточную степень приближения при заданных уровнях значимости и мощности. Разработаны специальные таблицы, которые содержат требуемые размеры для двух равных по объему выборок из двух групп при различных значениях предполагаемых пропорций и для различных уровней значимости ( =0,1,0,02; 0,05 и др.) и различных значений мощности ( =0,5; 0,95; 0,99).
Таблица 10.8
Четырехклеточная таблица сопряженности
Группы по наличию признака А |
Группа по наличию признака Б |
Итого |
||||
|
Есть |
Нет |
|
|||
Есть |
|
|
|
|||
Нет |
|
|
|
|||
Итого |
|
|
|
В исследованиях, характеризующих жизнь и здоровье людей, уровень значимости (вероятность ошибки первого рода) должен быть достаточно мал: 0,02, 0,01 или 0,005. Таблицы требуемого объема выборок при заданных условиях приведены, например, в книге Дж. Флейса1.
Выводы клинического и лабораторного исследования во многом зависят от того, как проводился отбор объектов. Последние должны быть отобраны случайно, т. е. необходима рандомизация (от англ. слова random — случайность), которая гарантирует, что наши наклонности и предпочтения не повлияют на формирование групп.
Рандомизация проводится разными способами. Если, например, нужно в клинических условиях испытать лекарственный препарат, чтобы установить его эффективность, то одним 30 больным можно назначать этот лекарственный препарат, а другим 30 больным — нейтральный препарат. Эксперимент можно начать сразу в полном масштабе, отобрав по таблице случайных чисел числа, соответствующие номерам объектов (скажем, с 1 по 60), и организовать испытание медикамента,
Возможен и иной вариант: например, отбирать для обследования группы по 10 человек. Тогда из таблицы случайных чисел отбираются числа от 0 до 9. При этом пяти первым отобранным номерам будут соответствовать те лица, которые будут принимать активный препарат, а остальным — тех, кто будет принимать нейтральный препарат. Если, например, отбор начинается с седьмого столбца таблицы случайных чисел, то первыми пятью пациентами окажутся лица с номерами 1, 5, 9, 0 (т. е. 10), 4 —им должно быть назначено лекарство, а остальным номерам — 2, 6, 3, 7, 8 нейтральный препарат. Из следующих десяти — лица с номерами 7, 8,1, 9,3 получат активный препарат, остальные—нейтральный и т. д.
Можно отбирать не единицами, а парами: один из пациентов пары будет получать активный, а другой — нейтральный препарат. По первой букве фамилии или имени выбирают одного из двух как первого пациента. Чтобы решить вопрос, какой препарат он будет принимать, договариваются о том, что если первая цифра в первом столбце будет нечетная, то первый будет применять активный препарат, а второй — нейтральный; если первая цифра четная, то второй пациент будет применять активный препарат, а первый — нейтральный.
1См.: Флейс Дж. Статистические методы для изучения таблиц долей и пропорций: Пер. с англ. / Под ред. Ю. Н. Благовещенского. — М.: Финансы и статистика 1989.
Таблица 10.9
Распределение новорожденных-первенцев по весу и возрасту матери
Возраст матери, лет |
Вес новорожденного, г |
Итого |
|
до 3000 |
3000 и более |
||
20—29 |
15 |
135 |
150 |
30—39 |
10 |
40 |
50 |
Итого |
25 |
175 |
200 |
Описанные методы рандомизации чаще применяют в сочетании со стратификацией (от лат. stratum — слой + facere — делать), т. е. разделение пациентов на определенные страты (группы). Например, предварительно выделяют из всех пациентов мужчин в возрасте 20—29 лет, 30—39 лет; женщин в возрасте 20—29 лет, 30—39 лет и т. д. Затем внутри каждой страты применяют методы рандомизированного отбора. Стратификация может производиться не только по полу и возрасту, но и по профессиональным группам, различиям в стадии и тяжести заболевания, месту жительства пациентов и т. д.
Если собранные данные представлены в четырехклеточной таблице сопряженности, то обычно проверяется гипотеза об отсутствии связи между признаками, по которым проведена группировка. Это может быть анализ связи между весом новорожденного-первенца и возрастом матери (табл. 10.9).
Проверим гипотезу о независимости признаков с помощью критерия хи-квадрат (без теоретических частот, с учетом поправки на непрерывность):
По данным табл. 10.9 получаем:
Поскольку эта величина меньше табличного значения критерия при уровне значимости = 0,05, числе степеней свободы (2 - 1) • (2 - 1) = 1, то связь между весом новорожденного и возрастом матери статистически незначима.
В случае таблицы сопряженности большего размера применяется метод ее декомпозиции: выделяются фрагменты 2х2, производятся расчет критерия хи-квадрат для каждого фрагмента, оценка статистической значимости связи для каждого фрагмента и измерение вклада в общую величину критерия хи-квадрат, основанного на всей исходной таблице. Применение этого метода анализа показано в главе 7.
В клинической статистике проверяются не только непараметрические, но и параметрические гипотезы, например, гипотезы о равенстве среднего содержания холестерина в крови у пациентов разных возрастных групп и т. д.
Одним из основных инструментов клинической статистики является дисперсионный анализ, используемый для установления факта значимого или незначимого влияния каких-либо признаков и их взаимодействия. Применяются методы многомерной классификации данных. Часто возникает необходимость решения задачи отнесения больного к той или иной группе. Для этого используется дискриминантный анализ. Этот же метод применяется для оценки влияния совокупности факторов риска на развитие заболевания. Так, в книге А. Афифи и С. Эйзена1 дается пример дискриминантного анализа для описания зависимости от семи факторов риска апостериорной вероятности развития ише-мической болезни у 1929 мужчин и 2540 женщин в возрасте от 30 до 62 лет, причем в начале обследования все пациенты были здоровы, В качестве факторов риска были взяты: возраст (лет), количество холестерина в крови (мг/100 мл), систолическое давление (мм. рт. ст.), относительный вес (100вес—средний вес обследуемых той или иной половой группы), количество гемоглобина в крови (г/100 мл), количество выкуриваемых вдень сигарет (0 — для некурящих, 1 — выкуривающих менее одной пачки, 2 — одну пачку, 3 — более одной пачки), электрокардиограмма (0 — нормальная, 1 —ненормальная или неясная). В результате расчета вероятности развития ишемической болезни для каждого пациента было определено ожидаемое число случаев болезни,
Клиническая статистика позволяет установить социально значимые связи. Например, в результате специальных обследований в США установлено, что примерно 80% детей, родившихся недоношенными (весом до 1 кг), имеют отставание в умственном развитии. Поскольку успехи медицины повышают шансы выживания недоношенных, общество должно быть готово принять на себя определенные обязательства по социальной защите этой категории. Большое общественное значение имеют результаты клинической статистики, связанные с проверкой влияния загрязнения окружающей среды на здоровье населения.
1См.: Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ /Пер. с англ. — М,: Мир, 1982, — С. 333.