- •Методы биостатистики Описание данных: качественные, порядковые и количественные данные Шкалы измерения
- •Качественные данные. Шкала классификации (номинальная).
- •Порядковые данные. Шкала порядка.
- •Количественные данные. Шкала интервалов и шкала отношений.
- •Статистический анализ данных.
- •Числовые характеристики случайной величины
- •Законы распределения дискретных случайных величин
- •Биномиальное распределение (распределение Бернулли)
- •Распределение Пуассона
- •Законы распределения непрерывных случайных величин
- •Нормальный закон распределения (Гаусса)
- •Распределение
- •Распределение Стьюдента (Госсета)
- •Эмпирические законы распределения случайных величин
Методы биостатистики Описание данных: качественные, порядковые и количественные данные Шкалы измерения
Обработать статистическими методами можно только то, что поддается измерению. В связи с этим необходимо рассмотреть существующие шкалы измерения. Измерение – это присвоение чисел предметам или событиям, которое базируется на некоторой системе правил. Необходимо, чтобы для величин, которые представляют собой результаты измерения, выполнялись следующие условия.
Тождественность:
Или А=В или АВ
Если А=В, то В=А
Транзитивность
Если А=В и В=С, то А=С
Ранговый порядок
Если А>В, то В<А
Если А>B и B>C, то A>C
Аддитивность
Если А=В и С>0, то А+С>В
А+В=В+А
Если А=В и С=D, то А+С=В+D
(A+B)+C=A+(B+C)
В зависимости от возможных исполнений этих условий, а также операций над измеряемыми значениями существуют следующие шкалы измерения:
- шкала классификации (номинальная)
- шкала порядка
- шкала интервалов
- шкала отношений
Эти четыре шкалы измерения принадлежат к трем типам данных: качественные, порядковые и количественные.
Качественные данные. Шкала классификации (номинальная).
Никакие операции сравнения качественных данных, кроме «равняется» и «не равняется», невозможны. Качественные данные описываются номинальными категориями (например, пол, цвет волос, группа крови и т.п.). Номинальные переменные – наблюдение, классифицированные в одну из целого ряда взаимоисключающих категорий. Например, человек может иметь лишь одну из четырех групп крови (I, II, III, IV).
Порядковые данные. Шкала порядка.
Возможное сравнение объектов за величиной - «больше» или «меньше». Другие операции невозможны. Порядковые данные представляют колебания (например, стадии болезни, социальный статус, развитие ребенка и т.п.). Соответствующие наблюдения могут быть представлены упорядоченными категориями такими, как “хорошо”, “среднее” и “плохо”.
Порядковые данные являются субъективными в измерении. Это обусловлено размещением данных об индивидууме в одной из категорий. Например, болезнь человека может быть описана категориями как легкая, средняя или тяжелая форма болезни. Существует определенные трудности в определении попадания признака, который изучается, в ту или другую категорию. Например, сравнивая состояние больного, мы можем определить тяжелое состояние и отдифференцировать его от среднего, в то время когда разность между легким и средним состоянием менее очевидная. Найти среднее значение порядковых данных невозможно, например, найти средний уровень болезни.
Количественные данные. Шкала интервалов и шкала отношений.
В шкале интервалов возможное не только сравнение по величине, но и определение «на сколько больше» (т.е. возможные операции «сложение» и «вычитание»). Что же касается шкалы отношений, то здесь возможное выяснение вопроса «в сколько раз» (т.е. выполняются все операции: «сравнение», «сложение», «вычитание», «умножение» и «деление»)
Количественными данными представляют результаты вычисления или измерения
дискретные данные (категоричные данные) представляют результаты вычислений исследования (например, количество клеток крови, количество больных и т.п.);
непрерывные данные представляют результаты измерений исследования (например, данные биопотенциалов мозга, электрокардиограммы, наблюдение за концентрацией глюкозы сыворотки и т.п.).
В процессе развития науки и средств измерения возможный переход от одной шкалы измерения к другой, более усовершенствованной. Ведь первые термометры, например, измеряли температуру в шкале порядка (“умеренно”, “тепло”, “горячо” и т.д.).
Иногда также говорят о дискретных и непрерывных шкалах измерения. В общем случае к дискретным относятся шкала классификации и шкала порядка. В этих шкалах нет промежуточных значений, их часто называют неколичественными.
Шкала измерения, конечно, накладывает ограничения на статистические характеристики, которые могут быть вычислены для случайных переменных, измеренных в конкретной шкале, и на методы обработки, которые корректно можно применять к ним.
В зависимости от вида шкалы измерения переменных для исследования связей между ними используются разные статистические методы: регрессионный и корреляционный анализ, анализ числовых рядов и т.д.