- •Описательная статистика. Основные понятия биометрии
- •Основные характеристики статистических совокупностей. Средние величины и показатели вариации. Квантили и выбросы
- •Квантили.
- •Вариационные ряды. Построение интервального ряда
- •Случайные величины и их распределение
- •Оценки. Статистические ошибки
- •Статистика выводов
- •Критерии достоверности оценок. Статистические гипотезы, их проверка
- •Асимметрия и эксцесс.
- •Непараметрические критерии
- •Первичная статистическая обработка экспериментальных данных
Описательная статистика. Основные понятия биометрии
Основной целью описательной статистики (descriptive statistics) является сведение многих наблюдений к нескольким итоговым параметрам с помощью различных математических инструментов. Грамотно выполненное описание набора данных описательной статистики (анализ) позволяет перейти к статистике выводов (inferential statistics).
Биометрия – наука о статистическом анализе массовых явлений в биологии, т.е. таких явлений, в массе которых обнаруживаются закономерности, не выявляющиеся на единичных случаях наблюдений. Предметом биометрии служит любой биологический объект, изучаемый с применением счета или меры. Обычно наблюдения проводят на групповых объектах, например на особях одного и того же вида, пола и возраста, которые называют единицами наблюдения.
Множество относительно однородных единиц наблюдения, объединенных для совместного изучения, называют статистической совокупностью. Множество, состоящее из разнородных групп, называется статистическим комплексом. При этом каждая группа, входящая в состав комплекса, должна состоять из однородных элементов. Например, в массе подопытных животных наряду с контролем может быть несколько групп, отличающихся друг от друга по возрасту, породной или видовой принадлежности и т. п., на которых испытывают действие изучаемого агента. В статистических совокупностях и в статистических комплексах существует внутренняя связь между частью и целым, единичным и общим, что выражается в определенных статистических закономерностях. Эти закономерности являются теоретической платформой, на которой базируется биометрия.
Наблюдения над биологическими объектами проводятся по тем или иным признакам. Признак – это свойство, проявлением которого один предмет отличается от другого. Например, если изучаемый признак – количество зерен в колосьях пшеницы, тогда отдельные растения – это единицы наблюдения, вместе составляющие статистическую совокупность, а все поле пшеницы будет являться объектом наблюдения.
Величина любого варьирующего признака является переменной случайной величиной. Колебания величины одного и того же признака статистической совокупности, называют вариациями, а отдельные числовые значения варьирующего признака - вариантами. Систематическая вариация – изменение признака в определенном направлении. Случайной называется вариация, не имеющая явно выраженного направления. Признаки подразделяются на качественные (атрибутивные) и количественные.
Количественные (quantitative) имеют конкретные числовые значения и могут быть дискретными (счетными) или непрерывными (мерными).
Непрерывные переменные (continuous) (например, рост, вес), варьируют непрерывно, их величина может принимать в определенных пределах любые числовые значения. Дискретные (discrete) (например, количество), варьируют прерывисто или дискретно: их числовые значения выражаются только целыми числами.
Качественные признаки (qualitative) не поддаются непосредственному измерению или счету и учитываются по наличию их свойств у отдельных членов изучаемой группы. Примером качественных признаков может быть пол, национальность человека, его имя, цвет глаз, волос. Качественные переменные можно разбить на два типа: порядковые и номинальные. Порядковые переменные (ordinal) можно упорядочить, например оценки или фамилии и имена (по возрастанию или убыванию). Номинальные (nominal) качественные переменные нельзя упорядочить, например, национальность, пол. Если признаки можно противопоставить друг другу, их называют альтернативными, например: женский - мужской, больной - здоровый.
Генеральной совокупностью называют совокупность объектов или наблюдений, все элементы которой подлежат изучению при статистическом анализе. Отобранная тем или иным способом часть генеральной совокупности получила название выборочной совокупности или выборки. Общую сумму членов генеральной совокупности называют ее объемом и обозначают буквой N. Объем выборки, обозначаемый буквой п должен содержать не менее двух единиц. Выборка должна быть достаточно представительной, или репрезентативной. Репрезентативность выборки достигается способом рандомизации или случайным отбором вариант из генеральной совокупности. Существует два основных способа отбора вариант из генеральной совокупности; повторный и бесповторный. Повторный отбор производят по схеме «возвращения» учтенных единиц в генеральную совокупность. При бесповторном отборе учтенные единицы не возвращаются, его обычно применяют в практике. Идеальный случайный отбор производится по методу жеребьевки или лотереи, а также с помощью таблицы случайных чисел.
Обработка результатов начинается с упорядочивания или систематизации собранных данных. Процесс объединения их в относительно однородные группы по некоторому признаку называется группировкой. Наиболее распространенной формой группировки являются статистические таблицы, которые бывают простыми и сложными. К простым относятся, например, четырехпольные таблицы, применяемые по альтернативной группировке, когда одна группа вариант противопоставляется другой (больные - здоровые).
К сложным относятся многопольные таблицы, применяемые при изучении корреляционной зависимости и при выяснении причинно-следственных отношений между варьирующими признаками. Особую форму группировки представляют статистические ряды - ряды числовых значений признака, расположенных в определенном порядке. В зависимости от изучаемого признака, их делят на атрибутивные, вариационные, ряды динамики и регрессии, а также ряды ранжированных признаков.
Таблица, в которой собраны сведения о том, сколько раз в совокупности встречаются данные с определенной величиной, называется таблицей частот (frequency table). Вариационным рядом (точнее будет сгруппированным вариационным рядом) или распределением называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной статистической совокупности (также вариационным рядом называют просто ранжированные данные изучаемой совокупности).
Варианты обозначаются хi, а числа показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой fi.
Общая сумма частот вариационного ряда равна объему данной совокупности:
, где n – общее число наблюдений (или объем совокупности).
Ранжирование - расположение членов ряда в возрастающем или убывающем порядке.
Количественные признаки распределяются в вариационный ряд, качественные – нет.