Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Описательная статистика. Основные понятия биоме...doc
Скачиваний:
18
Добавлен:
12.09.2019
Размер:
659.46 Кб
Скачать

Описательная статистика. Основные понятия биометрии

Основной целью описательной статистики (descriptive statistics) является сведение многих наблюдений к нескольким итоговым параметрам с помощью различных математических инструментов. Грамотно выполненное описание набора данных описательной статистики (анализ) позволяет перейти к статистике выводов (inferential statistics).

Биометрия – наука о статистическом анализе массовых явлений в биологии, т.е. таких явлений, в массе которых обнаруживаются закономерности, не выявляющиеся на единичных случаях наблюдений. Предметом биометрии служит любой биологический объект, изучаемый с применением счета или меры. Обычно наблюдения проводят на групповых объектах, напри­мер на особях одного и того же вида, пола и возраста, которые называют единицами наблюдения.

Множество отно­сительно однородных единиц наблюдения, объединенных для совместного изучения, называют статистической совокупностью. Множество, состоящее из разнородных групп, называется ста­тистическим комплексом. При этом каждая группа, входящая в состав комплекса, должна состоять из однородных элементов. Например, в массе подопытных жи­вотных наряду с контролем может быть несколько групп, отличающихся друг от друга по возрасту, породной или видовой принадлежности и т. п., на которых испытывают дейст­вие изучаемого агента. В статистических совокупностях и в статистических комплексах существует внутренняя связь между частью и целым, единичным и общим, что выражается в определенных статис­тических закономерностях. Эти закономерности являются теоретической плат­формой, на которой базируется биометрия.

Наблюдения над биологическими объектами проводятся по тем или иным признакам. Признак – это свойство, проявлением которого один предмет отличается от другого. Например, если изучаемый признак – количество зерен в колосьях пшеницы, тогда отдельные растения – это единицы наблюдения, вместе составляющие статистическую совокупность, а все поле пшеницы будет являться объектом наблюдения.

Величина любого варьирующего признака является переменной случайной величиной. Колебания величины одного и того же признака статистической совокупности, называют вариациями, а отдельные числовые значения варьирующего признака - вариантами. Систематическая вариация – изменение признака в определенном направлении. Случайной называется вариация, не имеющая явно выраженного направления. Признаки подразделяются на качественные (атрибутивные) и количественные.

Количественные (quantitative) имеют конкретные числовые значения и могут быть дискретными (счетными) или непрерывными (мерными).

Непрерывные переменные (continuous) (например, рост, вес), варьируют непрерывно, их величина может принимать в определенных пределах любые числовые значения. Дискретные (discrete) (например, количество), варьируют прерывисто или дискретно: их числовые значения выражаются только целыми числами.

Качественные признаки (qualitative) не поддаются непосредственному измерению или счету и учитываются по наличию их свойств у отдельных членов изучаемой группы. Примером качественных признаков может быть пол, национальность человека, его имя, цвет глаз, волос. Качественные переменные можно разбить на два типа: порядковые и номинальные. Порядковые переменные (ordinal) можно упорядочить, например оценки или фамилии и имена (по возрастанию или убыванию). Номинальные (nominal) качественные переменные нельзя упорядочить, например, национальность, пол. Если признаки можно противопоставить друг другу, их называют альтернативными, например: женский - мужской, больной - здоровый.

Генеральной совокупностью называют совокупность объектов или наблюдений, все элементы которой подлежат изучению при статистическом анализе. Отоб­ранная тем или иным способом часть генеральной совокупно­сти получила название выборочной совокупности или выборки. Общую сумму членов генеральной совокупности называют ее объемом и обозначают буквой N. Объем выборки, обозначаемый буквой п должен содержать не менее двух единиц. Выборка должна быть достаточно представительной, или репрезентативной. Репрезентативность выборки достигается способом рандомизации или случайным отбором вариант из генеральной совокуп­ности. Существует два основных способа отбора вариант из гене­ральной совокупности; повторный и бесповторный. Повторный отбор производят по схеме «возвращения» учтенных единиц в генеральную совокупность. При бесповторном отборе уч­тенные единицы не возвращаются, его обычно применяют в практике. Идеальный случайный отбор производится по методу же­ребьевки или лотереи, а также с помощью таблицы случайных чисел.

Обработка результатов начинается с упорядочивания или систематизации собранных данных. Процесс объединения их в относительно однородные группы по некоторому признаку называется группировкой. Наиболее распространенной формой группировки являются статистические таблицы, которые бывают простыми и сложными. К простым относятся, например, четырехпольные таблицы, применяемые по альтернативной группировке, когда одна группа вариант противопоставляется другой (больные - здоровые).

К сложным относятся многопольные таблицы, применяемые при изучении корреляционной зависимости и при выяснении причинно-следственных отношений между варьирующими признаками. Особую форму группировки представляют статистические ряды - ряды числовых значений признака, расположенных в определенном порядке. В зависимости от изучаемого признака, их делят на атрибутивные, вариационные, ряды динамики и регрессии, а также ряды ранжированных признаков.

Таблица, в которой собраны сведения о том, сколько раз в совокупности встречаются данные с определенной величиной, называется таблицей частот (frequency table). Вариационным рядом (точнее будет сгруппированным вариационным рядом) или распределением называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной статистической совокупности (также вариационным рядом называют просто ранжированные данные изучаемой совокупности).

Варианты обозначаются хi, а числа показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой fi.

Общая сумма частот вариационного ряда равна объему данной совокупности:

, где n – общее число наблюдений (или объем совокупности).

Ранжирование - расположение членов ряда в возрастающем или убывающем порядке.

Количественные признаки распределяются в вариационный ряд, качественные – нет.