Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Описательная статистика. Основные понятия биоме...doc
Скачиваний:
18
Добавлен:
12.09.2019
Размер:
659.46 Кб
Скачать

Случайные величины и их распределение

Числовые показатели, характеризующие генеральную сово­купность некоторой случайной величины, называют генеральными параметрами, а числовые показатели, ха­рактеризующие выборку,— выборочными характеристиками или статистиками. Генеральные характеристики принято обоз­начать буквами греческого алфавита, а выборочные — латинского. К выборочным характеристикам относятся , sх2, sх, к соответствующим выборочным параметрам - генеральная средняя (математическое ожидание) х, генеральная дисперсия х2, среднее квадратическое отклоне­ние х.

Случайной величиной называют переменную величину, которая в одних и тех же условиях принимает различные числовые значения, зависящие от случая. Случайная величина называется дискретной, если она может принимать только целые значения. Случайная величина, принимающая все значения из некоторого промежутка, называется непрерывной случайной величиной. Счетные признаки, варьирующие дискретно, относятся к дискретным случайным величинам, а мерные признаки, варьирующие непрерывно, - к непрерывным случайным величинам.

Значения случайных величин невозможно предугадать даже при полностью известных условиях эксперимента, в котором они измеряются. Можно лишь указать вероятности того, что случайная величина принимает то или иное значение или попадает в то или иное множество. Но, зная распределения вероятностей этих случайных величин, можно сделать выводы о событиях, в которых участвуют случайные величины. Каждая случайная величина полностью определяется своей функцией распределения, которая содержит всю информацию об этой величине, то есть изучение случайной величины заключается в исследовании ее функции распределения.

Если случайная величина X принимает конечное множество значений x1, x2,… xn соответственно с вероятностями р1, р2,… рn, то функция Р(X), связывающая значения xi с их вероятностями pi называется законом распределения случайной величины, который можно выразить в виде таблицы:

X x1 x2 x3xn

Р(X) p1 p2 p3pn

Закон распределения дискретной случайной величины можно описать с помощью формулы Бернулли. Но для непрерывной случайной величины можно лишь говорить о ее значениях, которые она может принять с той или иной вероятностью в некотором интервале. Вероятность Р(xi) любого значения xi непрерывно распределяющейся случайной величины находится в интервале от х до x + dx и определяется по формуле Гаусса-Лапласа (нормальное распределение):

где dx – малая величина, определяющая ширину интервала, - стандартное отклонение, характеризующее степень рассеяния значений xi случайной величины Х вокруг генеральной средней . В показатель степени числа е входит нормированное отклонение t.

Закон нормального распределения выражает функциональную связь между вероятностью Р(xi) и нормированным отклонением t. Он утверждает, что вероятность отклонения любой варианты (xi) от центра распределения , где (xi) = 0, определяется функцией нормированного отклонения t. Графически эта функция выражается в виде кривой вероятности называемой нормальной кривой. Положение этой кривой полностью определяется двумя параметрами математическим ожиданием и стандартным отклонением . В зависимости от величины форма нормальной кривой может быть пологой (при относительно большой величине ) или крутой (при небольшой величине ). Но во всех случаях нормальная кривая строго симметрична относительно центра распределения и сохраняет правильную колоколообразную форму. Если стандартное отклонение приравнять к 1, то нормальная кривая будет иметь постоянную (стандартизированную) форму (ymax = 0,3989).

Параметры нормального распределения. Нормальное распределение случайной величины X характеризуется двумя основными параметрами: средней величиной, или математическим ожиданием x, и диспер­сией x2. Для дискретной величины первый параметр равен сумме произведений отдельных значений xi случайной величины X на их вероятности рi:

x =x1p1 + x2p2 + … + xnpn = xipi

Второй параметр равен сумме квадратов отклонений отдельных значений xi случайной величины Х от ее математического ожидания x.

2x = (xi - x)2pi

Эмпирическая средняя величина стремится к математиче­скому ожиданию случай­ной величины по мере увеличения числа испытаний.

Основные свойства нормального распределения.

Для нормаль­ного распределения характерно совпадение по абсолютной вели­чине средней арифметической, медианы и моды. Равенство меж­ду этими показателями указывает на нормальность данного рас­пределения. Для стандартизированной кривой нормального распределения характерно, что на равные интервалы, измеряемые нормированным отклонением (t) от центра распределения, приходится равное число вариант. Вероятность отклонения любой варианты в ту или другую сторону от средней на t, 2t и 3t следующая:

P{ -t < | xi - x | < +t } = 0,6827;

P{ -2t < | xi - x | < +2t } = 0,9545;

P{ -3t < | xi - x | < +3t } = 0,9973;

Следовательно, с вероятностью Р=0,6827 можно утверждать, что наугад отобранная из нормально распределяющейся сово­купности варианта не выйдет за пределы от t до +t, или в компактной форме ± t. Вероятность того, что случайно отобран­ная варианта не отклонится от средней более чем на ±3t, равна P=0,9973. Для обычной классической нормальной кривой, где по оси ОХ откладывается не нормированное (t), а стандартное отклонение () все приведенные выше утверждения тоже верны. А это означает, что 99,7% от всех вариант нор­мально распределяющейся совокупности находится в пределах 3. Этот важный вывод известен в биометрии, как правило, плюсминус трех сигм.

Большинство применяемых на практике распределений являются дискретными или непрерывными. К дискретным относятся распределение Бернулли, биноминальное и пуассоновское распределения.

Распределение Бернулли используется для того, чтобы определить вероятность успешного исхода при одном испытании. Биноминальное распределение используется для определения вероятности появления определенного числа успешных исходов при n независимых испытаниях. Распределение Пуассона описывает число событий, происходящих в одинаковых промежутках времени или на одинаковых площадях, при условии, что события происходят независимо друг от друга. Биноминальное распределение и распределение Пуассона для случайной величины Х можно рассчитать по таблицам.

К непрерывным распределениям относят показательное и нормальное, а также распределения, связанные с нормальным: распределения Стьюдента, 2 – квадрат и F – распределение Фишера. Показательное (экспоненциальное) распределение применяется 1) при решении задач с определением параметров типа «время жизни», например, продолжительность жизни больных при клинических исследованиях; 2) при изучении интервалов времени между появлениями последовательных событий. Например, вызовами скорой помощи, проверкой студентов. Значение функции показательного распределения для случайной величины Х можно вычислить с помощью калькулятора.