Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Соппа Воронин Теория вероятностей и математичес...doc
Скачиваний:
17
Добавлен:
22.08.2019
Размер:
2.4 Mб
Скачать

Приемы обработки выборок

1. Ранжирование – упорядочение элементов выборки в порядке возрастания. Одинаковые значения повторно включаются в ранжированный ряд.

2. Чтобы избежать дальнейших громоздких действий с выборкой, строится группированный статистический ряд:

– определяется диапазон выборки

[xmin, xmax];

– находится шаг разбиения

;

– вычисляются границы интервалов (с точностью не менее трех знаков после запятой):

z0 xmin, zz0 + h, z2 z1 + h, z3 z2 + h;

zz3 + h, zz4 + h ~ ;

– находятся значения середин интервалов , i = 1, ..., 5, :

, , ,

, .

Графическое представление проведенного разбиения диапазона выборки на интервалы:

z0 z1 z2 z3 z4 z5

– вычисляются частоты попадания значений в интервалы:

n1, n2, n3, n4, n5,

при этом должна выполняться контрольная сумма: .

– находятся относительные частоты попадания значений в интервалы:

w1 = n1/n, w2 = n2/n, w3 = n3/n,

w4 = n4/n, w5 = n5/n,

здесь контролируется выполнение суммы: .

– вычисляются высоты ступеней гистограммы :

, , ,

, .

проверка: .

В результате получаем таблицу группированного статистического ряда:

Номер

интервала, i

1

2

3

4

5

Границы

интервалов, [zi–1, zi]

[z0, z1]

[z1, z2]

[z2, z3]

[z3, z4]

[z4, z5]

Середины

интервалов,

Частоты попадания в интервалы, ni

n1

n2

n3

n4

n5

50

Относительные частоты попадания, wi

w1

w2

w3

w4

w5

1

Высоты ступеней гистограммы,

1/h

Группированный статистический ряд, включая в себя строки и wi, является аналогом закона распределения дискретной модели исследуемой нами генеральной совокупности.

Построение гистограммы относительных частот

В качестве приближенного изображения графика функции плотности вероятности р(х) в математической статистике используется гистограмма относительных частот. Напомним свойства функции плотности вероятности:

1. р(х) ≥ 0;

2. площадь под графиком р(х) равна единице:

;

3. Р(Х ) =  .

Первые два свойства выполняются и для гистограммы, третье свойство, естественно, выполняется лишь асимптотически.

Построение гистограммы начинается с нанесения на горизонтальную ось интервалов [ zi1, zi ], на которые разбит диапазон выборки. Масштаб выбирается так, чтобы диапазон выборки [хmin, xmax] занимал на графике около 10 см. Далее, на вертикальной оси откладывается значение , таким образом, чтобы оно занимало отрезок длиной 6–7 см. Над интервалами строим ступени гистограммы в виде прямоугольников с высотами, которые берутся из группированного статистического ряда . Эта ступенчатая фигура и является гистограммой. Через середины верхних сторон ступеней проводим плавную линию (пунктир), она является приближенным представлением графика теоретической функции плотности вероятности исследуемой случайной величины.

Для того чтобы увеличить точность приближения необходимо обеспечить значительное увеличение количества наблюдений (объем выборки ) при одновременном уменьшении шага разбиения диапазона выборки . В этом случае мы можем сколь угодно точно приблизить ступенчатую гистограмму к теоретической кривой функции плотности вероятности.

Анализируя гистограмму, можно сделать вывод о виде и свойствах исследуемой генеральной совокупности Х. Укажем три наиболее часто используемых на практике вида распределения случайных величин. Схематические графики их функций плотности вероятности имеют следующий вид:

1. Равномерно распределенные случайные величины

2. Экспоненциально распределенные случайные величины

3. Нормально распределенные случайные величины N(a, )

В случае нормально распределенных случайных величин под пиком гистограммы располагается значение, равное генеральному среднему (или математическому ожиданию)  = М(Х). Наиболее часто реализуемые значения генеральной совокупности лежат в окрестности этого значения. Значения под убывающими ветвями практически не реализуются, их влиянием, в среднем, можно пренебречь.