Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическая статистика.doc
Скачиваний:
35
Добавлен:
03.05.2019
Размер:
3.12 Mб
Скачать

1.2. Методы группировки экспериментальных данных

Допустим, из генеральной совокупности извлечена каким-то способом выборка объемом n, измерена некоторая величина Х, в результате чего получено множество значений х1, х2, . . . хn. Это множество называется простым статистическим рядом. Он является первичной формой представления статистического материала.

Отдельные значения статистического ряда называются вариантами. Если варианта хi появилась m раз, то число m называют частотой, а ее отношение к объему выборки m/nотносительной частотой.

Последовательность вариант, записанная в возрастающем (убывающем) порядке, называется ранжированным или вариационным рядом.

Таблица, в первой строке которой записаны все значения величины (варианты), во второй – соответствующие им частоты, называется безынтервальным вариационным рядом. Графическим изображением безынтервального вариационного ряда является полигон. Для его построения на оси ОХ откладывают значения вариант, на оси ОY –соответствующие им частоты. Точки с координатами (хi; mi) соединяют отрезками, полученная ломаная линия называется полигоном частот.

Пример 1.3: В детском саду измерили массу тела 10 детей 5 лет. Полученные данные образуют простой статистический ряд:

24 22 23 28 24 23 25 27 25 25

Ранжированный ряд имеет вид:

22 23 23 24 24 25 25 25 27 28

Подсчитав частоты каждого значения, можно постороить безынтервальный вариационный ряд:

Х

22

23

24

25

27

28

m

1

2

2

3

1

1

На рис. 1 представлен полигон этого вариационного ряда.

Р ис. 1.1. Полигон вариационного ряда

Длина R интервала [xmin; xmax] называется размахом ряда, т.е.

R = xmax xmin

где xmax и xmin соответственно наибольшее и наименьшее значения варианты.

Если выборка представлена слишком большим количеством различных значений случайной величины, группировку данных проводят в виде интервального вариационного ряда. Для этого диапазон варьирования признака разбивают на несколько равных интервалов и указывают количество вариант, попавших в каждый интервал. Количество интервалов k определяется условиями задачи исходя из требований исследователя. Зная количество интервалов, можно определить длину h каждого интервала: h =R/(k-1). Рассмотрим процедуру построения интервального вариационного ряда на примере.

Пример 1.4. При диспансеризации производилось определение веса 100 человек одной возрастной группы. Получены значения от 60 до 90 кг. Размах ряда: R = xmax xmin =90-60=30. Разобьем полученный диапазон на 6 интервалов (k=6). Тогда ширина интервала h=R/(k-1)=30/5=6. Расположим полученне данные в виде интервального вариационного ряда:

интервалы

60-65

65-70

70-75

75-80

80-85

85-90

количество

14

34

29

15

6

2

Для удобного представления материал часто располагают в таком виде:

интервал

середина

интервала

m

m/h

60-65

62,5

14

2,33

65-70

67,5

34

5,67

70-75

72,5

29

4,83

75-80

77,5

15

2,5

80-85

82,5

6

1,00

85-90

87,5

2

0,33

Г рафическим изображением интервального вариационного ряда является гистограмма. Для ее построения на оси ОХ откладывают интервалы шириной h, на каждом интервале строят прямоугольник высотой m/h. Величина m/h называется плотностью частоты. Гистограмма является эмпирическим аналогом графика функции распределения. Для рассмотренного ряда гистограмма представлена на рис.2.