Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Прикладная статистика Для презентации в интерне...doc
Скачиваний:
24
Добавлен:
11.11.2019
Размер:
3.81 Mб
Скачать

2. Выборка, ее представление и числовые характеристики

Все, что видим мы – видимость только одна. Далеко от поверхности моря до дна.

Полагай несущественным явное в мире,

Ибо тайная сущность вещей - не видна.

О. Хайям (перевод Г. Плисецкого)

2.1. Представление выборки

2.1.1. Таблица частот и интервальная

таблица частот

Небольшие выборки удобно представлять в виде таблицы из двух строк. В первой строке записывают элементы выборки (они называются вариантами), расположенные в порядке возрастания. Во второй строке записываются частоты вариант. Частотой варианты называется число, равное количеству повторений варианты в выборке. Если ni – частота варианты xi, всего в выборке k разных вариант, то n1 + n2 + ...+ nk = n, где n – объем выборки. Описанная таблица называется таблицей частот.

Рассмотрим пример. С производственной линии случайным образом 36 раз отбирали по 10 единиц некоторого изделия. Каждый раз отмечалось число дефектных изделий.

Получена выборка 1:

0

0

1

0

2

0

1

2

1

0

0

0

0

0

3

1

0

0

0

0

0

2

0

0

1

1

0

0

0

1

1

0

1

0

1

1

Здесь n = 36, в выборке представлены 4 варианты: х1 = 0, х2 = 1, х3 = 2, х4  = 3.

Таблица частот выглядит следующим образом (табл. 2.1):

Таблица 2.1

xi

0

1

2

3

ni

21

11

3

1

Относительной частотой варианты хi называется число i, равное отношению ni /n. Если сумма частот равна n, то сумма относительных частот равна n/n = 1.

Таблица относительных частот для этого примера такова (табл. 2.2):

Таблица 2.2

xi

0

1

2

3

i

21/36

11/36

3/36

1/36

Таблица относительных частот напоминает таблицу вероятностей дискретной случайной величины. Только вместо значений случайной величины пишут варианты выборки, а роль вероятностей исполняют относительные частоты.

Накопленной частотой nxнак называется число вариант выборки, меньших данного числа х.

Относительной накопленной частотой xнак называется отношение nxнак/n. Найдем накопленные и относительные накопленные частоты вариант выборки для нашего примера (табл 2.3).

Таблица 2.3

xi

0

1

2

3

nxiнак

0

21

32

35

xiнак

0

21/36

32/36

35/36

Ясно, что nx1нак = 0, x1нак = 0, т.к. нет ни одной варианты, меньшей x1.

Кроме того,

; ,

отчего частоты и называются накопленными. Относительные накопленные чacтоты – это статистические аналоги значений функций распределения F(xi) дискретной случайной величины X. Действительно,

.

Если выборка извлечена из непрерывно распределенной генеральной совокупности, причем ее объем n достаточно велик, то в выборке представлено много значений, и такую выборку неразумно представлять в виде таблицы частот. Кроме того, при работе с непрерывно распределенными случайными величинами рассматривают не отдельные значения этих величин, а некоторые интервалы этих значений. Поэтому достаточно большую выборку, извлеченную из непрерывно распределенной генеральной совокупности, группируют по интервалам следующим образом. Весь диапазон значений вариант разбивают на разумное число интервалов одинаковой, как правило, ширины h. Чтобы не было недоразумений при подсчете числа вариант выборки, попавших в каждый интервал, левый конец каждого интервала считают закрытым, а правый – открытым, так что интервалы имеют вид [хi-1; хi).

Частотой i-го интервала ni называется число, равное количеству вариант выборки, попавших в этот интервал,

Относительной частотой i-го интервала νi называется отношение ni /n. Кроме того, вычисляют накопленные и относительные накопленные частоты для правых границ интервалов.

Если всего интервалов k, очевидно :

; ; ; ,

где xk – правая граница последнего интервала, все варианты выборки меньше числа xk .

Полученные числа заносят в таблицу, которая называется интервальной таблицей частот.

Рассмотрим пример. У 50 новорожденных измерили массу тела с точностью до 10г. Результаты (в кг) таковы (выборка 2):

3,7

3,85

3,7

3,78

3,6

4,45

4,2

3,87

3,33

3,76

3,75

4,03

3,75

4,18

3,8

4,75

3,25

4,1

3,55

3,35

3,38

3,3

4,15

3,95

3,5

3,88

3,71

3,15

4,15

3,8

4,22

3,75

3,58

3,55

4,08

4,03

3,24

4,05

3,56

3,05

3,58

3,98

3,88

3,78

4,05

3,4

3,8

3,06

4,38

4,2

Сгруппируем эту выборку. Наименьшая масса равна 3,05 кг, наибольшая масса равна 4,75 кг. “Упакуем” выборку в интервал [3 – 4,8], который разобьем на 6 интервалов шириной 0,3.

Интервальная таблица частот выглядит следующим образом (накопленные частоты считают для правых границ интервалов) (табл.2.4).

Таблица 2.4

[xi-1, xi)

[3-3,3)

[3,3-3,6)

[3,6-3,9)

[3,9-4,2)

[4,2-4,5)

[4,5-4,8)

ni

5

11

17

11

5

1

i

0,1

0,22

0,34

0,22

0,1

0,02

nxiнак

5

16

33

44

49

50

xiнак

0,1

0,32

0,66

0,88

0,98

1,0