Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мат-стат-а.doc
Скачиваний:
4
Добавлен:
25.11.2019
Размер:
747.52 Кб
Скачать

Элементы математической статистики

Часть 1. Методические указания и примеры

§1. Методы статистического описания эксперимента. Построение гистограммы и полигона относительных частот.

Определение 1.1. Множество всех возможных значений величины X с приписанным к нему законом распределения X в статистике называют генеральной совокупностью. Закон распределения случайной величины X называют генеральным законом распределения, а её числовые характеристики – генеральными числовыми характеристиками.

Определение 1.2. Всякое множество измеренных значений X: называют выборкой (из генеральной совокупности). Число измерений nобъём выборки. Процесс получения выборки называется выбором.

Определение 1.3. Вариационный ряд – это последовательность элементов выборки, расположенных в неубывающем порядке. Элементы вариационного ряда называют порядковыми статистиками.

Пример 1.1. Выборка приводит к вариационному ряду:

Если в выборке много повторяющихся элементов, вариационный ряд удобно преобразовать в статистический.

Определение 1.4. Статистический ряд – это последовательность различных элементов вариационного ряда с указанием частот их повторения в выборке ( – количество одинаковых элементов вариационного ряда, равных ).

П

Рис. 1.1

ример 1.2. Продолжим рассмотрение выборки из примера 1. Статистический ряд имеет вид:

zi

1

2

3

4

ni

1

3

2

1

Графически статистический ряд можно представить в виде полигона (многоугольника), откладывая по оси абсцисс значения , а по оси ординат – частоты , и соединяя ломаной полученные точки. Для нашего примера полигон имеет вид, изображённый на рис. 1.1.

Имея выборку объёма n, можно вычислить выборочные числовые характеристики– выборочное среднее , выборочную дисперсию s2, выборочное среднее квадратичное отклонение s:

, (1.1)

, (1.2)

Естественно рассматривать их как приближённые значения соответствующих генеральных числовых характеристик. Выборочные характеристики и s2 при больших n хорошо приближают генеральное математическое ожидание и генеральную дисперсию .

Если выборка получена из непрерывной генеральной совокупности и объём её очень велик, то вариационный и статистический ряды трудно обозримы. В этом случае удобен так называемый группированный статистический ряд.

Если , – наименьший и наибольший элементы выборки, то отрезок содержит всю выборку. Разобьём его на несколько ( ) частей равной длины

точками : .

Рассмотрим промежутки , , , . Обозначим через число элементов выборки, попавших в ( – частота попадания элементов выборки в данный промежуток ).

Определение 1.5. Совокупность промежутков с указанием соответствующих частот , , называется группированным статистическим рядом (данной выборки).

Замечание 1.1. Для определения k можно рекомендовать полуэмпирическую формулу:

. (1.3)

Здесь n – объём выборки; . При =50 при =100 .

Замечание 1.2. Вместо группы элементов, попавших в интервал , рассматривается один их представитель, в качестве которого обычно берут среднюю точку промежутка . На основе группированного статистического ряда можно приближенно вычислить выборочные числовые характеристики и . Заменив xi в формулах (1.1) и (1.2) на , имеем:

. (1.4)

Определение 1.6. Гистограммой называется ступенчатая фигура, составленная из прямоугольников , , основания которых – промежутки , а высоты равны .

С помощью гистограммы оценивается кривая плотности вероятности, так как ступенчатая ломаная, ограничивающая гистограмму сверху, близка к графику плотности вероятности. Гистограмма приближённо представляет криволинейную трапецию под графиком генеральной плотности распределения . Представление о графике плотности вероятности генерального распределения даёт также полигон относительных частот, который в этом случае получают, соединив ломаной линией середины верхних оснований прямоугольников, составляющих гистограмму.

Замечание 1.3. Обычно числа малы, поэтому гистограмму строят, увеличивая масштаб по оси Оу, что при одинаковом масштабе по осям равносильно увеличению высот прямоугольников гистограммы в с раз. При с nh высоты прямоугольников равны ni. При этом верхняя граница гистограммы по-прежнему приближённо представляет график плотности вероятности генерального распределения.

Пример 1.3. На одном из предприятий взяты данные о стаже работы (в годах) у 50 рабочих:

1, 3, 13, 17, 1, 6, 4, 12, 0, 9, 9, 2, 7, 18, 7, 2, 3, 10, 8, 4, 5, 11, 13, 4, 13,

4, 7, 15, 24, 3, 4, 10, 20, 2, 3, 6, 16, 18, 8, 9, 3, 8, 3, 13, 5, 12, 6, 9, 5, 7.

Данные для удобства округлены до целого числа. Для полученной выборки объемом требуется построить группированный статистический ряд, гистограмму и полигон относительных частот, вычислить и .

►По формуле (1.3) находим число интервалов группированного статистического ряда: . Заполняем таблицу 1.1, содержащую требуемый ряд. Размах ; длина интервала , –середина промежутка .

Рис. 1.2

Таблица 1.1

1

17

2

2

14

6

3

9

10

4

5

14

5

3

18

6

2

22

50

Строим гистограмму и полигон частот (рис. 1.2).

По формулам (1.4) находим средний стаж работы , Имеем

;

;

;

s – числовая характеристика разброса данных по стажу. ◄