Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii_po_statistike.doc
Скачиваний:
43
Добавлен:
02.05.2015
Размер:
1.86 Mб
Скачать

§9. Элементы математической статистики

1. Основные положения

Математическую статистику определяют как науку о методах получения и обработки результатов наблюдений (измерений) для установления закономерностей в массовых случайных явлениях.

Особое внимание в математической статистике получили два типа задач: оценивание и статическая проверка гипотез.

Первая задача состоит в получении точечных и интервальных оценок параметров распределения, вторая – заключается в проверке согласованности результатов эксперимента с гипотезой о распределении вероятностей случайной величины (например, в случае нормального распределения можно проверять гипотезу, согласно которой параметр распределения ). Необходимо отметить, что если бы можно было провести неограниченное число наблюдений, то параметры распределения, например, практически были бы определены и ни о какой статистической задаче говорить уже не пришлось бы. Таким образом, задача статистических выводов появляется именно тогда, когда надо получить наилучшие, в некотором смысле, выводы по ограниченному числу наблюдений. Но тогда сами наблюдения должны отвечать некоторым требованиям. Каким же? Естественно предположить, что результаты наблюдений случайны и независимы.

Определение 1. Пусть X – некоторая случайная величина. Совокупность результатов n наблюдений (измерений)

(9.1)

этой случайной величины называют выборкой, а саму случайную величину Xгенеральной случайной величиной либо генеральной совокупностью.

Учитывая вышесказанное, подчеркнем, что, когда речь идет о задаче статистических выводов, подразумевается: элементы выборки есть независимые одинаково распределенные случайные величины, закон распределения которых совпадает с законом распределения генеральной случайной величины X (говоря другими словами, выборка рассматривается априорно). Все характеристики случайной величины X (например, функция распределения, математическое ожидание, дисперсия и т.д.) именуют генеральными (теоретическими), а характеристики, полученные на основе обработки результатов измерений (выборки), называют выборочными (эмпирическими, статистическими). Далее будем эти характеристики, в отличие от генеральных, отмечать символом «*».

Для того, чтобы те или иные заключения о генеральной случайной величине, сделанные по выборке, были научно обоснованными, необходимо чтобы выборка достаточно полно характеризовала случайную величину, т.е. была репрезентативной (представительной). Выборка (9.1) будет репрезентативной, если ее объем n достаточно велик, а значения выборки независимы, т.е. получены при независимых измерениях величины X в одних и тех же условиях.

Тогда основная задача математической статистики ставится так: на основе репрезентативной выборки, извлекая из нее максимум информации, сделать те или иные научно обоснованные выводы о генеральной случайной величине X.

2. Выборочная функция распределения и гистограмма

Пусть X – некоторая случайная величина, и из этой генеральной совокупности извлечена выборка (9.1). Если элементы выборки расположить не в порядке их получения, а в порядке их возрастания

(9.2)

то получаем так называемый вариационный ряд.

Известно, что приближенным значением (оценкой) вероятности события является относительная частота этого события. Следовательно, для нахождения неизвестной функции распределения генеральной совокупности нужно оценить ее значения, являющиеся вероятностью событияс помощью относительной частоты этого события, полученной по выборке.

Определение 2. Пусть x – некоторая точка оси OX; обозначим через – число выборочных значений из (9.2), расположенных левее точкиx на той же оси. Тогда относительная частота событияназывается выборочной функцией распределения и обозначается

Таким образом, по определению

(9.3)

Очевидно, что выборочная функция распределения любой случайной величины (дискретной или непрерывной) представляет всегда ступенчатую функцию, которая терпит разрывы в точках, соответствующих наблюдаемым значениям случайной величины, а величины скачков равны относительным частотам этих значений.

Пример 1. Получены результаты измерения скорости движения автомобилей на участке дороги. Данные эксперимента сведены в табл.1. Первая строка таблицы представляет собой вариационный ряд, вторая дает частоты появления каждого выборочного значения, объем выборки

Таблица 1

12

17

22

27

32

37

42

47

52

57

62

67

72

4

7

5

16

31

35

42

109

143

112

72

30

4

Для построения выборочной функции распределения надо, согласно определению 2, вычислить относительные частоты Результаты вычислений представлены в табл.2.

Таблица 2

Интервал

0

0,007

0,019

0,027

0,053

0,104

0,161

Интервал

0,23

0,409

0,642

0,826

0,944

0,993

1

График функции представлен на рис.1.

Рис.1. График выборочной функции распределения

Формально выборочная распределения обладает всеми свойствами теоретической функции распределения, что следует из ее определения, и отличается от нее тем, что ее значения дают не вероятности, а относительные частоты события в выборке.

Согласно теореме Бернулли, при неограниченном увеличении числа опытов n относительная частота события сходится к вероятности этого события, т.е.

Таким образом, выборочная функция распределения является оценкой (статистическим аналогом) генеральной функции распределенияичем больше объем выборки, тем более точное представление дает выборочная функция распределения о генеральной функции распределения.

При большом числе n опытов построение выборочной функции распределения становится затруднительным. Удобнее в этом случае воспользоваться характеристиками выборочных распределений, аналогичных не функции распределенияа плотности вероятности

Поступают следующим образом: делят интервал наблюдений значений случайной величиныX точками на интервалы (разряды)и для каждогоi-го разряда вычисляют относительную частотупопадания значений величиныX в этот разряд:

(9.4)

где – число (частота) попаданий значенийX в i-й разряд, n – объем выборки.

Результаты вычислений представляют в виде таблицы 3.

Таблица 3

Очевидно, что

Таблицу 3 называют статистическим рядом, а графическое изображение статистического ряда называют гистограммой.

Для построения гистограммы на оси OX откладывают разряды и на каждом из них, как на основании, строят прямоугольник, площадь которого равнаПолученная при этом ступенчатая фигураназывается гистограммой (рис.2).

Рис.2. Гистограмма

Очевидно, что высоты прямоугольников равны

(9.5)

где

Способ построения гистограммы позволяет говорить о том, что гистограмма есть оценка (приближенное изображение) генеральной функции плотности.

Согласно закону больших чисел, при и неограниченном стремлении длины интервалак нулю функциясходится по вероятности к генеральной функции плотности

Число разрядов k обычно берут от 5 до 12; можно применять формулу гдеn – объем выборки, для ориентировочного определения числа k. Кроме того, в i-й разряд включают либо левую, либо правую границу интервала (см.табл.3).

Необходимо отметить, что построение гистограммы имеет смысл только для непрерывных случайных величин. Для дискретных случайных величин вместо гистограммы строят выборочный многоугольник распределения. Для построения выборочного многоугольника распределения в отличие от многоугольника распределения (см.рис.1,§7) вместо вероятностей берут их оценки (приближенные значения)

Пример 2. На основании статистического ряда распределения (табл.4) скоростей движения автомобилей на участке автодороги построить гистограмму.

Таблица 4

3

16

70

102

156

132

0,004

0,022

0,095

0,138

0,21

0,178

147

71

25

17

1

0,199

0,095

0,034

0,0236

0,0014

Как следует из таблицы 4, объем выборки элементам (наблюдениям),Длина каждого разряда составляет 5 км. Вычислим высоты ступенек гистограммы по формуле (9.5):

На основании этих расчетов можно строить гистограмму (рис.3).

Рис.3. Гистограмма для примера 2

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]