Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2.Penina_G.,_Uzbek_E.,_Orlova_L.Teoriya_veroyat....doc
Скачиваний:
17
Добавлен:
02.12.2018
Размер:
3 Mб
Скачать

5. Закон больших чисел

Принцип практической уверенности

Если в определенных условиях вероятность события очень мала, то при однократном их выполнении можно быть уверенным в том, что это событие не произойдет, и в практической деятельности поступать так, как будто оно является невозможным. Вероятность, которой решено

пренебрегать в одном исследовании, называется уровнем значимости. В статистике обычно рекомендуется пользоваться уровнем значимости 0,05 при предварительных исследованиях и 0,01 при окончательных выводах.

Под законом больших чисел понимается совокупность положений, в которых утверждается, что с вероятностью, как угодно близкой к единице, выполняются определенные соотношения.

Неравенство

Чебышева

Вероятность того, что отклонение случайной величины от ее математического ожидания по абсолютной величине меньше положительного числа , не меньше разности между единицей и дробью, числитель которой – дисперсия случайной величины , а знаменатель – квадрат

.

Теорема

Чебышева

Если дисперсии попарно независимых случайных величин ограничены одной и той же постоянной , а число их достаточно велико, то как бы ни было мало положительное число , вероятность того, что отклонение средней арифметической этих случайных величин от средней арифметической их математических ожиданий меньше по абсолютной величине , будет как угодно близка к единице

.

Другими словами, среднее арифметическое достаточно большого числа независимых случайных величин утрачивает характер случайной величины. На теореме Чебышева основан выборочный метод в статистике, суть которого состоит в том, что по сравнительно небольшой случайной выборке судят о всей генеральной совокупности исследуемых объектов.

Теорема Бернулли

Если в каждом из независимых испытаний вероятность появления события постоянна, то как угодно близка к единице вероятность того, что отклонение относительной частоты от вероятности по абсолютной величине будет сколь угодно малым, если число испытаний достаточно велико

.

Закон больших чисел лежит в основе различных видов страхования (страхование жизни человека на всевозможные сроки, имущества и др.) При планировании ассортимента товаров широкого потребления учитывается спрос на них населения. В этом спросе проявляется действие закона больших чисел. Сумма конечного числа независимых нормально распределенных случайных величин распределена по нормальному закону.

VI. Элементы математической статистики

1. Характеристики распределения опытных данных

Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Вся подлежащая изучению совокупность объектов называется генеральной совокупностью.

Та часть объектов, которая попала на проверку, называется выборочной совокупностью или выборкой. Число элементов совокупности называется ее объемом. Наблюдаемые значения количественного признака называются вариантами. Последовательность вариант, записанных в возрастающем порядке, называют вариационным рядом. Число наблюдений значения называется частотой варианты . Отношение частоты к объему выборки называется относительной частотой или частостью.

Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.

Эмпирической функцией распределения называют функцию , определяющую для каждого значения относительную частоту события

,

– число наблюдений, при которых наблюдалось значение признака , меньшее ,

– общее число наблюдений (объем выборки).

Полигоном частот называют ломаную, отрезки которой соединяют точки .

Полигоном относительных частот называют ломаную, отрезки которой соединяют точки .

В случае непрерывного статистического распределения строят гистограмму. Гистограммой частот называют фигуру, являющуюся совокупностью прямоугольников, основания которых равны длинам интервалов , а высоты равняются плотности частоты (т.е. отношению ). Гистограмма относительных частот строится в соответствии с плотностями частостей.

Площадь гистограммы относительных частот равна единице. Это свойство идентично свойству вероятностей событий, образующих полную группу.

Накопленные частоты – это результаты последовательного суммирования частот всех вариант (или частот интервалов), включая частоту данного варианта (или интервала). Накопленные частоты показывают число членов совокупности, для которых признак не превышает данного значения.

Кумулятивная кривая – это ломаная линия, отрезки которой соединяют точки .

Выборочным средним называют среднее арифметическое значение признака выборочной совокупности

.

Выборочной дисперсией называют среднее арифметическое квадратов отклонений наблюдаемых значений признака от их среднего значения

или

,

где .

Средним квадратическим отклонением называют корень квадратный из дисперсии .

Медианой называют значение, которое находится в середине вариационного ряда.

Для дискретного вариационного ряда:

Для интервального вариационного ряда:

,

где – медианный интервал, который выбирают по срединному значению,

– объем выборки,

– частота медианного интервала,

– сумма частот интервалов, предшествующих медианному.

Модой называют значение, имеющее наибольшую частоту.

Для дискретного вариационного ряда мода определяется непосредственно сравнением частот.

Для интервального вариационного ряда

,

где – модальный интервал с наибольшей частотой,

– частота модального интервала,

– частота интервала, предшествующего модальному,

– частота интервала, следующего за модальным.

Пример 17.

Провести анализ статистического распределения выборки работников цеха по производительности труда (количество изготавливаемых за смену деталей)

18

20

22

24

1

2

6

1

Решение. Объем выборки .

Полигон частот имеет вид:

Эмпирическая функция распределения

Выборочное среднее:

.

Выборочная дисперсия:

,

.

Среднее квадратическое отклонение:

.

Медиана:

– четное число,

, .

.

Найдем накопленные частоты

18

20

22

24

1

2

6

1

1

3

9

10

Начиная с четвертой по девятую варианты имеют значение, равное 22. Следовательно, и .

.

Мода:

наибольшая частота соответствует варианте 22.

.

Пример 18.

Построить полигон частот, определить моду и медиану интервального статистического распределения выборки колосьев пшеницы по их длине

0 – 2

2 – 4

4 – 6

6 – 8

8 – 10

10 – 12

133

237

373

362

270

125

Решение.

Объем выборки: .

П олигон построим по серединам интервалов распределения:

Найдем накопленные частоты:

0 – 2

2 – 4

4 – 6

6 – 8

8 – 10

10 – 12

133

237

373

362

270

125

133

370

743

1105

1375

1500

Медиана:

, .

(6; 8) – медианный интервал.

, .

, .

.

Мода:

наибольшая частота определяет модальный интервал (4;6).

, .

, , .

.