Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

golunova_l_v_matematicheskie_modeli_v_transportnyh_raschetah

.pdf
Скачиваний:
164
Добавлен:
06.03.2016
Размер:
2.79 Mб
Скачать

может принять n определенных значений. Совокупность случайных значений случайной величины X называется статистической выборкой объема n. Если расположить отдельные значения случайной величины X в возрастающем или убывающем порядке и указать для каждого значения, как часто оно встречалось в данной выборке, то получится эмпирическое распределение случайной величины вариационный ряд. На основании этого ряда определяются аналитическая форма неизвестной плотности вероятности f(x), функция распределения F(x), оцениваются входящие в нее параметры.

Рассмотрим порядок построения вариационного ряда:

1.Диапазон значений непрерывной случайной величины X разбивается на интервалы.

2.Подсчитывается количество значений mi случайной величины X в каждом интервале.

3.Определяется частота попадания случайной величины X для

каждого интервала:

 

pi* = mi / n.

(1.43)

Если случайная величина X принимает

значение, попа-

дающее на границу i-го и (i+1)-го интервалов, то это значение учитывается в числе попаданий в (i+1)-й интервал. В итоге в виде таблицы получаем вариационный (статистический) ряд:

Интервал

t1 t2

t2 t3

ti ti+1

tk tk+1

Частота pi

p1*

p2*

pi*

pk*

Оптимальная длина интервала определяется по формуле:

x =

xmax xmin

,

(1.44)

1+3,21 lg n

где xmax xmin – размах вариации случайной величины X.

 

Число интервалов будет равно:

 

 

k =

xmax xmin

.

 

(1.45)

 

 

 

 

x

 

 

Если k – нецелое число, то в качестве числа интервалов надо взять ближайшее к k целое число, но не меньше k.

Вариационные ряды могут быть изображены графически в виде полигона распределения и гистограммы.

Полигон распределения представляет собой многоугольник, который строится следующим образом. Ось абсцисс – это

31

фактические значения случайной величины X, ось ординат – частоты p* = m/n (рисунок 1.7). Соответственно каждая точка Mi имеет координаты xi и mi/n.

Рисунок 1.7 – Полигон распределения

Точки M1(х1, m1/n), M2(х2, m2/n), …, Mk(хk, mk/n) соединены ломаной линией M1M2MiMk. Крайние точки M1 и Mk, если

они не лежат на оси , соединяют со смежными точками соответственно M0(х0, 0) и Mk+l(xk+1, 0) на оси абсцисс. Полученный многоугольник M0M1M2MiMkMk+1 и есть полигон распределения. Полигоны распределения чаще всего применяются для изображения дискретных вариационных рядов.

Гистограмма распределения реализаций случайной вели-

чины применяется для графического изображения интервальных рядов распределения. Для непрерывных равных интервалов с шириной интервала ∆x гистограмма строится следующим образом (рисунок 1.8).

Рисунок 1.8 – Гистограмма распределения

На оси абсцисс наносится шкала для реализаций случайной величины X, на оси ординат – величины p*/∆x. Таким образом, основания прямоугольников ABCD, DEFG, ... соответствуют

32

ширине интервала ∆x, а высоты равны отношениям p1*/∆x, p2*/∆x, …, pk*/∆x. Многоугольник ABCEF...QORJA и является гистограммой распределения.

Гистограммы применяются для изображения вариационных рядов с непрерывными значениями случайной величины X. При уменьшении величины каждого интервала гистограмма будет приближаться к некоторой плавной кривой, соответствующей графику функции плотности распределения случайной величины X. Следовательно, в результате построения гистограммы можно получить представление о дифференциальном законе распределения случайной величины X.

Эмпирическая (статистическая) функция распределе-

ния строится следующим образом. Над каждым отрезком оси абсцисс ∆x (∆x – расстояние между концами интервалов) проводится отрезок горизонтальной прямой на уровне ординаты, равной величине накопленной частоты. Концы горизонтальных отрезков соединяются вертикальными линиями.

Теоретическая функция распределения F(x) определяет вероятность события Х < x. Эмпирическая статистическая функция распределения F*(X) представляет собой частоту событий X < x в данной выборке:

F*(x) = P*(X < x) = p *(X < xi ),

(1.46)

xi <x

 

где x – текущая переменная;

p* – частота, или статистическая вероятность события. Неравенство xi < x под знаком суммы указывает, что суммируются те значения xi, которые меньше х. Значение F*(xi) при

данном значении xi:

F*(xi) = ni/n. (1.47)

где ni – число опытов, при которых X < xi.

При неограниченном увеличении числа опытов (наблюдений) n при любом xi вероятность отличия этих функций друг от друга близка к единице. Таким образом, графическое изображение рядов распределения дает возможность более наглядно представить эмпирическое распределение реализаций случайной величины и выразить закономерность ее распределения путем построения статистической интегральной функции распределения.

33

Пример 1.16. Построить гистограмму и статистическую функцию распределения загрузки контейнеров. Значения загрузки контейнеров получены в ходе наблюдения за погрузкой в течение календарного года. Объем выборки составил n = 100 наблюдений.

Размах вариации равен: R = xmах xmin = 15,13 – 4,0 = 11,13.

Величина интервала вариационного ряда определена по формуле

(1.44):

x =

xmax xmin

=

 

15,13 − 4,0

=1,5 .

1+3,21 lgn

1+3,21 lg100

 

 

 

Количество интервалов вариационного ряда равно:

k = xmax xmin = 15,13 − 4,0 = 7,42 ≈ 8. x 1,5

Вариационный ряд загрузки контейнеров представлен ниже:

Интервал, ∆хi

4–5,5

5,5–7

7–8,5

8,5–10

10–11,5

11,5–13

13–14,5

14,5–16

Частота, pi*

0,07

0,14

0,17

0,17

0,15

0,14

0,11

0,05

Решение:

Для построения гистограммы определим ее ординаты:

 

 

 

 

 

 

 

 

mi

=

pi *

= ai .

 

 

 

 

 

 

 

 

 

 

 

 

 

n x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

1.

p1 *

 

= 0,047;

2.

p2 *

= 0,093;

3.

 

p3 *

= 0,113;

4.

 

p4 *

= 0,113;

x

x

 

x

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

5.

p5 *

= 0,1;

6.

p6 *

 

= 0,093;

7.

 

p7 *

 

= 0,073;

8.

 

p8 *

 

= 0,033.

x

 

x

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

x

 

На основе данных таблицы и проведенных расчетов построим гистограмму (рисунок 1.9). Следует отметить, что при неограниченном увеличении объема выборки n кривая гистограммы частот совпадает с графиком плотности вероятностей.

Рисунок 1.9 – Гистограмма распределения Построим статистическую функцию распределения загрузки кон-

тейнеров (рисунок 1.10):

 

1. при x ≤ 4 F*(x1) = 0;

6. при 10 < x ≤ 11,5 F*(x6) = 0,70;

34

2.при 4 < x ≤ 5,5 F*(x2) = 0,07; 7. при 11,5 < x ≤ 13 F*(x7) = 0,84;

3.при 5,5 < x ≤ 7 F*(x3) = 0,21; 8. при 13 < x ≤ 14,5 F*(x8) = 0,95;

4.при 7 < x ≤ 8,5 F*(x4) = 0,38; 9. при 14,5 < x ≤ 16 F*(x9) = 1,00.

5.при 8,5 < x ≤ 10 F*(x5) = 0,55;

Рисунок 1.10 – Статистическая функция распределения

Статистическая функция распределения случайной величины (рисунок 1.10) – это всегда разрывная ступенчатая функция, скачки которой происходят в точках, соответствующих возможным значениям случайной величины, и равны эмпирическим вероятностям этих значений. Сумма всех скачков функции F*(x) равна единице. По мере увеличения объема выборки и уменьшения интервалов ∆x число скачков становится больше, а сами скачки меньше, при этом ступенчатая кривая становится более плавной; случайная величина постепенно приближается к непрерывной величине, а её статистическая функция распределения – к непрерывной функции (интегральной функции распределения F(x)).

1.4.КРИТЕРИИ СОГЛАСИЯ

Влюбом статистическом распределении присутствуют элементы случайности, поэтому экспериментальные точки гистограммы обычно колеблются от опыта к опыту около неизвестной кривой истинного распределения.

При наличии числовых характеристик случайной величины (математического ожидания, дисперсии, коэффициента вариации) законы её распределения могут быть определены в первом приближении по таблице 1.1.

Для более точного определения теоретического закона распределения проводят дополнительную статистическую обработку данных.

35

Таблица 1.1 Законы распределения случайной положительной величины

в зависимости от коэффициента вариации

Пределы изменения

Закон распределения

коэффициента вариации Vх

случайной величины X

Vх ≤ 0,3

Нормальный

0,3 < Vх < 0,4

Гамма-распределение

0,4 ≤ Vх < 1

Вейбулла

Vх = 1

Экспоненциальный, Пуассона

При обработке статистических данных решают вопрос о том, как подобрать для исходного статистического ряда теоретическую кривую распределения, которая выражала бы существенные черты статистического материала, но не случайности, обусловленные недостаточным объемом выборки экспериментальных данных.

Под построением теоретической кривой распределения понимается такая обработка статистических данных, когда обеспечивается подбор наиболее подходящего теоретического закона распределения, который может быть задан либо функцией распределения F(x), либо плотностью распределения f(x).

Для построения теоретической кривой распределения исходный статистический ряд распределения аппроксимируется одной из дифференциальных функций теоретического распределения f(x). При этом выбирается такая функция f(x), которая обеспечивала бы максимальное приближение теоретических данных к эмпирическим f(x) = f*(x). Для оценки правдоподобия этого приближенного равенства разработано несколько критериев согласия проверяемых гипотез относительно вида функции f(x). Наиболее употребительными критериями согласия являются критерий χ2 К. Пирсона и критерий Л. Н. Колмогорова. Для примера подробно рассмотрим критерий χ2 К. Пирсона.

Критерий χ2 К. Пирсона

Согласно критерию χ2 К. Пирсона в качестве меры расхождения между теоретическим законом распределения и статистическим распределением выбрана величина, определяемая по формуле:

36

 

 

2

k

( p*

p )2

 

 

 

 

χ

 

= n

i

i

 

,

 

(1.48)

 

 

 

p

 

 

 

i=1

 

i

 

 

 

где k

число интервалов статистического ряда;

 

pi*

статистическая вероятность попадания случайной ве-

 

личины X в i-й интервал;

 

 

 

pi

теоретическая вероятность попадания случайной ве-

 

личины X в i-й интервал.

 

 

 

 

 

Учитывая, что pi* = mi/n, выражение (1.48) запишем как:

 

 

 

k

(m n p )2

 

 

χ2 = n

 

i i

 

,

(1.49)

 

 

n p

 

 

 

 

i=1

 

i

 

 

 

где mi – эмпирическое количество значений случайной величины, попадающих в i-й интервал.

Чтобы выяснить, является ли полученное расхождение χ2 случайным за счет ограниченного объема выборки или свидетельствует о наличии существенной разницы между теоретическим и статистическим распределениями, необходимо вычислить вероятность этого расхождения ∆ >= χ2, или P(χ2 ≤ ∆ < ∞)

– вероятность того, что за счет чисто случайных причин мера расхождения теоретического и статистического распределений ∆ будет не меньше, чем фактическое значение χ2 для данной выборки. Величина вероятности расхождения определяется по специальным таблицам при известных значениях r и χ2.

Число степеней свободы r вычисляется для статистического ряда распределения как

r = k l,

(1.50)

где l – число исчисленных статистических характеристик (математическое ожидание, дисперсия и т. д.), использованных при вычислении теоретического распределения. Если искомая вероятность окажется очень малой, практически меньше 0,1, то выбранное теоретическое распределение следует считать неудачным. При относительно большом значении искомой вероятности теоретическое распределение можно

признать не противоречащим опытным данным.

Критерий χ2 К. Пирсона применим в тех случаях, когда объем выборки n ≥ 100 и в каждом интервале число наблюдений не менее mi ≥ 5.

37

Пример 1.17. Используя критерий χ2 К. Пирсона, подобрать теоретический закон распределения загрузки контейнеров (см. при-

мер 1.16).

Решение:

По форме гистограммы можно предположить, что загрузка контейнеров подчиняется нормальному закону. Определим числовые характеристики нормального распределения:

k

M(X) = xipi* = 4,75·0,07 + 6,25·0,14 + … + 15,25·0,05 = 9,7 т;

i=1

k

D(X)= (M(X) – xi)2pi* = (9,7 – 4,75)2·0,07 + … + (9,7 – 15,25)2·0,05

i=1

=8,48, где xi – значение середины i-го интервала;

σx = D( X ) = 8,483 = 2,91;

Vx =

уx

=

2,91

≈ 0,3 .

M( X )

9,7

 

 

 

 

Величина Vx = 0,3 свидетельствует о том, что теоретическое распределение близко к нормальному закону распределения. Проверим это, воспользовавшись критерием согласия К. Пирсона χ2.

Определим теоретическую вероятность попадания значений загрузки контейнеров в заданные интервалы, используя формулу для определения вероятности попадания случайной величины в заданный интервал от α до β для нормального распределения и приложение А:

P(α < X < β) = F(β) – F(α).

рi = F(xi+1) – F(xi) = Ф(

xi +1 M( X )

) – Ф(

xi M( X )

),

 

 

 

σ

x

 

σ

x

 

 

 

 

где xi , xi+1 – значения границ i-го интервала.

р1 = Ф( 5,52,919,7 ) – Ф( 42,919,7 ) = Ф(-1,44) – Ф(-1,96) = 0,075 – 0,026 = 0,049 и т. д.

Составим сравнительную таблицу (таблица 1.2) чисел попаданий в интервалы mi и соответствующих значений npi (n = 100).

Таблица 1.2

Сравнительная таблица

Интервал,

 

4,0–5,5

 

 

 

5,5–7,0

 

 

 

7,0–8,5

 

 

 

8,5–10,0

 

 

10,0–11,5

 

11,5–13,0

 

13,0–14,5

 

14,5–16,0

xi, т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Количество

 

7

 

 

14

 

 

17

 

 

17

 

 

15

 

 

14

 

 

11

 

 

5

 

наблюдений, mi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теоретическое

 

5

 

11

 

17

 

21

 

20

 

14

 

8

 

4

 

количество на-

 

 

 

 

 

 

 

 

 

блюдений, n*pi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

38

Построим график теоретического распределения и совместим его с гистограммой статистического распределения (рисунок 1.11).

Рисунок 1.11 – График теоретического распределения и гистограмма статистического распределения

Вычислим значение меры расхождения по формуле:

 

8

(mi

n pi )

2

 

χ2

=

 

= 5,01.

 

n pi

 

 

i =1

 

 

Определим число степеней свободы: r = k l = 8 – 2 = 6. По приложению Б для r = 6 находим:

при χ2 = 3,83 p = 0,7; при χ2 = 5,35 p = 0,5.

Следовательно, искомая вероятность p при χ2 = 5,01 приближенно равна p = 0,545. Эта вероятность малой не является; поэтому гипотезу о том, что загрузка контейнеров распределена по нормальному закону, можно считать правдоподобной.

1.5. РЕШЕНИЕ ВЕРОЯТНОСТНЫХ ЗАДАЧ И ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ СРЕДСТВАМИ MS EXCEL

1.5.1. Законы распределения случайных величин

1.5.1.1. Дискретное распределение

Биноминальное распределение – это распределение числа X появления события A в серии из n независимых испытаний, вероятность появления которого определяется формулой Бер-

нулли (1.23):

P(X=m) = Сnm pm (1p)nm , m = 0, n

Если в биномиальном распределении p→0 и n→∞, то плотность вероятности биномиального распределения принимает вид (1.24):

P(X=m) = (amea ) = am ea , m = 0, n , а = n·p m! m!

39

Расчеты по формулам (1.23) и (1.24) проводят с помощью встроенных функций БИНОМРАСП(m, n, p, ЛОЖЬ) и ПУАССОН(k, a, ЛОЖЬ) (категория статистических функций).

В MS Excel последний параметр каждой встроенной функции закона распределения случайной величины – это переключатель с положениями ЛОЖЬ (0) и ИСТИНА (1). Положению ЛОЖЬ соответствует дифференциальная функция распределения (закон распределения вероятностей), ИСТИНА – интегральная функция распределения.

Пусть случайная дискретная величина X подчиняется биноминальному закону распределения с параметрами n = 5, p = 0,75. Её возможные значения 0, 1, 2, 3, 4, 5. Вычислим вероятности, с которыми она их принимает, определим закон распределения и проверим.

1. В диапазон A1:F1 вводим возможные значения X:

0, 1, 2, 3, 4, 5.

2.Выделяем ячейку A2, открываем диалоговое окно БИНОМРАСП (рисунок 1.12) и вводим данные.

Рисунок 1.12 – Диалоговое окно функции биноминального распределения

3.Нажатие ОК вводит формулу заданного распределения в A2.

4.Методом автозаполнения копируем ее в остальные ячейки диапазона A2:F2.

5.Выделяем диапазон A2:F2, используя функцию суммирования (кнопка ∑), убедимся в том, что сумма равна 1, то есть в диапазоне A2:F2 получен действительно закон распределения дискретной случайной величины (рисунок 1.13).

Выделив диапазон A1:F2, построим гистограмму распределения реализаций случайной величины: графическое изображение интервальных рядов распределения (рисунок 1.14).

40

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]