- •1. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ
- •1.1. Законы распределения дискретных случайных величин
- •1.2. Числовые характеристики дискретных случайных величин, их свойства
- •1.3. Законы распределения непрерывных случайных величин
- •1.4. Числовые характеристики непрерывных случайных величин
- •1.5. Выборочные аналоги интегральной и дифференциальной функций распределения
- •1.6. Лабораторная работа № 1. Методы описательной статистики в пакете STATGRAPHICS
- •1.7. Нормальное распределение и его числовые характеристики
- •2. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ
- •2.1. -распределение
- •2.5. Гамма–распределение
- •2.7. Лабораторная работа № 2. Семейства вероятностных распределений в математических пакетах STATGRAPHICS и MAHTCAD
- •3. МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ (МЕТОД МОНТЕ-КАРЛО)
- •3.1. Общие принципы метода статистических испытаний
- •3.2. Датчики базовой случайной величины (БСВ)
- •3.3. Моделирование на ЭВМ стандартной равномерно распределенной случайной величины (базовой случайной величины)
- •3.5. Моделирование непрерывных случайных величин
- •3.6. Лабораторная работа № 3. Моделирование некоторых распределений с помощью базовых случайных величин в пакете MATHCAD
- •4. ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ И ИХ СВОЙСТВА
- •4.1. Статистические характеристики вариационных рядов и показатели их качества
- •4.3. Точечные оценки вероятности по частоте, математического ожидания и дисперсии
- •4.5. Методы получения точечных оценок
- •4.6. Сущность интервального оценивания
- •4.7. Приближенные и точные доверительные интервалы для параметров распределений
- •4.8. Лабораторная работа № 4. Оценивание параметров вероятностных распределений в пакетах STATGRAPHICS и MATHCAD
- •5. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ СОГЛАСИЯ
- •5.1. Понятие статистической гипотезы. Основные этапы проверки гипотез
- •5.2. Критерий Неймана – Пирсона
- •5.3. Проверка гипотез о числовых значениях параметров нормального распределения
- •5.4. Проверка гипотез о параметрах двух нормальных распределений
- •5.5. Лабораторная работа № 5. Проверка статистических гипотез о числовых значениях нормальных распределений в математических пакетах STATGRAPHICS и MATHCAD
- •5.6. Критерии согласия
- •Решение
- •5.7. Лабораторная работа № 6. Критерии согласия в статистическом пакете STATGRAPHICS
- •5.8. Лабораторная работа №7. Критерии согласия в математическом пакете MATHCAD
- •6. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
- •6.1. Постановка задачи
- •6.2. Дисперсионный анализ
- •Решение
- •6.3. Ранговый однофакторный анализ
- •6.4. Критерий Краскела - Уоллиса (Н-критерий)
- •Решение
- •6.5. Лабораторная работа № 8. Однофакторный ранговый и дисперсионный анализ в статистическом пакете STATGRAPHICS
- •7. РЕГРЕССИОННЫЙ АНАЛИЗ
- •7.1. Модели регрессии
- •7.4. Проверка адекватности линейной регрессии
- •7.5. Выбор наилучшей регрессии
- •8. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ
- •8.2. Критерий знаков
- •8.3. Критерий знаков для одномерной выборки
- •8.4. Ранговый критерий (одновыборочный критерий Вилкоксона)
- •8.5. Двухвыборочный ранговый критерий Вилкоксона
С.Д. Шапорев
ПРИКЛАДНАЯ СТАТИСТИКА
Учебное пособие
Санкт-Петербург
2003
Министерство образования Российской Федерации Балтийский государственный технический университет «Военмех»
С.Д. Шапорев
ПРИКЛАДНАЯ СТАТИСТИКА
Учебное пособие
Санкт-Петербург
2003
55
УДК 519.23 (075.8) Ш 24
Шапорев С.Д.
Ш 24 Прикладная статистика: Учебное пособие / Балт.
гос. техн. ун-т. СПб., 2003. 254 с.
В пособии рассмотрены основные статистические методы, приемы вычислений и программы часто используемые в практике инженерных расчетов по специальностям выпускающих кафедр БГТУ. Содержит наиболее важные разделы математической статистики: методы описательной статистики, метод статистических испытаний, оценивание числовых характеристик и закона распределения случайной величины, проверка гипотез, дисперсионный и корреляци- онно-регрессионный анализ. Подробно рассмотрены вопросы статистического моделирования случайных величин на ЭВМ. Приведены примеры, их разбор и решения, графические иллюстрации. Использованы популярные пакеты STATGRAPHICS и MATHCAD.
Большое внимание уделяется практической работе с описанными алгоритмами, предлагаются лабораторные работы по всем изучаемым темам, написанные в статистическом пакете STATGRAPHICS и математическом пакете MATHCAD. Каждая лабораторная работа включает серию индивидуальных заданий.
Предназначено для студентов дневного и вечернего отделения. Его использование поможет активизировать самостоятельную работу студентов по курсу «Прикладная статистика» и даст возможность преподавателям контролировать индивидуальную работу студентов в течение всего семестра.
УДК 519.23 (075.8)
Р е ц е н з е н т ы: кафедра высшей математики ПГУПС (зав. каф. д-р техн. наук, проф. В.Г. Дегтярев), д-р техн. наук, проф. М.С. Попов
Утверждено редакционно-издательским советом университета
© БГТУ, СПб., 2003
1.СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ
1.1.Законы распределения дискретных случайных величин
Случайной величиной X называется числовая функция X = X (ω) от
элементарного события, определенная на множестве элементарных исходов Ω , и такая, что при любом x множество тех ω, для которых
X (ω) < x , принадлежит алгебре событий.
Дискретной случайной величиной называется случайная величина с конечным или счетным множеством возможных значений.
Законом распределения случайной величины называется любое правило, позволяющее находить вероятности всевозможных событий, связанных с этой случайной величиной. Для дискретных случайных величин простейшей формой закона распределения является ряд распределения - это таблица, в одной строке которой перечислены все значения случайной величины, а во второй строке - соответствующие им вероятности. Например,
|
X |
x1 |
x2 |
x3 |
|
... |
xn |
|
|
P |
p1 |
p2 |
p3 |
|
... |
pn |
|
Итак, дискретная случайная величина X |
в результате опыта примет |
одно из своих возможных значений, то есть произойдет одно из полной |
|||||
группы |
|
событий |
ω1 = (X = x1), |
ω2 = (X = x2 ),..., ωn = (X = xn ), |
|
Ω = {ω1, ω |
2 ,..., ωn }. |
Вероятности, соответствующие этим событиям, тако- |
|||
вы |
p1 |
= P(X = x1), p2 = P(X = x2 ),..., pn = P(X = xn ). |
Очевидно, |
n
∑ pi =1 , так как xi , i = 1, n образуют полную группу событий.
i=1
Графическое изображение ряда распределения называется многоугольником распределения дискретной случайной величины.
Наиболее общей формой закона распределения является функция распределения. Функцией распределения случайной величины X называ-
ется вероятность неравенства X < x , рассматриваемая как функция параметра x ,
F(x) = P(X < x). |
(1.1.1) |
Чаще всего определенную таким образом функцию распределения называют интегральной функцией распределения или интегральным законом распределения. Функция распределения - самая универсальная характеристика, она полностью определяет случайную величину. Функция распределения любой случайной величины обладает следующими свойствами:
3
1) 0 ≤ F(x) ≤ 1 для всех x ;
2) F(x1) ≤ F(x2 ), если x1 < x2 ; 3) F(− ∞) = 0, F(∞) = 1 ;
4) во всех точках области определения функция непрерывна слева,
т.е. F(x − 0) = F(x) или lim F(x) = F(x0 ).
x→x0 −0
Можно показать, что любая функция F(x), обладающая этими свой-
ствами, может быть функцией распределения некоторой случайной величины. График F(x) в общем случае представляет собой график неубы-
вающей функции, значения которой начинаются от нуля и достигают единицы, причем в отдельных точках функция может иметь разрывы первого рода. Если известен ряд распределения дискретной случайной величины, то можно легко построить функцию распределения
F(x) = P(X < x) = ∑P(X = xi ), |
(1.1.2) |
xi <x |
|
где суммирование распространяется на все те значения |
xi , которые мень- |
ше x . |
|
Пример. На пути движения автомобиля шесть светофоров, каждый из них либо разрешает, либо запрещает дальнейшее движение автомобиля с вероятностью 0.5. Составить ряд распределения и построить функцию распределения числа светофоров, пройденных автомобилем до первой остановки.
Движение автомобиля либо заканчивается на k -м светофоре, если до этого он проходит k −1 светофор без задержки, а на k -м будет остановлен, либо автомобиль пройдет все светофоры и остановлен не будет.
Пусть случайная величина X - число светофоров, пройденных автомобилем. Очевидно, что X может принимать значения 0, 1, 2, 3, 4, 5, 6. X подчинена геометрическому закону распределения с дополнительным условием, что опыт будет закончен, если X примет значение шесть. Следовательно,
|
|
|
P(X = k ) = qpk , |
k = 0,1, 2, 3, 4, 5, |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
P(X = 6) |
|
|
5 |
|
|
|
|
|
|
|
|
(1.1.3) |
|||||||
|
|
|
|
|
=1 − ∑P(X = i), |
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
i =0 |
|
|
|
|
|
|
|
|
|
||||
причем, очевидно, |
что p =1 2, q =1 − p =1 2. |
Тогда ряд распределения |
||||||||||||||||||||||
случайной величины X имеет следующий вид. |
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
X |
|
0 |
|
|
1 |
|
2 |
|
3 |
|
|
4 |
|
5 |
|
6 |
|
|
|||||
|
P |
|
1 |
|
|
|
1 |
|
|
1 |
|
|
1 |
|
|
1 |
|
|
1 |
|
|
1 |
|
|
|
|
2 |
|
|
4 |
|
8 |
|
16 |
|
|
32 |
|
64 |
|
64 |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
Действительно, |
например, |
p = P(X = 0) = qp0 |
= q =1 2, |
p2 = P(X =1) = qp =1 4 |
|
1 |
|
и так далее. |
Зная ряд распределения, легко по- |
строить многоугольник распределения и функцию распределения, пользуясь формулой F(x) = P(X < x) = ∑P(X = xi ) (рис. 1.1).
|
|
|
|
|
|
|
|
|
|
|
|
|
xi <x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1.0 |
F(x) |
|
|
|
|
|
|
|
P |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
0.5 |
|
|
|
|
|
|
|
|
|
|
|
|
0.75 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0.5 |
|
|
|
|
|
|
|
0.2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0.25 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
1 |
2 |
3 |
4 |
|
5 |
6 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
x |
|||||
|
|
|
Рис. 1.1. Многоугольник распределения и функция распределения |
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
дискретной случайной величины |
|
|
|
|
||||||
|
Действительно, |
|
F(0) = P(X < 0) = 0, F(1) = P(X <1) = |
|
|
|
||||||||||||||
= ∑ P(X = xi ) = p1 |
= |
1 |
и так далее. Тогда функция распределения мо- |
|||||||||||||||||
|
||||||||||||||||||||
|
xi <1 |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
жет быть выражена в следующем виде:
|
|
|
0, x ≤ 0, |
|
|
|
1 |
= 0.5, 0 < x ≤1, |
|
||
|
2 |
|
|||
|
1 |
|
= 0.75, 1 < x ≤ 2, |
|
|
|
4 |
|
|
||
|
|
|
|
|
|
|
7 |
= 0.875, 2 |
< x ≤ 3, |
|
|
|
8 |
(1.1.4) |
|||
F(x) = |
|
|
|
||
|
15 |
|
|
|
|
|
16 = 0.938, 3 < x ≤ 4, |
|
|||
|
31 |
|
= 0.967, 4 |
< x ≤ 5, |
|
|
32 |
|
|
||
|
63 |
|
= 0.984, 5 |
< x ≤ 6, |
|
|
64 |
|
|
||
|
|
|
|
|
|
|
|
|
1, x > 6. |
|
|
|
|
|
|
||
|
|
|
5 |
|
|
1.2. Числовые характеристики дискретных случайных величин, их свойства
Ряд распределения или функция распределения дискретной случайной величины являются ее исчерпывающими характеристиками, однако они достаточно громоздки, поэтому возникает необходимость в менее «объемных» характеристиках. Таковыми являются характеристики положения и рассеивания. Характеристики положения дают некоторое среднее положение случайной величины, вокруг которого она группируется, а характеристики рассеивания указывают степень рассеивания случайной величины вокруг ее среднего положения.
Наиболее употребительная характеристика положения - математическое ожидание - среднее взвешенное из значений xi , причем каждое xi
при осреднении должно учитываться с весом pi . Таким образом, математическое ожидание дискретной случайной величины равно
mX = M (X ) = x1 p1 ++x2 p2++ ...++ xn pn p1 p2 ... pn
n
∑xi pi
=i =1n
∑pi
i =1
n |
|
= ∑xi pi . |
(1.2.1) |
i =1
Если в правой части формулы (1.2.1) стоит ряд, то
∞
M (X ) = ∑xi pi = i =1
n
lim ∑xi pi , причем ряд должен сходиться абсолютно.
n→∞ i =1
Математическое ожидание у данного конкретного распределения может и не существовать.
Математическое ожидание случайной величины X связано своеобразной зависимостью со средним арифметическим наблюденных значений случайной величины X при большом числе опытов. Эта зависимость того же типа, что между частотой и вероятностью, а именно, при большом числе опытов среднее арифметическое значений X сходится по вероятности к своему математическому ожиданию.
Свойства математического ожидания:
1. M (C) = C, C = const. Постоянную величину можно рассматривать как случайную, принимающую только одно значение с вероятностью рав-
1
ной единице, т.е. M (C) = ∑C 1 = C.
i=1
2.Константу можно выносить за знак математического ожидания,
6
|
M (C X ) = |
C M (X ). |
|
|
|
|
n |
|
|
т.е. |
Действительно, |
M (CX ) = ∑Cxi pi = |
|||||||
|
|
|
|
|
|
|
|
i =1 |
|
n |
|
|
|
|
|
|
|
|
|
= C ∑xi pi = CM (X ) . |
|
|
|
|
|
|
|||
i =1 |
|
|
аддитивности: M (X +Y ) = M (X )+ M (Y ), |
|
|
||||
3. |
Свойство |
так |
как |
||||||
|
n |
|
n |
n |
|
|
(Y ). |
|
|
M (X +Y ) = ∑ |
(xi + yi )pi = ∑xi pi + ∑yi pi = M (X )+ M |
|
|
||||||
|
i=1 |
|
i=1 |
i=1 |
|
|
|
|
|
Совокупность второго и третьего свойств называется свойством |
|||||||||
линейности |
и |
выражается |
следующим |
равенством |
|||||
M (C1X1 + C2 X 2 +... + Cn X n ) = C1M (X1)+ C2M (X 2 )+ ... + Cn M |
(X n ). |
В |
|||||||
частности, если Y = kX + b , то M (Y ) = M (kX + b) = kM (X )+ b. |
|
|
4.Свойство монотонности: если X ≥ Y , то M (X ) ≥ M (Y ).
5.Мультипликативное свойство: для независимых случайных величин X и Y справедливо M (X Y ) = M (X ) M (Y ).
Кроме математического ожидания в качестве характеристик положения случайной величины часто используются мода и медиана.
Модой дискретной случайной величины X называется такое значе-
ние xk , k = |
1, n |
, для которого |
|
|
|
P(X = d X ) = max P(X = xk ), |
(1.2.2) |
|
|
k |
|
т.е. мода есть наиболее вероятное значение дискретной случайной величины, если это значение единственно. Мода может быть и не единственной, т.е. распределение может иметь несколько мод (мультимодальное распределение).
Медианой дискретной случайной величины X называется число hX ,
удовлетворяющее условию |
|
P(X < hX ) = P(X ≥ hX ) =1 2. |
(1.2.3) |
Так как данное уравнение в общем случае может иметь несколько корней, то значение медианы может быть не единственным.
Перейдем теперь к определению характеристик рассеивания случайной величины около своего математического ожидания.
Начальным моментом k -го порядка дискретной случайной величины X называется математическое ожидание k -й степени случайной величины
n |
|
α k = M (X k )= ∑xik pi . |
(1.2.4) |
i =1
Это определение совпадает с определением начального момента в ме-
7
ханике, если вероятности pi интерпретировать как массы точек xi . В ча-
стности из формулы (1.2.4) следует, что первый начальный момент есть математическое ожидание, т.е. α1 = mX .
Центральным моментом k -го порядка дискретной случайной величины X называется математическое ожидание k -й степени соответствующей центрированной случайной величины
|
n |
(xi − mX )k pi . |
|
μk |
= M [(X − mX )k ]= ∑ |
(1.2.5) |
|
|
i =1 |
|
|
Дисперсией |
случайной величины X называется |
математическое |
ожидания квадрата соответствующей центрированной величины, т.е. ее второй центральный момент,
n |
|
D(X ) = DX = μ2 = M [(X − mX )2 ]= ∑(xi − mX )2 pi . |
(1.2.6) |
i =1
Средним квадратическим отклонением или стандартным отклонением (стандартом) случайной величины X называется величина
σX = DX . |
(1.2.7) |
Для дисперсии из формулы (1.2.6) легко выводится следующая часто |
|
употребляемая формула: |
|
n |
|
DX = ∑xi2 pi − mX2 . |
(1.2.8) |
i =1 |
|
Свойства дисперсии: |
|
|
|
|
|
|
|
||||
1. |
Дисперсия любой случайной величины X неотрицательна, причем |
||||||||||
DX = 0 тогда |
и |
только тогда, |
когда |
X - |
постоянная, |
т.е. |
|||||
D(X ) ≥ 0, D(C) = 0. |
|
|
|
|
|
|
|
|
|
||
2. |
Если Y = X + C , где C = const , то D(Y ) = D(X + C) = D(X ). |
|
|||||||||
3. |
Если C = const , то D(C X ) = C2D(X ). |
|
|
|
|||||||
4. |
Если |
случайные |
величины |
X |
и Y |
независимы, |
то |
||||
D(X +Y ) = D(X )+ D(Y ). |
|
|
|
|
|
|
|
||||
Коэффициентом |
асимметрии называется |
число |
A , определяемое |
||||||||
формулой |
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
μ3 |
|
∑(xi − mX )3 pi |
|
|
|
||
|
|
|
A = |
= |
i =1 |
|
. |
|
(1.2.9) |
||
|
|
|
σ3X |
σ3X |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
Коэффициент асимметрии служит для характеристики асимметрии многоугольника распределения. В случае отрицательного коэффициента
8