Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ст. и пл.doc
Скачиваний:
31
Добавлен:
11.11.2019
Размер:
4.35 Mб
Скачать

§ 2. Случайные величины

1. Определение и примеры. При проведении различных статистических экспериментов часто бывает интересен не исход эксперимента, а некоторая связанная с этим исходом числовая характеристика. В связи с этим возникает необходимость изучать числовые функции, определенные на множестве исходов данного эксперимента.

Пример 1. При стрельбе по мишени множество всевозможных исходов U есть некоторая часть плоскости, куда может попасть пуля. Каждой точке uU отвечает определ енное число очков, кото­рое мы обозначим через (u). Для стрелкá, очевидно, важно именно это число, а не сама точка, в которую попадет пуля. Например, для точек a и b, отмеченных на рис. 2, имеем (a)  (b)  2, так что при оценке результатов стрельбы эти точки не различаются.

Пример 2. Производится n независимых испытаний, в результате каждого из которых может появляться (или не появляться) событие А. Исходами здесь являются конечные последовательности u  (u1, u2, …, un), где uk – исход k-го испытания. Пусть (u) – число появлений события А при исходе u (т. е. число тех uk, которые благоприятны событию А). Тогда  – функция, определенная на множестве исходов данного эксперимента и принимающая значения 0, 1, 2, …, n.

Если  – числовая функция, определенная на множестве U всевозможных исходов статистического эксперимента, то значение этой функции (u) есть число, определяемое исходом u, полученным при проведении эксперимента, и, следовательно, зависящее от случая. При решении многих прикладных задач, приводящих к рассмотрению таких функций, оказывается важным установить вероятность того, что при проведении эксперимента значение (u) попадет в тот или иной числовой промежуток. Поэтому имеет смысл рассматривать лишь такие функции, для которых попадание значения в любой числовой промежуток I есть одно из событий, связанных с данным экспериментом. В этом случае множество {uU | (u)I} является множеством исходов, благоприятных этому событию. Сформулируем теперь основное для всего дальнейшего изложения

Определение 1. Случайной величиной на вероятностном пространстве (U, F, P) называется всякая функция , определенная на множестве U, принимающая действительные значения и такая, что для любого числового промежутка I имеет место соотношение {uU | (u)I}  F.

Событие, состоящее в том, что значение случайной величины  попадает в промежуток I, обозначается (I). Так же обозначается множество исходов, благоприятных этому событию, так что имеем

(I)  {uU | (u)I}.

Для конкретных промежутков применяются специальные обозначения, именно:

если I  [a; b], то событие (I) обозначается также (a m  m b); если, в частности, a  b, то отрезок [a; b] состоит из одной точки a; событие, состоящее в том, что  принимает это значение, обозначают в виде (  a);

если I  (a; b), то вместо (I) пишут (a <  < b);

если I  [a; b), то вместо (I) пишут (a m  < b);

если I  (–; b), то вместо (I) пишут ( < b);

если I  [a; ), то вместо (I) пишут ( l a).

Для промежутков прочих типов обозначения аналогичны.

Определение 2. Случайные величины  и  называются независимыми, если для любых числовых промежутков I и J события (I) и (J) независимы.

Можно доказать (см., например, [4]), что сумма, разность и произведение двух случайных величин на одном и том же вероятностном пространстве являются случайными величинами на том же пространстве. То же верно и для частного при условии, что делитель не обращается в нуль.

2. Дискретные случайные величины. Случайную величину , принимающую конечное или счетное множество значений, называют дискретной. В этом случае говорят также, что случайная величина имеет дискретное распределение. Вероятность P(  x), рассматриваемая как функция от x, называется законом распределения дискретной случайной величины .

Закон распределения обычно задают таблицей из двух строк: в первой строке перечисляют значения случайной величины, во второй – вероятности этих значений.

x

x1

x2

x3

. . .

P(  x)

p1

p2

p3

. . .

Если x1, x2, x3, … – все значения случайной величины, то сумма событий (  xj) достоверна и по свойству полной аддитивности имеем

p1 + p2 + p3 + …  1. (1)

Математическое ожидание M дискретной случайной величины  определяется равенством

M  x1p1 + x2p2 + x3p3 + … . (2)

Если число значений случайной величины конечно, то в правой части этого равенства стоит конечная сумма. Если число различных значений  счетно, то правая часть представляет собой числовой ряд. В этом случае, поскольку сумма ряда (2) не должна зависеть от способа нумерации значений , необходимо потребовать, чтобы ряд сходился абсолютно. Если же ряд (2) расходится или сходится условно, то считается, что случайная величина  не имеет математического ожидания.

Число D  M( – M)2 называется дисперсией случайной величины . Дисперсия случайной величины характеризует степень разброса ее значений.

Свойства математического ожидания и дисперсии предполагаются известными из курса теории вероятностей (см., например, [8]).

Число называется квадратичным отклонением случайной величины .

Дискретные случайные величины  и  независимы тогда и только тогда, когда при любых x, y независимы события (  x) и (  y).

Рассмотрим основные примеры дискретных распределений.

Биномиальное распределение. Случайная величина  называется распределенной по биномиальному закону (или по закону Бернулли), если она принимает целые значения 0, 1, 2, …, n, причем вероятности появления этих значений определяются равенством

Для такой случайной величины M  np, D  npq.

По биномиальному закону распределено число появлений события в последовательности независимых испытаний (теорема Бернулли).

Распределение Пуассона. Случайная величина  называется распределенной по закону Пуассона, если она принимает все целые неотрицательные значения 0, 1, 2, 3, …, причем вероятности появления этих значений определяются равенством

Для этого распределения имеем M  D  а.

По закону Пуассона распределено число появлений события в последовательности независимых испытаний при условии, что число испытаний весьма велико, а вероятность появления данного события в каждом испытании мала.

Геометрическое распределение. Случайная величина  называется распределенной по геометрическому закону, если она принимает все целые положительные значения 1, 2, 3, …, причем вероятности появления этих значений образуют геометрическую прогрессию, так что имеем

Математическое ожидание и дисперсия случайной величины , распределенной по геометрическому закону, вычисляются по формулам M  , D  .

По геометрическому закону распределено число испытаний до первого успеха. Например, пусть ведется стрельба из орудия до первого попадания в цель и вероятность попадания при каждом выстреле равна p. Вероятность того, что будет сделано n выстрелов, равна, как легко подсчитать, pqn–1, где q  1 – p.

3. Функция распределения. Непрерывные случайные величины. Если случайная величина имеет более чем счетное множество значений, то вероятность P(  x) появления данного значения x почти для всех значений или даже для всех значений оказывается равной нулю. Следовательно, для такой случайной величины не имеет смысла рассматривать закон распределения. В общем случае для характеристики случайной величины  используется функция распределения, которая определяется на числовой прямой равенством

F(x)  P( < x).

Очевидно, функция распределения является неубывающей на всей числовой прямой. Имеют место следующие свойства (доказательства, см., например, в [4] или в [8]):

(а) F непрерывна слева в любой точке x0, т. е. выполняется равенство ;

(б) ;

(в) .

Из (а) и (б) вытекает

(г) функция распределения случайной величины  непрерывна в точке x0 в том и только в том случае, когда P(  x0)  0.

Случайная величина  называется непрерывной, если ее функция распределения может быть представлена в виде , где f – неотрицательная функция, определенная на всей числовой прямой. Эту функцию называют плотностью вероятностей случайной величины  .

Из свойств интеграла с верхним переменным пределом следует, что функция распределения непрерывной случайной величины всюду непрерывна и имеет производную в каждой точке х, где непрерывна плотность вероятностей f, при этом Отсюда ввиду свойства (г) получаем, что P(  x0)  0 для любой точки x0.

Как показывает равенство (1), последнее утверждение заведомо не выполняется для дискретных случайных величин, поэтому никакая из них не является непрерывной.

В курсе теории вероятностей (см., например, [4] или [8]) доказывается следующее утверждение: если  – непрерывная случайная величина с плотностью вероятностей f и I – промежуток числовой прямой с концами a и b (случаи a  – или b   не исключаются), то имеет место равенство

. (3)

В частности, поскольку событие () достоверно, имеем .

Математическое ожидание M непрерывной случайной величины  определяется равенством

.

Интеграл в правой части либо абсолютно сходится, либо расходится. В последнем случае говорят, что случайная величина  не имеет математического ожидания.

Дисперсия D и квадратичное отклонение непрерывной случайной величины определяются таким же образом, как и для дискретной.

4. Нормальное распределение. Случайная величина  называется распределенной по нормальному закону (или по закону Гаусса), если она имеет плотность вероятностей

, где и  > 0. (4)

В частности, при a  0 и   1 f (x)  (x). Это распределение является предельным для биномиального распределения, когда число испытаний неограниченно растет.

Функция распределения случайной величины, распределенной по нормальному закону, имеет вид

, где .

Функции  и  используются при решении многих задач статистики. Таблицы значений этих функций приведены в конце данного пособия (табл. 1 и 2).

На рис. 3 и 4 изображены графики плотности вероятностей и функции распределения нормально распределенной случайной величины при разных значениях параметра .

Д

Рис. 3

ля слу

Рис. 4

чайной величины , распределенной по нормальному закону, плотность вероятностей которой определяется равенством (4), имеем M  a, D  2. Вероятность попа дания ее значения в промежуток I с концами b и c вычисляется по формуле, которая следует из (3):

. (5)

Если, в частности, I  (a – 3; a  3), то по формуле (5) получаем     2(3)   (мы воспользовались таблицей значений функции . Найденная вероятность близка к единице, поэтому считается практически достоверным, что в результате проведения эксперимента значение нормально распределенной случайной величины  окажется в интервале (a – 3; a  3) (правило «трех сигм»).

Легко убедиться, что если случайная величина  распределена по нормальному закону, то и случайная величина ab (ab, a  0) распределена по нормальному закону. Можно доказать также, что если случайные величины  и  независимы и распределены по нормальному закону, то и сумма  +  распределена по нормальному закону.

Нормальное распределение играет в статистике особую роль. Оказывается, что при некоторых довольно общих условиях распределение среднего арифметического произвольных случайных величин 1, 2, …, n является практически нормальным, если n достаточно велико. Это устанавливается так называемой центральной предельной теоремой (ее точную формулировку можно найти в [4]).

5. Моменты, асимметрия, эксцесс. При рассмотрении многих задач статистики понятий математического ожидания и дисперсии оказывается недостаточно. В этих случаях используются более общие характеристики случайных величин – моменты и центральные моменты различных порядков. Пусть k.

Моментом k-го порядка случайной величины  называют число k  Mk.

Центральным моментом k-го порядка случайной величины  называют число k  M(– Mk.

В частности, имеем M  1 и D  2.

Если  – дискретная случайная величина, принимающая значения x1, x2, x3, … с вероятностями pkP(  xk), то, очевидно,

,

(если случайная величина имеет счетное множество значений, то моменты существуют тогда и только тогда, когда ряды в правых частях абсолютно сходятся).

Для непрерывной случайной величины с плотностью вероятностей f доказываются равенства:

, (6)

(при условии, что несобственные интегралы в правых частях сходятся, в этом случае они и абсолютно сходятся).

Используя свойства математического ожидания, можно выразить центральные моменты через моменты. Для первых четырех центральных моментов получаем:

1  M(– M  M– M  0,

2  M(– M2  M(2– 2M  (M)2)  M2– 2(M)2  + (M)2)  M2– (M)2 ,

3  M(– M3  M(3 – 32M + 3(M)2 – (M)3)   M3 – 3M2M + 3(M)3 – (M)3  M3 – 3M2M + 2(M)3   ,

k  M(– Mk  M(4 – 43M + 62(M)2 – 4(M)3 + + (M)4)  M4 – 4M3M + 6M2(M)2 – 4(M)4 + (M)4    .

Эти первые моменты играют важную роль в статистике.

Если график плотности вероятностей симметричен относительно прямой x  M, то, как легко убедиться, цент­ральные моменты нечетного порядка все равны нулю.

Действительно, используя в этом случае замену переменной y  x – M во втором из интегралов (6), получаем . Так как (– y)k  – yk и f (M – y)   f (M  y), то под знаком интеграла стоит нечетная функция, а интеграл от нечетной функции по промежутку, симметричному относительно точки 0, равен нулю.

Например, таким свойством обладает нормальное распределение (см. график плотности вероятностей на рис. 3). Для несимметричных распределений центральные моменты нечетных порядков, за исключением первого, отличны от нуля, поэтому их можно использовать как характеристику отклонения от симметричности. Наиболее удобной характеристикой оказывается число

A  ,

где – квадратичное отклонение. Величину A называют коэффициентом асимметрии или просто асимметрией распределения случайной величины .

Если A > 0, то часть графика плотности вероятностей f, лежащая справа от точки M, оказывается более пологой, чем часть, лежащая слева от точки M (рис. 5а); если же A < 0, то часть графика плотности f, лежащая справа от точки M, оказывается, напротив, более крутой, чем часть, лежащая слева от точки M (рис. 5б) 1.

Для характеристики отклонения распределения случайной величины  от нормального используется величина

E  ,

называемая эксцессом распределения.

Е сли  распределена по нормальному закону, то, как легко подсчитать, /4  3, значит, E  0. Если E > 0, то график плотности вероятностей имеет бóльшую крутизну, чем для нормального распределения; при E < 0 график более пологий сравнительно с нормальным распределением (рис. 6).

6. Ковариация. Корреляция. Ковариационная матрица. Ковариацией случайных величин1  и  называется число

cov (, ) = M(( – M)( – M)).

Ясно, что cov (, ) = D. Имеем также cov (, ) =  M( – M – M  MM) = M() – MM.

Пусть D> 0, D > 0 2. Число

называется коэффициентом корреляции случайных величин  и . Случайные величины  и  называются некоррелированными, если .

Если  и  независимы, то M() = MM, значит, . Таким образом, независимые случайные величины некоррелированы. Обратное утверждение, вообще говоря, неверно, как показывает следующий

Пример. Пусть  – любая случайная величина, принимающая все действительные значения и имеющая четную плотность вероятностей f, и пусть  = 2. Очевидно, что случайные величины  и  зависимы, однако имеем M = , M() = M3 = (т. к. под знаком каждого интеграла нечетная функция), следовательно, .

Для любых случайных величин  и  с положительной дисперсией выполняется неравенство | r(, ) | m 1.

Действительно, имеем M(( – M)  x( – M))2 =

= M(( – M)2  2x( – M)( – M)  x2( – M)2) =

 D2x cov(x2D

Как видно из исходного выражения, полученный квадратный трехчлен не принимает отрицательных значений и, следовательно, не имеет двух различных действительных корней. Поэтому его дискриминант не положителен, так что (cov ())2 – D D m 0, откуда |cov ()| m , а значит, m 1.

Коэффициент корреляции характеризует степень зависимости случайных величин. Если он равен 0, то случайные величины почти независимы или совсем независимы; чем ближе его модуль к единице, тем больше зависимость. Можно доказать, что при = 1 любая из этих случайных величин линейно выражается через другую, например,  = a + b, где a, bÎÑ и a ¹ 0.

Ковариационной матрицей последовательности случайных величин 1, 2, ..., n называется матрица

,

или, коротко, S = (cov (i, j)).

Для любых действительных чисел a1, a2, ..., an, b1, b2, ..., bn имеет место равенство

,

где a = и b = – одностолбцовые матрицы, а верхний индекс T означает переход к транспонированной матрице: aT  (a1 a2 ... an).

Действительно,

.

В частности, получаем l 0, т. е. S – матрица ква­дратичной формы, принимающей лишь неотрицательные значения. Такую матрицу (а также и саму квадратичную форму) называют положительно полуопределенной. Если матрица S не особенная 1, то квадратичная форма равна 0 только при a1 = a2 = ... = an = 0 (в этом случае форму называют положительно определенной). Если же ранг матрицы S меньше n, то существует ненулевой вектор а, для которого . Это означает, что является постоянной на некотором множестве вероятности 1 (см. сноску 2 на стр. 30).

7. Случайные векторы. Конечная последовательность действительных чисел

x  (x1, x2, …, xn)

называется n-мерным вектором. Множество всех n-мерных векторов обозначается n.

Сумма n-мерных векторов x  (x1, x2, …, xn) и y  ( y1, y2, …, yn) и произведение вектора x на число с определяются равенствами:

x + y  (x1 + y1, x2 + y2 , …, xn + yn);

сx  (сx1, сx2, …, сxn).

Полагаем также xyx + (–1)y. Легко убедиться, что введенные операции обладают теми же свойствами, что и аналогичные операции над геометрическими векторами, так что множество n вместе с введенными операциями образует векторное пространство. Совокупность векторов

e1  (1, 0, ..., 0), e2  (0, 1, ..., 0), …, en  (0, 0, ..., 1)

образует базис пространства n, т. к. любой вектор x  (x1, x2, …, xn)  n единственным образом линейно выражается через векторы e1, e2, ..., en:

xx1e1 + x2e2 + … + xnen.

Для любых n-мерных векторов x  (x1, x2, …, xn) и y  (y1, y2, …, yn) полагают

x yx1 y1 + x2 y2 + ... + xn yn;

.

Число x y называют скалярным произведением векторов x и y, а число | x | – модулем вектора x.

Для любых векторов x, y  n и любого действительного числа с справедливы соотношения:

сx |  | с |  | x |, | x + y | m | x | + | y |, | x y | m | x |  | y |.

Рассмотрим теперь функцию f, определенную на произвольном множестве U, значениями которой являются векторы пространства n. Функцию с такими значениями называют векторной функцией или вектор-функцией.

Пусть uU и f (u)  x  (x1, x2, …, xn). Положим

f1(u)  x1, f2(u)  x2, …, fn(u)  xn.

Эти равенства определяет на множестве U n числовых функций f1, f2, …, fn, которые называют компонентами вектор-функции f. Пишут

f   ( f1, f2, …, fn).

Теперь мы можем сформулировать важное для дальнейшего

Определение. Случайным вектором на вероятностном пространстве (U, F, P) называется всякая вектор-функция ξ  (1, 2, …, n), все компоненты которой являются случайными величинами на том же пространстве.

Случайный вектор с n компонентами называют также n‑мерной случайной величиной.

Из определения, в частности, следует, что для любых чисел x1, x2, …, xn будет (k xk)F, следовательно, можно рассматривать событие (1 < x1)(2 < x2)...(n < xn). Функция от n переменных

F(x1, x2, ..., xn)  P((1 < x1)(2 < x2)...(n < xn)) (7)

называется функцией распределения случайного вектора ξ.

Если 1, 2, …, n независимы, то F(x1, x2, ..., xn)   P(1 < x1)P(2 < x2)...P(n < xn)  F1(x1)F2(x2)...Fn(xn), где Fj – функция распределения для jj  1, 2, ..., n).

Если существует неотрицательная функция f от n переменных такая, что для любых чисел x1, x2, …, xn выполняется равенство

, (8)

то случайный вектор ξ называется непрерывным, а функция f – ее плотностью вероятностей.

Любая компонента непрерывного случайного вектора – непрерывная случайная величина. Например, для функции распределения первой компоненты из (7) и (8) следует

так что 1 имеет плотность вероятностей

.

Математическое ожидание и дисперсия случайного вектора ξ  (1, 2, …, n) определяются равенствами:

Mξ  (M1, M2, ..., Mn); Dξ  (cov (i, j)).

Таким образом, Mξ представляет собой n-мерный вектор, а Dξ – симметричную положительно полуопределенную квадратную матрицу порядка n, являющуюся ковариационной матрицей компонент случайного вектора.

Рассмотрим, в частности, двумерный случайный вектор (, ), имеющий плотность вероятностей f. Его компоненты  и  имеют плотности вероятностей соответственно и .

Отношение называют условной плотностью вероятностей случайной величины  при условии, что случайная величина  принимает значение y.

Отношение называют условной плотностью вероятностей случайной величины  при условии, что случайная величина  принимает значение x.

Используются обозначения:

.

Введенные условные плотности вероятностей обладают обычными свойствами плотности. Например, получаем .

Обозначают также

, .

Первую величину называют условным математическим ожиданием случайной величины  при условии (  y), вторую – условным математическим ожиданием случайной величины  при условии (  x).

Условные математические ожидания определяются и для случая, когда одна или обе случайные величины  и  дискретны. Например, если  принимает счетное множество значений x1, x2, x3, ... и P(  y)  0, полагают

,

если ряд в правой части сходится абсолютно.