Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика

.pdf
Скачиваний:
10
Добавлен:
30.05.2015
Размер:
313.16 Кб
Скачать

Элементы математической статистики 1. Генеральная и выборочная совокупности

1.1 Основные определения

Пусть необходимо исследовать некоторую совокупность однородных объектов в соответствии с некоторым качественным (или количественным) признаком.

Зачастую объем совокупности настолько велик, что исследование каждого входящего в эту совокупность объекта представляется невозможным, да и не является необходимым. На практике достаточно отобрать подгруппу объектов для исследования, так, чтобы свойства и характеристики отобранной для анализа подгруппы хорошо приближали свойства и характеристики исходной совокупности.

Выборочной совокупностью (выборкой) называется совокупность случайно отобранных для исследования объектов.

Генеральной совокупностью называется исходная совокупность объектов, из которой производится выборка.

Объемом выборочной или генеральной совокупности называется количество объектов, входящих в нее.

Выборку называют повторной, если взятый для анализа объект возвращается в исходную совокупность перед отбором следующего объекта. Таким образом, один и тот же объект имеет шансы несколько раз попасть в однуи туже выборку.

Выборку называют бесповторной, если взятый для анализа объект больше не возвращается в исходную совокупность перед отбором следующего объекта и тем самым, может попасть в выборку не более одного раза.

3

Выборка является репрезентативной, если ее характеристики хорошо приближают характеристики генеральной совокупности.

Для того, чтобы выборка была репрезентативной, необходимо, чтобы в выборке были соблюдены пропорции генеральной совокупности. То есть, чтобы все объекты, обладающий теми или иными свойствами имели равные шансы попасть в выборку. Для этого необходимо правильно осуществить отбор элементов генеральной совокупности в выборку.

Способы отбора данных: 1) Простой случайный.

При простом случайном отборе объекты извлекаются по одному из генеральной совокупности, при этом каждый объект имеет равные шансы попасть в выборку.

2) Типический.

Объекты выбираются из каждой типической части генеральной совокупности, так, что вероятность каждого объекта попасть в выборку пропорциональна доле этой части в генеральной совокупности.

3) Механический.

Генеральная совокупность разбивается на столько групп, сколько объектов нужно включить в выборку. После чего из каждой группы выбирается по одному объекту.

4) Серийный.

Из генеральной совокупности отбирается не один объект, а серия, после чего все объекты данной серии подвергаются исследованию.

4

1.2 Вариационный ряд

Проведем некоторый эксперимент, в рамках которого будем рассматривать некоторую случайную величину X с функцией распределения FX (x).

Выборкой объема n из генеральной совокупности с функцией распределения FX (x) называется последовательность

x1, x2 ,..., xn

наблюдаемых значений случайной величины X , соответствующих n независимым повторениям эксперимента.

Аналогично можно определить выборку для многомерных

случайных величин.

 

 

 

 

 

Пусть в

эксперименте

наблюдается p мерная

случайная

величина

X = (X (1), X (2),..., X (p))

с

многомерной

функцией

распределения FX (x(1), x(2),..., x(p)).

Тогда выборкой

объема n из

генеральной

совокупности

с

 

функцией

распределения

FX (x(1), x(2),..., x(p)) называется последовательность векторов

x(1), x(2),..., x(p), i =1, n ,

i

i

i

наблюдаемых значений случайной величины X = (X (1), X (2),..., X (p)), соответствующих n независимым повторениям эксперимента.

Рассмотрим случай одномерной случайной величины. Упорядочив элементы выборки по возрастанию, полученную

последовательность будем называть вариационным рядом.

5

Разность между максимальным и минимальным элементами выборки называется размахом выборки и обозначается

ω = xmax xmin .

Если в выборке имеются повторяющееся элементы, при этом

имеется k различных значений,

и значение xi ,

i, k

 

встречается в

выборке ni раз, вариационный ряд записывают в виде таблицы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

x1

x2

 

xk

 

k

 

 

 

 

 

 

 

 

 

 

 

ni = n.

 

 

 

 

ni

n1

n2

 

nk

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

а ni ,

 

 

Величины

xi ,

 

 

называются

вариантами,

 

 

i, k

i, k

абсолютными частотами.

 

 

 

 

 

 

 

 

 

 

1.3 Эмпирическая функция распределения

Оценкой функции распределения FX (x)= P(X < x) наблюдаемой случайной величины X называется кусочно-постоянная функция,

называемая эмпирической функцией распределения, вычисляемая по формуле

F* (x)=

nx

=

ni

,

 

 

 

n

i:xi <x n

 

здесь nx количество вариант выборки, значения которых меньше x . С увеличением объема выборки, значения эмпирической функции распределения сходятся по вероятности к теоретической функции

распределения,

lim P{F(x)F* (x) < ε}=1, ε > 0 .

n→∞

6

Свойства эмпирической функции распределения:

 

1.

F(x)кусочно-постоянная,

неубывающая

функция,

 

непрерывная слева;

 

 

 

 

 

2.

в точках x = x ,

i =

 

 

функция F* (x) терпит

разрывы

1, k

 

i

 

 

 

 

 

первого рода или скачка, причем величины скачков равны ni* ;

3.0 F* (x) 1;

4.F* (x) = 0 , при x xmin , F* (x) =1, при x > xmax .

2. Оценка параметров распределений

Пусть проводится некоторый эксперимент, в рамках которого рассматривается некоторая случайная величина X . Предположим, что распределение величины X известно с точностью до некоторых неизвестных параметров.

Необходимо по наблюдениям за случайной величиной X , то есть по выборке x1, x2 ,..., xn построить оценки неизвестных параметров распределения.

Статистической оценкой неизвестного параметра называется функция наблюдений.

То есть оценки неизвестных параметров являются некоторыми статистиками.

7

θ* его

2.1 Точечные оценки. Свойства оценок

Точечной оценкой неизвестного параметра называют оценку, выражающуюся одним числом, которое хорошо (в некотором смысле) приближает истинное значение неизвестного параметра.

Для получения удовлетворительных результатов оценивания, то есть, чтобы получаемые оценки хорошо приближали значения оцениваемых параметров, они должны удовлетворять некоторым условиям.

Пусть распределение наблюдаемой случайной величины зависит от некоторого неизвестного параметра θ . И пусть статистическая оценка. Отметим, что сам параметр θ , в этом случае

является неслучайной величиной, а его оценка θ* величина случайная. Повторяя серии по n экспериментов несколько раз, мы получаем несколько выборок, по которым может построить несколько различных оценок неизвестного параметра: θ1* ,θ2* ,... и т.д.

В каждом отдельном случае оценка будет отклоняться в туили иную сторону от истинного значения параметра θ . Если при этом будет присутствовать систематическое отклонение в оценивании в ту или иную сторону, будем получать, что Mθ* <θ или Mθ* >θ . Для избежания систематических ошибок оценивания необходимо выполнение первого свойства оценок.

1. Несмещенность.

 

 

 

 

Несмещенной называется оценка, для которой Mθ* =θ .

 

Но даже при выполн

ении

условия

несмещенности,

в каждом

отдельном случае отклонение

оценки

от истинного

значения

8

параметра может быть довольно велико. Поэтому возникает необходимость говорить об еще одном свойстве оценок – эффективности.

2.Эффективность.

Пусть имеется две различные оценки θ1* и θ2* неизвестного параметра θ , построенные по одному и тому же объему выборки.

Если Dθ1* < Dθ2* , то θ1* является более эффективной.

Наиболее эффективной назовем ту оценку, для которой дисперсия будет наименьшей.

3.Состоятельность.

Состоятельной назовем ту оценку, которая стремится по вероятности к истинному значению параметра при бесконечном увеличении объема выборки. То есть, если θ* (n)оценка неизвестного параметра θ , построенная по выборке в n наблюдений, θ* (n) будет

P

состоятельной, если θ* (n)θ .

n→∞

По смыслу это означает, что, чем больше объем выборки, тем выше точность получаемых оценок.

9

2.2 Выборочное среднее

Пусть имеется выборка наблюдений за случайной величиной

X : x1, x2 ,..., xn .

Оценкой математического ожидания случайной величины X является выборочное среднее, вычисляемое по формуле

x = 1 n xi .

n i=1

Если в выборке содержатся повторяющиеся значения и выборка может быть в виде вариационного ряда

 

 

xi

 

 

x1

x2

 

xk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

n1

n2

 

nk

 

 

 

 

 

 

 

 

 

 

 

 

выборочное среднее определяется как

 

 

 

 

 

 

 

 

1

 

k

 

k

n

 

k

 

 

x =

n

xi ni = xi

i

= xi ni* .

 

 

n

 

 

 

 

 

i=1

 

i=1

 

i=1

 

Предположив,

что выборка

x1, x2 ,..., xn

является реализацией

независимых

одинаково

распределенных случайных

величин

X1, X 2 ,..., X n ,

имеющих

одинаковое

математическое

ожидание

MXi = a , i =1, n , получаем, что

Mx = M 1n n Xi =i=1

То есть, выборочное среднее математического ожидания.

1

n

 

 

1

 

MXi

=

 

na = a .

n

 

 

i=1

 

 

n

является

 

несмещенной оценкой

10

2.3 Выборочная дисперсия

Пусть имеется выборка наблюдений за случайной величиной

X : x1, x2 ,..., xn .

Предположим для начала, что теоретическое значение математического ожидания известно и равно mX . Тогда характеристикой рассеяния выборочных наблюдаемых значений количественного признака вокруг математического ожидания mX является величина, вычисляемая по формуле:

2

=

1

n

2

S0

n

(xi mX ) .

 

 

i=1

 

Если математическое ожидание неизвестно, найдем его оценку как выборочное среднее x . Тогда характеристикой рассеяния выборочных наблюдаемых значений количественного признака вокруг своего

выборочного

 

среднего

 

x

 

является

 

 

выборочная

дисперсия,

вычисляемая по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

2

=

1

n

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

n

(xi

x) .

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

Предположив,

 

что

выборка

 

x1, x2 ,..., xn

является

реализацией

независимых

одинаково

 

распределенных

случайных величин

X1, X 2 ,..., X n ,

 

имеющих

одинаковое

математическое

ожидание

MXi = a и дисперсию DXi

=σ 2

i =

 

 

, получаем, что

 

1, n

 

 

2

 

1

n

 

 

 

2

 

n 1

 

 

Dx

 

MS

 

= M

 

(Xi x)

=

 

 

 

 

DX = Dx

 

.

 

 

 

n

 

 

n

 

 

n

i=1

 

 

 

 

 

 

 

 

 

 

 

То есть, в этом случае, выборочная дисперсия является смещенной оценкой генеральной дисперсии.

11

Поэтому используется поправка

S 2* = S 2 n n1 .

Несмещенная оценка дисперсии при неизвестном математическом ожидании получается по формуле

S 2 = n11 in (xi x)2 .

=1

Аналогичные формулы могут быть получены для оценки дисперсии в случае, когда выборка представлена вариационным рядом

 

 

 

 

xi

 

x1

 

x2

 

 

 

 

xk

 

 

 

 

 

ni

 

n1

 

n2

 

 

 

 

nk

 

В этом случае

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

k

2

 

 

 

 

 

 

1

 

k

2

2

 

 

 

2

 

 

 

S0

=

n

(xi

mX ) ni ,

S

 

 

=

 

 

 

(xi x) ni .

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

n 1 i=1

 

Выборочным среднеквадратическим отклонением (СКО)

называется величина, равная корню квадратному из выборочной дисперсии, т.е. величина S .

2.4 Другие оценки параметров

Выборочным начальным моментом s -того порядка называется величина

 

1

n

1

k

αˆs =

xis =

xis ni .

n

n

 

i=1

i=1

Выборочным центральным моментом s -того порядка называется величина

12