Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Tшєэўшъ .L..doc
Скачиваний:
78
Добавлен:
11.04.2015
Размер:
1.24 Mб
Скачать

Тема 2. Статистические оценки

Пусть требуется изучить количественный признак генеральной совокупности. Располагая лишь выборочными значениями признака, можно оценить, а не определить точно значения параметров закона или числовых характеристик признака; эти оценки будут случайными и меняться от выборки к выборке. Поэтому важно не только знать оценки неизвестных величин, полученные на основе выборочных данных, но и понимать меры их надежности.

Цель любого оценивания – получить как можно более точное значение неизвестной характеристики признака генеральной совокупности по данным выборочного наблюдения.

Статистической оценкой неизвестной величины (неизвестного параметра теоретического закона распределения или неизвестной числовой характеристики признака генеральной совокупности) называют функцию от наблюдаемых значений признака как независимых случайных величин.

Точечной называют статистическую оценку, которая характеризуется одним числом. Интервальной называют оценку, которая задаётся двумя числами – концами интервала, покрывающего неизвестную величину.

К статистической оценке предъявляется ряд естественных требований (несмещённость, состоятельность, эффективность), которые обеспечивают в некотором смысле её «доброкачественность». Определения несмещённой, состоятельной, эффективной оценок рекомендуется изучить самостоятельно.

Несмещённой и состоятельной оценкой генеральной средней (математического ожидания признака Х генеральной совокупности) является выборочная средняя .

В случае простого дискретного статистического ряда выборочная средняя определяется равенством

(1)

а в общем случае равенством

(2)

Несмещенной и состоятельной оценкой для генеральной дисперсии (дисперсия признака Х генеральной совокупности) является исправленная выборочная дисперсия.

(3)

При этом выборочная дисперсия DB вычисляется по формуле

(4)

где (5)

Выборочным среднеквадратическим отклонением (стандартом) называется число σВ, определяемое равенством

(6)

а число S, определяемое равенством

(7)

называется исправленным стандартом.

Пример 1. При изучении производительности труда Х на одного работника было обследовано 10 предприятий и получены следующие значения (тыс. руб.): 4,2; 4,8; 4,7; 5,0; 4,9; 4,3; 3,9; 4,1; 4,3; 4,8. Определить выборочную среднюю, выборочную дисперсию, исправленное среднее квадратическое отклонение.

Решение. По данной выборке объёма n=10 составим статистический ряд:

xi

3,9

4,1

4,2

4,3

4,7

4,8

4,9

5,0

ni

1

1

1

2

1

2

1

1

По формуле (2) найдется выборочная средняя:

(тыс. руб.).

По формуле (4) найдем выборочную дисперсию. Для этого вычислим ипо формуле (5):

Тогда DB=20,382–20,25=0,132. Согласно (7) S≈0,383.

Смысл полученных результатов заключается в следующем. Средняя производительность труда на одного работника для изученных предприятий составила =4,5 тыс. руб. Исправленное среднее квадратическое отклонениеS описывает абсолютный разброс значений показателя Х и в данном случае составляет S=0,383 тыс. руб.

Если дано интервальное распределение, то для вычисления числовых характеристик надо перейти к дискретному, взяв за значения вариант середины частичных интервалов.

Выборочные оценки являются приближёнными. Чтобы с помощью статистических данных можно было сделать правильные выводы, нужно знать точность и надёжность этих оценок.

Пусть * — статистическая оценка неизвестной величины . Надёжностью (доверительной вероятностью) называют вероятность , с которой осуществляется неравенство |-*| <  или *-<<*+.

Обычно надёжность оценки задаётся наперёд, причём в качестве  берут число, близкое к единице. По надежности  ищут такое число , чтобы

Р(*-<<*+)≡Р(|-*|<)=.

Число  называют точностью оценки (предельной ошибкой).

Интервал (*-,*+) называется доверительным интервалом; он является симметричной интервальной оценкой неизвестной величины .

Интервальной оценкой с надёжностью  математического ожидания М(Х)=q нормально распределённого признака X генеральной совокупности при известном среднем квадратическом отклонении этого признака служит доверительный интервал

, (8)

где n — объём выборки, выборочная средняя, t — значение аргумента функции Лапласа Ф(t), при котором Ф(t)=, — точность оценки.

Пример 2. В ходе обследования банковских счетов была проведена случайная выборка записей по вкладам. Из выборки n=100 оказалось, что средний размер вклада составляет 1 837 д.е.; генеральное среднее квадратическое отклонение размера вклада равно 280 д.е. Найти с надёжностью =0,95 доверительный интервал для среднего размера а вкладов по всем счетам, если известно, что размер вкладов распределён по нормальному закону.

Решение. По условию =1837; n=100;=280; =0,95. По таблице значений функции находим t из условия Ф(t)=, получаем t=1,96. По формуле (8) находим доверительный интервал:

,

,

.

Это означает, что с вероятностью, равной 0,95, можно утверждать, что средний размер вклада в генеральной совокупности находится в пределах от 1 782,12 д.е. до 1 891,88 д.е. Интервал ±54,88 составляет примерно ±3% среднего размера вклада в выборке (1 837). Это не очень большое отклонение, поэтому среднее значение выборки можно считать надёжной оценкой среднего значения генеральной совокупности.