Ошибка репрезентативности выборочных параметров

По части никогда не удается полностью охарактеризовать целое, всегда остается вероятность того, что выборочная оценка недостаточна близка к значению параметра генеральной совокупности, имеет некоторую ошибку. Отличия значений выборочных параметров от генеральных называются ошибкой репрезентативности данного параметра, или просто (статистической) ошибкой. При увеличении объема выборки ошибки репрезентативности стремятся к нулю (следствие закона больших чисел). Численно выраженные статистические ошибки служат мерой тех пределов, в которых выборочные параметры могут отклоняться от значений генеральных параметров. Например, если для нескольких выборок, полученных из одной и той же генеральной совокупности, посчитать средние, а затем оценить изменчивость этих средних, то стандартное отклонение средних (S_M) и будет численной мерой ошибки репрезентативности выборочной средней. Она обозначается буквой m.

Величина ошибки тем больше, чем больше варьирование признака (S) и чем меньше выборка (n). Ошибку репрезентативности имеют все статистические параметры, рассчитанные по выборке. Для практики статистического оценивания разработаны специальные формулы. Для нормального распределения они имеют следующий вид. Ошибка средней: ,

ошибка стандартного отклонения: ,

ошибка коэффициента вариации: .

Вычисленные значения ошибок подставляют к соответствующим параметрам со знаками плюс-минус (параметр ± ошибка) и в такой форме представляют в научных отчетах и публикациях. В примере с бурозубками для разных параметров имеем:

, M = 9.3 ± 0.11 г,

, S = 0.89 ± 0.079 г,

, CV = 9.6 ± 0.9%.

Не следует путать статистическую ошибку с методическими ошибками и ошибками точности (точности измерений, анализов, подсчетов и т. д.), хотя методические погрешности и увеличивают ошибку репрезентативности, но другим путем – методические огрехи увеличивают изменчивость признака, стандартное отклонение.

При всей неизбежности статистической ошибки она может быть сведена к минимуму отбором достаточного числа особей (вариант). С ростом объема выборки оценки параметров стабилизируются, а их ошибки репрезентативности уменьшаются.

Доверительный интервал

П араметры генеральной совокупности практически всегда остаются неизвестными, о них судят по выборочным оценкам, используя для этого значения ошибок репрезентативности. Теоретические исследования поведения выборочных средних (как случайных величин) показали, что они подчиняются нормальному закону, большинство из них (95%) находится поблизости от генеральной средней – в диапа-зоне M_ген.± 1.96m (приближенно ±2m). Это обстоятельство позво-ляет делать обратное заключение – генеральная средняя находится в диапазоне M_выбор.± 1.96m, т. е. предсказывать ширину интервала, в котором заключен генеральный параметр, давать интервальную оценку генеральному параметру.

В соответствии с законом нормального распределения можно ожидать, что генеральный параметр (истинное значение) окажется в интервале

от М − tm до М + tm,

где m – ошибка средней арифметической,

t – квантиль распределения Стьюдента (табл. 6П) при данном числе степеней свободы (df)и уровне значимости (обычно α = 0.05).

Сказанное можно перефразировать так: с вероятностью P можно ожидать, что генеральная средняя находится в доверительном интервале М ± tm, построенном вокруг выборочной средней арифметической M.

Доверительный интервал – интервал значений изучаемого признака, в котором с той или иной вероятностью P находится значение генерального параметра.

Возвращаясь к примеру о весе землероек-бурозубок, мы теперь можем записать доверительные интервалы при разных уровнях вероятности (граничные значения t взяты для случая n = ∞):

для Р = 0.95 М ± tт = 9.3 ± 1.96 ∙ 0.11 = 9.3 ± 0.21 г;

для Р = 0.99 М ± tт = 9.3 ± 2.58 ∙ 0.11 = 9.3 ± 0.28 г.

Здесь искомая генеральная средняя величина веса землероек с вероятностью P = 95% находится в пределах 9.11-9.53 г, а при P = 99% – 9.04-9.6 г.

Если объем выборки, для которой были получены параметры и ошибка репрезентативности m, был невелик (n < 50), то необходимо вводить поправки на объем выборки, расширяя область возможного пребывания генерального параметра. Это понятно, поскольку при дефиците информации любые заключения не могут быть очень точными. Так, для выборки объемом n = 20 экз. ошибка средней составит г, а доверительный интервал: М ± tт = 9.3 ± 2.09∙0.2 = 9.3 ± 0.41 г – от 8.9 до 9.7 г (при уровне значимости α = 0.05 и числе степеней свободы df = n − 1 = 20 − 1 = 19 табличная величина статистики Стьюдента равна t = 2.09).

Аналогичным образом можно построить доверительный интервал для стандартного отклонения (S ± tm_S), коэффициента вариации (CV ± tm_CV), а также других статистических параметров (коэффициентов асимметрии, эксцесса, регрессии, корреляции).

<<< < Предыдущая 1 2 3 4 5 6 78 / 268 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.04.2015214.53 Кб3434-46.doc
#
11.08.201979.56 Кб534. Зап культ 17 в.docx
#
20.09.20198.28 Mб24634.20.504-94.doc
#
24.09.2019251.39 Кб11340323088.doc
#
09.09.201933.13 Кб335.36.38.60.63.64.67.docx
#
31.08.20192.65 Mб72352793_5A07B_ivanter_e_v_korosov_a_v_elementarn...doc
#
18.07.2019900.1 Кб16356139_73E9D_zarayskiy_d_a_upravlenie_chuzhim_p....doc
#
19.09.201930.3 Кб63568485_programma_kulturologiya_2003.docx
#
16.09.201989.6 Кб236 особенности изучения периодической печати.doc
#
17.09.2019470.53 Кб236 Стратагем.doc
#
23.09.2019137.73 Кб036-43.doc