Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика.doc
Скачиваний:
42
Добавлен:
15.04.2015
Размер:
618.5 Кб
Скачать

3. Ошибки выборки

Различают следующие ошибки выборки:

  1. ошибки регистрации, которые бывают преднамеренными и непреднамеренными;

  2. ошибки репрезентативности, которые делятся на случайные и систематические. Систематическая ошибка связана с плохой системой отбора или с ее нарушением. Случайные ошибки зависят от трех основных факторов:

  • от объема выборки;

  • степени вариации изучаемого признака в генеральной совокупности, которая характеризуется генеральной дисперсией,

  • применяемого способа отбора и единиц отбора.

Простая случайная повторная выборка: согласно теории Ляпунова, при достаточно большом , конечноми ограниченнойвероятность того, что расхождениене превзойдет величины, равна функции интеграла Лапласа, т.е., где,,

где- стандартная ошибка,

- предельная ошибка.

В математике доказано, что , где, т.е.. Таким образом, с заданной вероятностьюможно утверждать, что.

Для альтернативной выборочной стандартная ошибка находится по формуле .

Задача, обратная определению ошибки выборки, - это определение объема выборки. Объем выборки можно выявить из формулы определения стандартной ошибки .

Если известны крайние значения , то для симметричной выборки, асимметричной - размах делится на 5. Для доли берется максимальное значение., гдеизменяется от 0 до 1. При этом.

4. Влияние вида выборки на величину ошибки выборки

Для бесповторной выборки производится коррекция стандартной ошибки . Для альтернативной случайной величины. Аналогичная коррекция производится при механическом отборе, т.к. если генеральная совокупность не ранжируется , то это будет разновидность простой случайной бесповторной выборки. Для типической выборки генеральная совокупность разбивается наk групп. , коррекция,- средняя из внутригрупповых дисперсий.

, где - внутригрупповая дисперсия.

Аналогично для альтернативной случайной величены:

;.

Для серийной выборки , где- межсерийная дисперсия:

, ,.

Особое место занимает малая выборка. Теория малой выборки разработана английским статистиком Стъюдентом. Он построил специальное распределение, соотносящее t и доверительную вероятность F(t). При таблица распределения Стъюдента дает те же результаты, что и таблицы интеграла вероятности Лапласа. Приразличия незначительны, и принеобходимо пользоваться распределением Стъюдента.

, где - коэффициент, который зависит от объема выборки.

Распределение зависит от числа степеней свободы дисперсии. По сравнению с нормальным распределением пристандартная ошибка увеличивается, следовательно, увеличивается и предельная ошибка, и доверительный интервал при той же доверительной вероятности.

5. Проверка статистических гипотез

Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Гипотеза о распределениях параметров генеральной совокупности называется параметрической. Гипотеза о законах распределения называется непараметрической. Гипотеза о том, что две совокупности, сравнимые по одному или нескольким параметрам, ничем не отличаются, называется нулевой.

Правила, устанавливающие условия отклонения или принятия нулевой гипотезы, называются статистическим критерием.

Этапы проверки статистических гипотез:

  • формулировка гипотезы;

  • выборы статистического критерия;

  • определение области допустимых значений и критических точек, которые разделяют область допустимых значений и определение критической области по соответствующим таблицам;

  • вычисление фактического значения статистического критерия;

  • проверка гипотезы на основе сравнения фактического и критического значения.

Возможны два ошибочных решения:

  1. неправильное отклонение нулевой гипотезы (ошибка первого рода), ее вероятность или риск называется уровнем значимости критерия;

  2. неправильное принятие нулевой гипотезы или ошибки второго рода, ее вероятность или риск ,называется мощностью критерия.

Проверка соответствия теоретического и эмпирического распределения производится с помощью критериев согласия, наиболее распространенные из которых это - критерий Пирсона и Колмогорова. По ряду распределения строится гистограмма, вычисляются различные величины и на их основе подбирается тот или иной закон.

Критерий Пирсона проверяет гипотезу о том, что случайная выборка извлечена из генеральной совокупности с функцией распределения, вид которой известен, а параметры неизвестны.

Этапы проверки гипотезы по критерию Пирсона

  1. Совокупность преобразуется в интервальный ряд, который имеет k интервалов.

  2. На основе сгруппированных данных вычисляются оценки неизвестных параметров теоретического распределения.

  3. Определяют вероятность попадания случайной величинывk-й интервал.

  4. Вычисляется значение критерия Пирсона - чем меньше критерий, тем ближе фактическое распределение к теоретическому.

Критерий Пирсона сравнивается с табличным значением, найденным для уровня значимости и числа степеней свободы, где- число параметров закона распределения. Если полученное значение критерия больше критического, то нулевая гипотеза отвергается.

Критерий Колмогорова проверяет гипотезу о том, что случайная выборка, извлеченная из генеральной совокупности с непрерывной функцией распределения, которая полностью определена, т.е. не зависит от неизвестных параметров.

, т.е. максимальный модуль отклонения эмпирической функции распределения от теоретической. Если данный критерий больше критического значения, то нулевая гипотеза отвергается.

Проверка гипотезы о средних

1. , в качестве критерия используется критерий Стюарта,. Если значение- критерия больше критического, то нулевая гипотеза отвергается.

2.

Проверка гипотезы о дисперсиях

Проверка проводится с помощью критерия Фишера . Критическое значение данного критерия зависит от уровня значимостии числа степеней свободы числителя и знаменателя. Если значение критерия Фишера больше критического, то нулевая гипотеза отвергается.