Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
stat_umk.doc
Скачиваний:
173
Добавлен:
13.03.2015
Размер:
10.64 Mб
Скачать

Глава 2. Выборки.

Тема 4. Статистические гипотезы. Принятие статистических решений.Статистический критерий.Уровень значимости.Интервальные оценки. Учет статистических гипотез при компьютерных технологиях анализа распределения статданных.

При обработке статистических данных очень часто возникает вполне закономер­ный вопрос, являются ли наблюдаемые данные и результаты статистических ис­следований, полученные на их основе, просто случайным совпадением или они действительно реальны и надежны. Проверка различных предположений (гипотез) позволяет на основе уже имеющейся информации сделать выбор между двумя предположениями - на­пример, является ли наблюдаемое повышение объема выпускаемой продукции в про­шлом месяце простым совпадением (один вариант) или же имеется убедительное дока­зательство того, что рост объема выпуска продукции действительно имеет место (другой вариант). Кроме того, вполне можно рассматривать проверку гипотез как один из ком­понентов принятия решений, поскольку при такой процедуре можно получить важную информацию об эффективности предпринятых или предполагаемых действий.

Статистическая гипотеза

Статистической гипотезой называется любое предположение относительно функции распределения или параметров функции распределения случайной величины. Гипоте­зы о значениях параметров распределения или о сравнительной величине параметров двух распределений называются параметрическими. Гипотезы о виде распределения именуются непараметрическими. Гипотезу, выдвинутую для проверки ее соответствия выборочным данным, называют основной или нулевой гипотезой и обозначают Н0. Вместе с гипотезой Н0 выдвигается противоречащая ей гипотеза, которая именуется альтернативной или конкурирующей и обозначается Н1.

Так, примером нулевой гипотезы может быть утверждение, что реклама не имела никакого эффекта, а альтернативной гипотезы - утверждение, что реклама имела оп­ределенный эффект.

Проверить статистическую гипотезу - это значит проверить, согласуются ли, имеющиеся в выборке данные с этой гипотезой. Проверка гипотезы осуществляется с помощью статистического критерия.

Статистический критерий - это случайная величина, закон распределения которой (вместе со значениями параметров) известен, если принятая гипотеза справедлива. Этот критерий называют еще критерием согласия (согласие принятой гипотезы с ре­зультатами, полученными из выборки).

Если К- статистический критерий проверки некоторой гипотезы Н0 и гипотеза Н0 справедлива, то закон распределения случайной величины К характеризуется некото­рой известной плотностью распределения рК(х).

Выбирается некоторая малая вероятность , которая равна 0,05; 0,01 или еще меньше. Критическое значение критерияККР определяется как решение одного из трех уравнений, в зависимости от вида нулевой и альтернативной гипотез:

Р(К>ККР) = а (1)

Р(К<ККР) = а (2)

Р((К<ККР1)(К>ККР2) = а (3)

Возможны и другие уравнения, но они встречаются значительно реже. Решение уравнений (1-3) заключается в том, что по вероятности , зная функциюрK(х), заданную, как правило, таблицей, нужно определить ККР. Например, для уравнения (1) область К>ККР именуется критической . Если значение Кв (Кв - значение критерия К, рассчитанное по выборочным данным) попадает в критическую область, то гипотеза H0 отвергается. Для уравнения (1) область К<ККР называется областью принятия гипотезы. Пусть выбрано некоторое малое значение вероятности а, по нему определено зна­чение ККР и по выборочным данным определено значение Кв, которое попало в кри­тическую область. В таком случае гипотеза Н0 отвергается, но она может оказаться справедливой, просто случайно произошло событие, которое имеет очень маленькую вероятность . В этом смысле- вероятность отвержения правильной гипотезы Н0. Отвержение правильной гипотезы называется ошибкой первого рода. Вероятность называется уровнем значимости. Таким образом, уровень значимости - это вероят­ность совершить ошибку первого рода.

Чем меньше уровень значимости, тем меньше вероятность отвергнуть проверяе­мую гипотезу H0 , когда она верна, т.е. совершить ошибку первого рода. Но с умень­шением уровня значимости расширяется область принятия гипотезы H0 и увеличива­ется вероятность принятия проверяемой гипотезы, когда она неверна, т.е. когда пред­почтение должно быть отдано альтернативной гипотезе.

Пусть при справедливости гипотезы H0 статистический критерий К имеет плот­ность распределения р0(х), а при справедливости альтернативной гипотезы Н1 - плот­ность распределения р1(х). Если значение Кв, определенное по выборочным данным, ока­зывается меньше ККР, то гипотеза Н0 принимается. Если на самом деле справедлива альтернативная гипотеза Н1, тогда вероятность попадания критерия в область принятия гипотезы Н0 - это некоторое число . Вероятность- это вероятность того, что будет принята неверная гипотеза Н0. Принятие неверной гипотезы называется ошибкой второго рода. В данном случае- это вероятность ошибки второго рода. Число 1 -, равное вероятности того, что не совершается ошибка второго рода, называется мощностью критерия. Выбор статистического критерия и вида критической области осуществляется та­ким образом, чтобы мощность критерия была максимальной. Наиболее распростра­ненными являются критерии, в основе которых лежат известные распределения - Фишера, Стьюдента или хи-квадрат распределение.

Интервальные оценки

Когда речь идет об оценке параметров, которые в некоторых случаях неизвестны, можно воспользоваться интервальной оценкой неизвестного параметра. Интервальной называют оценку, которая определяется двумя числами - концами интервала, покры­вающего оцениваемый параметр. Обозначив этот параметр через , по выборке следу­ет найти числа1, и 2, так чтобы выполнялось условие:

Р(1 < <2) = Р (1 , 2) =

Числа 1, и 2 называются доверительными границами, а интервал (1, 2) - дове­рительным интервалом для параметра . Числоименуется доверительной вероятно­стью или надежностью сделанной оценки. Обычно надежность задается на уровне 0,95, 0,99 или 0,999. Тогда вероятность того, что нужный параметр попал в интервал (1 , 2), достаточно высока. Число (1 +2)/2 - середина доверительного интервала - будет давать значение параметра с точностью (1 , 2)/2, которая представляет собой половину длины доверительного интервала. Границы 1 и 2 определяются на основе выборочных данных и являются функциями от случайных величин , а следовательно - сами есть случайные величины. Отсюда следует, что доверительный интервал тоже случаен. Он может покрывать параметр , а может и не покрывать.

Различают гипотезы о частоте распределения, гипотезы о средних величинах и ги­потезы о пропорциях. Гипотезы о средних величинах - это гипотезы относительно оценки средней величины генеральной совокупности на основе выборочных данных. Соответствующая статистическая проверка осуществляется с помощью критериев, например с помощью t-критерия Стьюдента, который будет рассмотрен в последующих лекциях.

В современных статистических пакетах предусмотрены процедуры учета уровней значимости при принятии статистических различных гипотез.

Литература:

1осн. [223-256], 5осн. [181-194],6 осн. [16,39-44], 2доп. [36-41], 3 доп. [226-242], 4доп. [95-102].

Контрольные вопросы

1. Что означает термин статистическая гипотеза?

2. Каков смысл нулевой гипотезы?

3. Как определяется критическое значение критерия, в зависимости от вида нулевой и альтернативной гипотез?

4. Какая вероятность в статистике называется уровнем значимости?

5. Каков смысл ошибок первого и второго рода при принятии гипотез?

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]