Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Раздел 11.doc
Скачиваний:
7
Добавлен:
29.08.2019
Размер:
823.3 Кб
Скачать

Отбрасывание «выскакивающих» вариант

На практике часто встречаются с наличием в исследуемой совокупности некоторого количества вариант, значения которых довольно резко отличаются от основной массы наблюдений. Такие значения подозрительны, они могут появиться в выборке из-за грубых ошибок в наблюдении (ошибок отсчета, неправильного использования средств измерения, «нечисто» проведенных анализов и т. д.). Чтобы исключить в данном вопросе фактор субъективности (отнести ли «выскакивающее» наблюдение к артефактам, или объяснить его появление естественной вариабельностью случайной величины), применяют математически обоснованный «критерий грубых ошибок». Этот критерий является точным для нормально распределенной случайной величины, но он, тем не менее, хорошо срабатывает для широкого класса симметричных распределений.

Согласно критерию, рассчитывают значения:

(1)

Величины представляют собой то наибольшее и наименьшее значения вариант в выборке, принадлежность которых к рассматриваемой генеральной совокупности вызывает подозрение, , S – выборочные характеристики распределения (средневыборочная и исправленное среднеквадратичное).

Критические значения приведены в таблице 6 приложения. Если окажется, что , то «сомнительную» варианту можно отнести к артефактам с уровнем значимости и исключить из дальнейшей обработки. В противном случае – нет достаточных оснований для исключения, отбрасывания.

В отношении выбора уровня значимости рекомендуется следующий подход: если - варианта отбрасывается, а если , она, безусловно, оставляется. Если же окажется между и , то при решении вопроса об отбрасывании варианты должна быть проявлена определенная осторожность.

Пример 2. Задана выборочная совокупность: x1=21, x2=17, x3=6, x4=27, x5=18.

Оценить, не отличаются ли слишком сильно крайние варианты.

1) Распределим те же варианты в порядке возрастания: x(1)=6, x(2)=17, x(3)=18, x(4)=21, x(5)=24. При этом ; .

2) Рассчитаем выборочные характеристики вариационного ряда:

.

Откуда .

3) .

Так как оба значения и меньше табличного критического значения , нет оснований отбрасывать «крайние» варианты и из выборки (с уровнем значимости или надежностью 95%).

Вернемся к задачам статистического анализа, упомянутым в начале лекции. Что касается первой задачи, расчета параметров вариационного ряда, построения доверительных интервалов для параметров распределения, она освещена в разделе 11.1. Остановимся на следующей задаче – определения значимости различия между двумя выборочными совокупностями.

Сравнение средних арифметических и дисперсий двух вариационных рядов

Для сравнения двух вариационных рядов (имеется ли достоверное различие по средневыборочным) с использованием критерия Стьюдента, прежде всего необходимо убедиться, что тип распределения вариант близок к нормальному. Далее для каждого вариационного ряда надо знать, помимо объемов сравниваемых выборок, их средневыборочные ( ) и среднеквадратические отклонения ( ).

Пример 3. (для малых выборок, )

Сравнение средних диаметров соцветий у двух сортов «нивяника».

Предполагается, что имеется две выборки, характеризующие диаметр соцветий у двух сортов «нивяника» (сорта А и Б). По выборкам составлены вариационные ряды и рассчитаны их основные характеристики:

(см)

Сорт А

5.0

2.5

10

Сорт Б

7.0

2.4

14

а) Сравнение дисперсий (критерий Фишера)

Рассчитаем отношение дисперсий вариационных рядов:

Замечание: Надо брать отношение большей дисперсии к меньшей, то есть .

Сравним с соответствующим квантилем из таблицы 4 Приложения (примем ). Так как в данном случае расчетное значение меньше табличного, ( - степени свободы для соответствующих вариационных рядов), принимается нулевая гипотеза Н0: у сортов А и Б нет достоверного различия по варьированию диаметра соцветия.

б) Сравнение средневыборочных ( -критерий Стьюдента).

Рассчитаем «меру близости» средних:

Сравним с соответствующим табличным значением (см. таблицу 3 Приложения):

.

Замечание: Принимается число степеней свободы .

Нулевая гипотеза Н0 отвергается. То есть, с надежностью 95% можно утверждать , что по диаметру соцветия у двух сортов «нивяника» имеется достоверное различие.

Пример 4. Сравнение двух сортов пшеницы по длине колоса.

Имеется две выборки, характеризующие два разных сорта пшеницы (А и В) по длине колоса (в см):

Сорт А: 9.0, 8.4, 10.5, 9.0, 9.7, 10.4, 9.0, 9.3, 8.5, 7.9 (n=10);

Сорт В: 8.5, 7.5, 8.0, 8.2, 7.4, 8.2, 7.9, 8.0, 7.7 (n=9);

  1. Составим соответствующие вариационные ряды:

Xi(A)

7.9

8.4

8.5

9.0

9.3

9.7

10.4

10.5

ni

1

1

1

3

1

1

1

1

( )

Xi(B)

7.4

7.5

7.7

7.9

8.0

8.2

8.5

ni

1

1

1

1

2

2

1

( )

  1. Рассчитаем статистические характеристики вариационных рядов и сведем их в таблицу:

S2

Сорт А

9.2

0.87

10

0.29

Сорт В

7.9

0.13

9

0.12

а) Сравнение дисперсий (по критерию Фишера):

Табличное значение:

Так как в данном случае : у сортов А и В имеется существенное различие по варьированию длины колоса.

б) Сравнение средневыборочных (критерий Стьюдента):

Так как в данном случае :

Число степеней свободы (считается с поправочным коэффициентом):

.

По таблице Стьюдента (таблица 3 Приложения):

.

Так как , с надежностью (95%) можно утверждать, что у сорта А длина колоса достоверно больше, чем у сорта В.

Пример 5. (большие выборки, ).

Сравнение фенодат распускания почек у одного вида кустарника в те же годы: в Москве (вариант 1) и Петербурге (вариант 2).

По двум выборкам, характеризующим дату распускания почек (в днях, отсчитывая от 1.03) у двух рассматриваемых вариантов, составлены вариационные ряды и рассчитаны их статистические характеристики:

1 вариант

57.9

19.1

57

2.53

2 вариант

65.8

22.0

57

2.91

Сравниваются средневыборочные (критерий Стьюдента):

Соответствующее табличное значение:

, где число степеней свободы .

Так как :

Различие средневыборочных достоверно, то есть с надежностью (95%) можно утверждать, что у обследованного вида кустарника в Москве почки распускаются примерно на неделю раньше, чем в Петербурге.