Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Муромцева_51 (1)

.docx
Скачиваний:
0
Добавлен:
30.11.2022
Размер:
2.44 Mб
Скачать

Федеральное государственное бюджетное образовательное учреждение высшего образования «Национальный исследовательский университет «МЭИ»

КАФЕДРА УПРАВЛЕНИЯ И ИНТЕЛЛЕКТУАЛЬНЫХ ТЕХНОЛОГИЙ

Лабораторная работа №5

По дисциплине «Статистические методы в инженерных исследованиях»

Изучение непараметрических одновыборочных критериев в первичном анализе экспериментальных данных

Вариант 7

Выполнила: студентка II курса

Группы А-03-19

Муромцева Э.А.

Проверил:

Виноградова Н.А.

Москва 2020

Работа 5а

  1. Подготовила таблицу экспериментальных данных с нормальным законом распределения используя пакет «STATISTICA» и Statistic Visual Basic (SVB) макрос «NP.svb»

Для генерации данных задала:

  • · Закон распределения – нормальный,

  • · количество выборок – 10,

  • · параметры распределения у=-0,55, σу=2,2 ,

  • · Δ – смещение в параметре сдвига задать Δ= 2,2,

  • · объем выборок (количество строк) – 100,

  • · способ расположения выборок в таблице: «Каждая выборка в своем столбце».

Сохранила таблицу под именем «N1_7_100».

  1. Построила график функции плотности вероятности для переменной Var0, используя калькулятор законов распределения.

  1. Рассчитала значения оценок основных числовых характеристик: математического ожидания, дисперсии, коэффициентов асимметрии и эксцесса, а также гистограммы для переменных Var0 и Var1 с подгонкой функцией теоретического распределения

Проверить генерацию среднееVar0 = -1,4 !!!!!!! а среднееVar1 = -0,49

  1. На трех сформированных таблицах данных выполнила проверку однородности по параметру положения, используя параметрический t-критерий и непараметрические критерии знаков и Уилкоксона для двух зависимых выборок. Повторила анализ для этих же таблиц, сделав объем выборки = 20, удалив при этом строки с 21 по 100.

Результаты оформила в таблицу:

Y: N(m; σ) γа=0 γэ=0

Количество случаев, когда Н0 отвергается

Объем выборки

Δ

t-критерий

Критерий знаков

Критерий Уилкоксона

N=100

σ

10

10

10

0,5σ

10

9

10

0,01 σ

0

0

0

N=20

σ

10

10

10

0,5 σ

5

4

6

0,01 σ

0

0

0

В случае нормального закона распределения эффективность критериев больше зависит, от объема выборки, нежели от величины смещения.

Посмотрите в таблицу: при Δ=0,5σ и разных объемах выборки!!!

При уменьшении величины смещения и объема выборки параметрический и непараметрические критерии становятся не эффективными.

Таким образом, при проверке гипотез для нормального закона распределения можно сделать вывод о том, что и параметрические и непараметрические критерии эффективны в равной степени.

  1. Подготовила таблицу, в которой по образцу п.п.1-5 смоделировала случайные величины с Бета-распределением и заданными параметрамиКАКИМИ????? mY=1=8 σY= 2=1

Для генерации данных задать:

  • Закон распределения – бета

  • количество выборок – 10,

  • параметры распределения – mY=8, σY= 1

  • Δ – смещение в параметре сдвига задать Δ= σY= 1

  • объем выборок (количество строк) – 100,

  • способ расположения выборок в таблице: «Каждая выборка в своем столбце».

Таблицы данных сохранила под именами B1_7_100, B2_7_100, B3_7_100.

  1. Используя калькулятор распределений, получила представление о теоретическом виде кривой функции плотности вероятности Бета-распределения с заданными параметрами. Θ1=8 Θ2=1 !!!!!!

  1. По таблице B1_7_100 рассчитала оценки основных числовых характеристик: математического ожидания, дисперсии, коэффициентов асимметрии и эксцесса для Var0 и Var1; построила оценку функции плотности распределения в виде гистограммы для Var0 с подгонкой функцией теоретического распределения.

так как вероятность p <0.01 По какому критерию??, то гипотеза H0 отвергается, следовательно распределение Var0 из таблицы B1_6_100 нельзя считать нормальным.

  1. Удалила из исходных таблиц строки с 21 по 100 и сохранила их под именами соответственно В1_7_20, В2_7_20, В3_7_20. Повторила анализ, аналогичный п.п.6-7, а результаты сохранила в «Workbooks В_71_20

Y: N(m; σ) γа=8 γэ=1

Количество случаев, когда Н0 отвергается

Объем выборки

Δ

t-критерий

Критерий знаков

Критерий Уилкоксона

N=100

σ

10

10

10

0,5σ

7

8

7

0,01 σ

0

0

0

N=20

σ

4

6

5

0,5 σ

3

6

4

0,01 σ

0

0

0

  1. Сделала выводы о работоспособности использованных методов в модельных экспериментах для переменных с распределениями: нормальным и из семейства Бета-распределений по результатам каждой серии

Чем больше величина смещения, тем эффективнее работают критерии. И, наоборот, чем меньше величина смещения, тем менее эффективно работают критерии.

При величине смещения 0,5σ эффективнее всего работают непараметрические критерии.

Можно отметить, что отличия по отвержению Н0 небольшое для всех критериев, а при минимальной величине смещения работоспособность всех критериев теряется. Таким образом, для бета-распределения нельзя выделить какой-то из критериев, они все работают со схожей эффективностью.

Почему работает t-критерий?? При каких условиях он работоспособен????

При росте объема выборок t-критерий приближается к стандартному нормальному распределению. Т.о. несмотря на нарушения условий нормальности критерий Стьюдента можно использовать для проверки гипотезы о параметрах положения при больших объемах выборок в одновыборочных задачах. Этим и объясняется устойчивость работы t-критерий при распределении отличном от нормального

Работа

        1. Подготовила таблицы, в которых по образцу п.п.1−5 смоделировала случайные величины с распределением Коши и заданными параметрами Для определения величины смещения нашла квантиль yp, отвечающий уровню вероятности р=0,975, т.е. y0,975.

Для генерации данных задать:

  • Закон распределения – Коши;

  • Количество выборок – 10;

  • Параметры распределения – 1 =0 , 2 = 3;

  • Квантиль yp, отвечающий уровню вероятности р = 0,975, т.е.

y0,975 = 38,119

  • Δ – смещение в параметре сдвига задать Δ=yp (для таблицы «C1_7_100»), Δ=0,5yp (для таблицы «C2_7_100»), Δ=0,2yp (для таблицы «C3_7_100»);

  • Объем выборок (количество строк) – 100;

  • Способ расположения выборок в таблице: «Каждая выборка в своем столбце».

        1. Построила гистограмму для Var0 из таблицы C1_11_100, и с помощью калькулятора распределений получила представления о виде теоретической функции плотности распределения Коши с заданными параметрами.

так как вероятность p <0.01, то гипотеза H0 отвергается, следовательно распределение Var0 из таблицы B1_6_100 нельзя считать нормальным.

  1. Повторила анализ аналогичный п.п. 6–7 из задания Части 1, результаты которого сохранила соответственно в «Workbooks С_11_100» и «Workbooks С_11_20», а затем перенесла в отчет

Y: N(m; σ) γа=0 γэ=0

Количество случаев, когда Н0 отвергается

Объем выборки

Δ

t-критерий

Критерий знаков

Критерий Уилкоксона

N=100

σ

7

10

10

0,5σ

8

10

10

0,01 σ

0

10

10

N=20

σ

9

10

10

0,5 σ

8

9

10

0,01 σ

0

3

0

Сделала выводы о работоспособности использованных методов по результатам каждой серии модельных экспериментов для переменных с распределением Коши.

Критерий знаков и критерий Уилкоксона одинаково эффективны при любом объеме выборки и при любом смещении.

В случае распределения Коши t-критерий работает неустойчиво, на большой выборке оказался результат хуже. Это объясняется тем, что критерий работает со средними значениями, которые оценивают параметр положения с сильными колебаниями из-за «тяжелых» хвостов. Таким образом, при проверке гипотез распределения Коши лучше применять непараметрические критерии.

Вывод:

Эффективность всех критериев больше зависит от объема выборки, чем от величины смещения. Для нормального распределения в равной степени эффективны критерий знаков, критерий Уилкоксона и t-критерий.

Для бета-распределения и распределения Коши наиболее эффективны критерий знаков и критерий Уилкоксона.

t-критерий допустимо использовать при большом объеме выборки, так как приближается к стандартному нормальному распределению

Критерии согласия Колмогорова-Смирнова и Лиллиефорса для случая сложной нулевой гипотезы

Критерий Колмогорова-Смирнова

Для сложной нулевой гипотезы используются оценки параметров распределений и статистика , распределения которых теперь зависят от вида исходного распределения , то есть критерии параметрические.

Критерий Лиллиефорса

является модификацией Колмогорова–Смирнова. используется для проверки нулевой гипотезы о том, что выборка имеет нормальное распределение для случая, когда параметры нормального распределения априори неизвестна.

Проверка гипотезы проводится следующим образом:

  • Решение, является ли статистически значимым наблюдается отклонение функции распределения выборки от теоретического. В случае положительного ответа, нулевая гипотеза отвергается.

  • Подсчитано выборочное среднее и дисперсия.

  • А также при использовании критерия Колмогорова, является максимальное отклонение между образцом и теоретических интегральных функций распределения.