Лабораторна робота № 8.

Тема: Порівняння двох вибірок методом Манна-Уітні.

Завдання: згенерувати дві вибірки й визначити чи належать вони одній генеральної сукупності. Порівняння робити за допомогою критерія Манна-Уітні. Передбачити можливість порівняння двох вибірок згенерованих за різними законами розподілу. На екран повинні виводиться обидві вибірки, обсяг яких ≥ 10, а також таблиця в якій будуть відображатися обидві вибірки в упорядкованому вигляді, а також ранги й приналежність кожного значення вибіркам. У результаті роботи програми повинне бути видане повідомлення про те, що вибірки належить або не належить одній генеральній сукупності.

Теоретичні відомості.

Критерій Манна-Уітні - непараметричний статистичний метод, що дозволяє оцінити вірогідність розходжень між двома вибірками за рівнем представленості досліджуваної ознаки. Критерій Манна-Уітні представляє непараметричну альтернативу t-критерію для незалежних вибірок. Основна відмінність між t-критерієм і критерієм Манна-Уітні полягає в тому, що t-критерій не працює з малими обсягами вибірок. Критерій Манна-Уитни припускає, що розглянуті змінні виміряно, принаймні , у порядковій шкалі (впорядковані). U критерий(Манна-Уітні) обчислюється, як сума індикаторів попарного порівняння елементів першої вибірки з елементами другої вибірки. U критерій - найбільш потужна (чутлива) непараметрична альтернатива t-критерію для незалежних вибірок; фактично, у деяких випадках він має навіть більшу потужність, ніж t-критерій.

Формула для знахождення критерія Манна-Уітні:

U = , де

R[i] – ранг i-ої варіанти(значення);

N – об`єм досліджуваної вибірки.

Тестовий приклад. Перевіримо гіпотезу про приналежності порівнюваних незалежних вибірок до однієї генеральної сукупності за допомогою непараметричного U-критерію Манна-Уітні. Нехай згенеровані дві вибірки за рівномірним законом розподілу:

1 вибірка(R1): [ 11 9 9 10 9 6 7 7 8 8 ] , N1=10;

2 вибірка(R2): [ 13 12 13 12 11 12 11 9 9 8 ] , N2=10;

, де N1 и N2 відповідно об`єм першої і другої вибірок.

У результаті сортування двох вибірок і об'єднання їх в одну одержуємо таблицю, нижній рядок якої - ранг, або позиція значення в новій вибірці :

6	7	7	8	8		9	9	9			10	11
					8				9	9			11	11	12	12	12	13	13
1	2,5	2,5	5	5	5	9	9	9	9	9	12	14	14	14	17	17	17	19,5	19,5

Треба звернути увагу, що якщо в результуючій вибірці є однакові значення, їм привласнюється середній ранг. Це правило використовують для перевірки правильності сортування.

Окремо для кожної вибірки розраховуємо суми рангів їхніх варіант(значень) R1 і R2. У нашому випадку:

1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Для перевірки правильності обчислень можна скористатися іншим правилом, у вигляді тотожності: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашому випадку 210;

0,5 * (10 + 10) * (10 + 10 + 1)=210;

210=210;

Розраховуємо значення критерію для першої вибірки:

U1 = 69 - 10*11/2 = 14;

для другої вибірки:

U2 = 141 - 10*11/2 = 86.

Для перевірки однобічного критерію вибираємо мінімальне значення критерію із двох вибірок U1 = 14 і порівнюємо його із критичним значенням для n1 = n2 = 10 і рівня значимості 1%, табличне значення - 19. Тому що обчислене значення критерію менше табличного, нульова гіпотеза відкидається на обраному рівні значимості, і розходження між вибірками визначаються статистично значимими.

<<< < Предыдущая 1 2 3 4 5 67 / 107 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
02.09.2019552.45 Кб3метода соціологія.doc
#
05.02.20163.76 Mб41методаКИСИ.pdf
#
06.02.20163.75 Mб18МетодГП-2010.pdf
#
05.11.2018445.44 Кб2МЕТОДИ КОМПРЕСІЇ ТЕКСТУ.doc
#
30.03.2016107.57 Кб98Методи утилізації відходів.doc
#
10.11.2018578.05 Кб10Методические указания. Системный анализ.doc
#
05.02.2016407.55 Кб69Методичка - Метрология и станд-2011.doc
#
05.02.20161.35 Mб36Методичка 123 пастернак.doc
#
05.02.20161.21 Mб38Методичка 5-й.doc
#
06.02.2016408.5 Кб29Методичка Історія Української культури.pdf
#
06.02.2016904.22 Кб29Методичка Будгенплан арх окон.pdf