Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методические указания. Системный анализ.doc
Скачиваний:
10
Добавлен:
10.11.2018
Размер:
578.05 Кб
Скачать

Лабораторна робота № 8.

Тема: Порівняння двох вибірок методом Манна-Уітні.

Завдання: згенерувати дві вибірки й визначити чи належать вони одній генеральної сукупності. Порівняння робити за допомогою критерія Манна-Уітні. Передбачити можливість порівняння двох вибірок згенерованих за різними законами розподілу. На екран повинні виводиться обидві вибірки, обсяг яких ≥ 10, а також таблиця в якій будуть відображатися обидві вибірки в упорядкованому вигляді, а також ранги й приналежність кожного значення вибіркам. У результаті роботи програми повинне бути видане повідомлення про те, що вибірки належить або не належить одній генеральній сукупності.

Теоретичні відомості.

Критерій Манна-Уітні - непараметричний статистичний метод, що дозволяє оцінити вірогідність розходжень між двома вибірками за рівнем представленості досліджуваної ознаки. Критерій Манна-Уітні представляє непараметричну альтернативу t-критерію для незалежних вибірок. Основна відмінність між t-критерієм і критерієм Манна-Уітні полягає в тому, що t-критерій не працює з малими обсягами вибірок. Критерій Манна-Уитни припускає, що розглянуті змінні виміряно, принаймні , у порядковій шкалі (впорядковані). U критерий(Манна-Уітні) обчислюється, як сума індикаторів попарного порівняння елементів першої вибірки з елементами другої вибірки. U критерій - найбільш потужна (чутлива) непараметрична альтернатива t-критерію для незалежних вибірок; фактично, у деяких випадках він має навіть більшу потужність, ніж t-критерій.

Формула для знахождення критерія Манна-Уітні:

U = , де

R[i] – ранг i-ої варіанти(значення);

N – об`єм досліджуваної вибірки.

Тестовий приклад. Перевіримо гіпотезу про приналежності порівнюваних незалежних вибірок до однієї генеральної сукупності за допомогою непараметричного U-критерію Манна-Уітні. Нехай згенеровані дві вибірки за рівномірним законом розподілу:

1 вибірка(R1): [ 11 9 9 10 9 6 7 7 8 8 ] , N1=10;

2 вибірка(R2): [ 13 12 13 12 11 12 11 9 9 8 ] , N2=10;

, де N1 и N2 відповідно об`єм першої і другої вибірок.

У результаті сортування двох вибірок і об'єднання їх в одну одержуємо таблицю, нижній рядок якої - ранг, або позиція значення в новій вибірці :

6

7

7

8

8

 

9

9

9

 

 

10

11

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

9

9

 

 

11

11

12

12

12

13

13

1

2,5

2,5

5

5

5

9

9

9

9

9

12

14

14

14

17

17

17

19,5

19,5

Треба звернути увагу, що якщо в результуючій вибірці є однакові значення, їм привласнюється середній ранг. Це правило використовують для перевірки правильності сортування.

Окремо для кожної вибірки розраховуємо суми рангів їхніх варіант(значень) R1 і R2. У нашому випадку:

1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Для перевірки правильності обчислень можна скористатися іншим правилом, у вигляді тотожності: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашому випадку 210;

0,5 * (10 + 10) * (10 + 10 + 1)=210;

210=210;

Розраховуємо значення критерію для першої вибірки:

U1 = 69 - 10*11/2 = 14;

для другої вибірки:

U2 = 141 - 10*11/2 = 86.

Для перевірки однобічного критерію вибираємо мінімальне значення критерію із двох вибірок U1 = 14 і порівнюємо його із критичним значенням для n1 = n2 = 10 і рівня значимості 1%, табличне значення - 19. Тому що обчислене значення критерію менше табличного, нульова гіпотеза відкидається на обраному рівні значимості, і розходження між вибірками визначаються статистично значимими.