- •Міністерство освіти і науки україни
- •Криворізький технічний університет
- •Кафедра моделювання та програмного забезпечення
- •Методичні вказівки
- •Укладач: о.В. Мовчан Редагували: є.О. Гуляєв, а.А. Козиков
- •Список лабораторних робіт
- •Лабораторна робота № 1.
- •Лабораторна робота № 2.
- •Лабораторна робота № 3.
- •Лабораторна робота № 4.
- •Лабораторна робота № 5.
- •Лабораторна робота № 6.
- •Лабораторна робота № 7.
- •Лабораторна робота № 8.
- •Лабораторна робота № 9.
- •Лабораторна робота № 10.
- •Список використаної літератури
Лабораторна робота № 8.
Тема: Порівняння двох вибірок методом Манна-Уітні.
Завдання: згенерувати дві вибірки й визначити чи належать вони одній генеральної сукупності. Порівняння робити за допомогою критерія Манна-Уітні. Передбачити можливість порівняння двох вибірок згенерованих за різними законами розподілу. На екран повинні виводиться обидві вибірки, обсяг яких ≥ 10, а також таблиця в якій будуть відображатися обидві вибірки в упорядкованому вигляді, а також ранги й приналежність кожного значення вибіркам. У результаті роботи програми повинне бути видане повідомлення про те, що вибірки належить або не належить одній генеральній сукупності.
Теоретичні відомості.
Критерій Манна-Уітні - непараметричний статистичний метод, що дозволяє оцінити вірогідність розходжень між двома вибірками за рівнем представленості досліджуваної ознаки. Критерій Манна-Уітні представляє непараметричну альтернативу t-критерію для незалежних вибірок. Основна відмінність між t-критерієм і критерієм Манна-Уітні полягає в тому, що t-критерій не працює з малими обсягами вибірок. Критерій Манна-Уитни припускає, що розглянуті змінні виміряно, принаймні , у порядковій шкалі (впорядковані). U критерий(Манна-Уітні) обчислюється, як сума індикаторів попарного порівняння елементів першої вибірки з елементами другої вибірки. U критерій - найбільш потужна (чутлива) непараметрична альтернатива t-критерію для незалежних вибірок; фактично, у деяких випадках він має навіть більшу потужність, ніж t-критерій.
Формула для знахождення критерія Манна-Уітні:
U = , де
R[i] – ранг i-ої варіанти(значення);
N – об`єм досліджуваної вибірки.
Тестовий приклад. Перевіримо гіпотезу про приналежності порівнюваних незалежних вибірок до однієї генеральної сукупності за допомогою непараметричного U-критерію Манна-Уітні. Нехай згенеровані дві вибірки за рівномірним законом розподілу:
1 вибірка(R1): [ 11 9 9 10 9 6 7 7 8 8 ] , N1=10;
2 вибірка(R2): [ 13 12 13 12 11 12 11 9 9 8 ] , N2=10;
, де N1 и N2 відповідно об`єм першої і другої вибірок.
У результаті сортування двох вибірок і об'єднання їх в одну одержуємо таблицю, нижній рядок якої - ранг, або позиція значення в новій вибірці :
6 |
7 |
7 |
8 |
8 |
|
9 |
9 |
9 |
|
|
10 |
11 |
|
|
|
|
|
|
|
|
|
|
|
|
8 |
|
|
|
9 |
9 |
|
|
11 |
11 |
12 |
12 |
12 |
13 |
13 |
1 |
2,5 |
2,5 |
5 |
5 |
5 |
9 |
9 |
9 |
9 |
9 |
12 |
14 |
14 |
14 |
17 |
17 |
17 |
19,5 |
19,5 |
Треба звернути увагу, що якщо в результуючій вибірці є однакові значення, їм привласнюється середній ранг. Це правило використовують для перевірки правильності сортування.
Окремо для кожної вибірки розраховуємо суми рангів їхніх варіант(значень) R1 і R2. У нашому випадку:
1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69
5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141
Для перевірки правильності обчислень можна скористатися іншим правилом, у вигляді тотожності: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашому випадку 210;
0,5 * (10 + 10) * (10 + 10 + 1)=210;
210=210;
Розраховуємо значення критерію для першої вибірки:
U1 = 69 - 10*11/2 = 14;
для другої вибірки:
U2 = 141 - 10*11/2 = 86.
Для перевірки однобічного критерію вибираємо мінімальне значення критерію із двох вибірок U1 = 14 і порівнюємо його із критичним значенням для n1 = n2 = 10 і рівня значимості 1%, табличне значення - 19. Тому що обчислене значення критерію менше табличного, нульова гіпотеза відкидається на обраному рівні значимості, і розходження між вибірками визначаються статистично значимими.