Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
статистика 2 модуль.docx
Скачиваний:
3
Добавлен:
28.08.2019
Размер:
348.14 Кб
Скачать

Тема 7. Статистична перевірка гіпотез

Статистична гіпотеза. Основні поняття і принципи перевірки.

Перевірка гіпотез про рівність дисперсій.

Перевірка гіпотез про рівність середніх.

Перевірка гіпотез про частку сукупності.

7.1. Статистична гіпотеза. Основні поняття і принципи перевірки. Статистична гіпотеза- це певне припущення щодо властивостей генеральної сукупності, яке перевіряють за даними вибіркового спостереження. Найчастіше це гіпотеза про характеристики ознаки якості та про параметри відомого розподілу. Гіпотеза, яку належить перевірити, формулюється як відсутність розбіжностей між параметром генеральної сукупності С і заданою величиною а. Ця висунута гіпотеза має назву нульової і записується:

Н0:С = a, (7.1.1)

Кожній нульовій гіпотезі Но висувається конкуруюча (альтернативна) гіпотеза Н0а), яка вступає у протиріччя з Н0. Залежно від виду і вагомості відхилень вона може бути сформульована як:

Н1:С>а,

Н1: С < а,

Н1 : С ≠ a, (7.1.2)

В результаті перевірки гіпотези можуть бути припущені помилки 2 видів.

Помилка 1 виду полягає в тому, що буде відкинута правильна гіпотеза Н0. Ймовірність помилки 1 роду називають рівнем значущості (істинності) і позначають α.

Помилка 2 виду полягає в тому, що буде прийнята невірна гіпотеза, і її ймовірність позначається як р. Тобто прийнята Н0, коли насправді вірною є альтернативна Н1.

Правило, за яким статистична гіпотеза Н0 відхиляється або не відхиляється, називають статистичним критерієм. В якості його виступає певна випадкова величина К, яка застосовується для перевірки гіпотези, і закон розподілу якої є відомим. Емпіричним (спостережуваним) значенням Кспостзначення критерію, яке обчислено по вибірці.

Областю прийняття гіпотези (допустимих значень) називають сукупність значень критерію, при яких нульову гіпотезу Но приймають.

Критичною областю називають сукупність значень критерію, при яких нульову гіпотезу відкидають.

Загальний принцип перевірки статистичних гіпотез: якщо спостережуване значення критерію належить критичній області, то нульову гіпотезу Н0 відкидають і приймають альтернативну гіпотезу Н1.

Рис. 7.1. Критерії перевірки гіпотез.

Якщо значення критерію, яке отримане на основі вибіркових даних, належить області прийняття гіпотези, то приймають нульову гіпотезу По-

Слід пам'ятати, що в будь-якому випадку залишається можливість помилки, яка завжди визначається при проведенні досліджень. Тому результати перевірки статистичної гіпотези завжди можуть бути прийняті як такі, що відповідають дійсності, лише з певною ймовірністю.

Критичні точки Ккр - це ті значення критерію, які відділяють

критичну область від області прийняття гіпотези.

Критичні області бувають:

Правосторонні К> Ккр

Лівосторонні К< Ккр

Двостороння К < К1 К> К2,

Якщо симетрично 0, то К < - Ккр К > Ккр

7.2. Перевірка гіпотез про рівність дисперсій.

7.2.1. Порівняння дисперсії із ідеальною (гіпотетичною) дисперсією генеральної сукупності

На практиці часто виникають ситуації, коли потрібно перевірити точність устаткування, пристроїв перевірки, стабільності технологічних процесів. З цією метою на основі вибіркової дисперсії потрібно перевірити гіпотезу про рівність генеральної дисперсії досліджуваної сукупності певному очікуваному значенню.

Припустимо, що з певної генеральної сукупності узята вибірка, де п -- обсяг вибірки, і s2— незміщена вибіркова дисперсія для цього обсягу. Якщо потрібно перевірити гіпотезу про рівність генеральної дисперсії гіпотетичній генеральній дисперсії, тобто:

(7.2.1.1)

де σ² - невідома генеральна дисперсія;

-— гіпотетичне значення генеральної дисперсії, тоді необхідно обчислити спостережуване значення критерію хі-квадрат (χ²) Пірсона:

(7.2.1.2)

із таблиці критичних точок χ²- розподілу для рівня значущості а і числа степенів вільності k=n-1 знайти критичну точку .

В тому випадку, якщо Н0 відкидається на користь альтернативної гіпотези.

Якщо приймаємо Н0.

7.2.2. Порівняння дисперсій двох генеральних сукупностей, розподілених за нормальним законом

Коли виникає необхідність порівняння двох методів вимірювання, точності роботи двох видів обладнання, однорідності двох сукупностей тощо, доцільно скористатися перевіркою гіпотези про рівність двох дисперсій генеральних сукупностей.

Нехай з двох генеральних сукупностей отримані вибірки обсягом п1, і п2, для кожної з яких визначена скоригована (незміщена) вибіркова дисперсія та відповідно. Потрібно порівняти дисперсії цих сукупностей, тобто перевірити гіпотезу:

(7.2.2.1)

при рівні значущості а.

Для цього потрібно знайти спостережуване значення критерію як відношення більшої дисперсії до меншої:

(7.2.2.2)

Далі, за таблицею критичних точок розподілу Фішера – Снедекора для рівня значущості а і числа степенів вільності К1=п - 1, К2 = п-1 (де значення К1 беремо для більшої дисперсії) знайти критичну точку Fкр(a, k1, k2) і порівняти спостережуване і критичне значення критерію:

якщо Fспост > Fкp — тоді відкидаємо Н0;

якщо Fспост< Fкp — приймаємо Н0.

7.3. Перевірка гіпотез про рівність середніх.

7.3.1. Порівняння середньої генеральної сукупності із її очікуваним значенням

Виготовлена продукція повинна відповідати вимогам стандартів, виробничим специфікаціям. Кількісною характеристикою міри такої відповідності виступають результати перевірки гіпотези про рівність середнього значення досліджуваної сукупності певному очікуваному чи стандартно встановленому значенню.

В тому випадку, якщо дисперсія генеральної сукупності є відомою, для того щоб перевірити гіпотезу:

(7.3.1.1)

про рівність середньої величини гіпотетичній генеральній середній,

де μ1 - невідома середня з сукупності із відомою дисперсією;

μ0 - гіпотетичне значення середньої цієї сукупності, потрібно знайти спостережуване значення критерію:

(7.3.1.2)

і з таблиці функції Лапласа знайти критичну точку икр з рівняння:

(7.3.1.3)

В тому випадку, якщо |t0| > икр — відкидаємо Н0.

У протилежному випадку |t0| < икр -— приймаємо Н0 за визначеного рівня значущості а .

7.3.2. Порівняний середніх значень двох сукупностей

На виробництві часто виникають ситуації, коли потрібно порівняти між собою роботу обладнання, якість отриманої від різних постачальників сировини, якість виготовленої за різних умов продукції і таке інше. Для проведення такого порівняння доцільно провести перевірку гіпотези про рівність середніх двох сукупностей. Порівняння здійснюється на основі визначених з вибірки значень середніх. При цьому вибіркові середні порівнюються не із певним стандартно визначеним значенням, якого часто не існує, а одна з одною.

Проведення порівняння вибіркових середніх дещо відрізняється залежно від того, однакові вибіркові дисперсії досліджуваних явищ чи ні. Тому перед проведенням порівняння двох середніх величин доцільно перевірити гіпотезу про рівність дисперсій. В -1-ому випадку, коли гіпотеза про рівність дисперсій вибіркових сукупностей підтверджується, використовують один критерій перевірки. у протилежному випадку інший.

Коли вважається, що дисперсії є рівними, для перевірки гіпотези про рівність середніх двох сукупностей

(7.3.2.1)

використовується критерій

(7.3.2.2)

який мас розподіл Стьюдента з v=п1+п2 - 2 степенями вільності на рівні значущості а, де п1, п2 — обсяг першої та другої вибіркової сукупності, відповідно.

В критерії використовується узагальнена дисперсія, яку визначають па основі вибіркових дисперсій першої та другої сукупності:

(7.3.2.3.)

Нульову гіпотезу про рівність вибіркових середніх Н0 відкидаємо, якщо абсолютне спостережуване значення критерію |t| перевищує критичне значення :

(7.3.2.4)

7.4. Перевірка гіпотез про частку сукупності

Порівняння спостережуваної частки з гіпотетичною часткою

в сукупності

Для кількісної характеристики відповідності частоти появи певної події визначеному значенню доцільно скористатися гіпотезою про порівняння спостережуваної та стандартної частоти появи події. Припустимо, ми маємо п незалежних дослідів, ймовірність появи події р в яких є постійною, але невідомою. З цієї сукупності знайдена відносна частота числа певних подій т загальній кількості п одиниць. Потрібно перевірити гіпотезу, що вибіркова частота р= т/п дорівнює гіпотетичній частоті ро, тобто:

(7.4.1)

де - гіпотетична частота.

Для перевірки цієї гіпотези за визначеного рівня значущості а потрібно визначити значення критерію:

(7.4.2)

із таблиці функції Лапласа знайти критичну точку икр з рівняння:

(7.4.3)

Якщо

- відкидаємо Н0

- приймаємо Н0.

Порівняння часток двох сукупностей

З метою порівняння часток невідповідної продукції в двох партіях доцільно скористатися гіпотезою про рівність часток двох сукупностей:

(7.4.4)

критерієм перевірки якої є величина

(7.4.5)

де (7.4.6)

Вона має нормований нормальний розподіл, і тому нульова гіпотеза відкидається на користь альтернативної, якщо абсолютне значення критерію перевищує критичну точку, знайдену з таблиці функції Лапласа для прийнятого рівня значущості.