- •Статистичні гіпотези: нульова і альтернативна.
- •13. Що таке мода кривої щільності розподілу ймовірності? Про що може свідчити асиметричне розташування моди?
- •15.Що таке медіана щільності розподілу ймовірності? Про що може свідчити її асиметричне розташування?
- •16.Що таке квартіль випадкової величини? Коли він застосовується?
- •17.Критерій Стьюдента. Область застосування. Максимальна кількість груп для порівняння.
- •18.Однофакторний дисперсійний аналіз кількісних даних.
- •3.1. Однофакторный дисперсионный анализ
Статистичні гіпотези: нульова і альтернативна.
Статистичною гіпотезою називається будь-яке припущення щодо виду або параметрів невідомого закону розподілу. У конкретній ситуації статистичну гіпотезуформулюють як припущення на певному рівні статистичної значущості про властивості генеральної сукупності за оцінками вибірки.
Статистичну гіпотезу прийнято позначати літерою Н: (Hypothesis). Сформульована гіпотеза "Н: а2=0,5" може читатися так: "висунута статистична гіпотеза про те, що невідома дисперсія а2 не відрізняється від значення 0,5". Гіпотетичне твердження є або справедливим (істинним), або помилковим (хибним), що потребує його перевірки.
Розрізняють прості і складні статистичні гіпотези. Проста гіпотеза повністю визначає теоретичну функцію розподілу випадкової величини. Наприклад, гіпотеза " Н: закон розподілу випадкової величини є нормальним з параметрами /г=0 і ег=1" є простою, а гіпотеза " Н: закон розподілу випадкової величини не є нормальним" - складною.
Статистичні гіпотези підрозділяються на нульові й альтернативні.
Нульова гіпотеза позначається як H0. Це гіпотеза про відсутність відмінностей у значеннях ознак. Наприклад, гіпотеза "H0 : fi1 - fi2 = 0" читається так: "висунута нульова гіпотеза про відсутність значущої різниці між середніми fi1 і fi2". Як правило, нульова гіпотеза - це те, що ми хочемо спростувати, якщо перед нами стоїть завдання довести значущість відмінностей.
Альтернативна гіпотеза є логічним запереченням нульової гіпотези і позначається як H1. Природно, що це гіпотеза про існування відмінностей. Наприклад, гіпотеза "H1: fi1 - fi2 Ф 0" читається так: "висунута альтернативна гіпотеза про наявність значущої різниці між середніми fi1 і /г2". Найчастіше альтернативна гіпотеза - це те, що ми хочемо довести. Проте існують завдання, коли бажано підтвердити нульову гіпотезу і переконатися, наприклад, що вибірки не розрізняються між собою за якимись показниками. Нульову й альтернативну гіпотези прийнято представляти у парі:
но: ці - Ц2 = 0; ні: ці - Ц2 Ф 0.
Статистичні висновки робляться на підставі прийняття однієї гіпотези і відхилення іншої. Рішення приймається з певною достовірністю.
Довірчі інтервали і їх зміст.
Доверительный интервал
– предельные значения статистической величины, которая с заданной доверительной вероятностью γ будет находится в этом интервале при выборке большего объема. Обозначается как P(θ - ε < x < θ + ε) = γ
Мерой доверия оценке θ считается вероятность γ того, что погрешность оценки |θ - x| не превысит заданной точности ε:
На практике выбирают доверительную вероятность γ из достаточно близких к единице значений γ = 0.9, γ = 0.95, γ = 0.99.
Классификация доверительных интервалов
По виду оцениваемого параметра:
Доверительный интервал для генерального среднего (математического ожидания);
Доверительный интервал для дисперсии;
(D - t; D + t)
Доверительный интервал для среднеквадратического отклонения;
Доверительный интервал для генеральной доли;
По типу выборки:
Доверительный интервал для бесконечной выборки;
Доверительный интервал для конечной выборки;
12.Дисперсія. Її зміст і значення.
Дисперсією s2 статистичного ряду називають середню арифметичну квадратів відхилень варіант від їх середньої арифметичної.
(1.2)
Враховуючи що , формулу (1) можна переписати у вигляді
Дисперсію s2 часто називають вибірковою (або емпіричною), на відміну від σ2 – генеральної дисперсії.
Бажано у якості міри варіації мати характеристику, яка була б виражена у тих самих одиницях, що й значення ознаки. Такою характеристикою є середнє квадратичне відхилення s – арифметичне значення кореня квадратного з дисперсії.
Можна також розглянути характеристику, яка не має розмірності – коефіцієнт варіації, який дорівнює відсотковому відношенню середньої квадратичної відхилення до середньої арифметичної.
Якщо значення коефіцієнту варіації досить великі (наприклад, більші 100%), то це свідчить про неоднорідність значень ознаки.
Властивості дисперсії (вони аналогічні до властивостей дисперсії випадкової величини).
Дисперсія постійної дорівнює нулю.
Якщо всі варіанти збільшити (зменшити) у k разів, то дисперсія збільшиться (зменшиться) у k2 разів. ( )
Якщо всі варіанти збільшити (зменшити) на одне і те саме число, то дисперсія не зміниться.
Дисперсія дорівнює різниці між середньою арифметичною квадратів варіантів та квадратом середньої арифметичної.
де
5. Якщо ряд складається з декількох груп спостережень, то загальна дисперсія дорівнює сумі середньої арифметичної групових дисперсій та дисперсії між групами.
(2)
де s2 – загальна дисперсія (тобто дисперсія всього ряду);
- середня арифметична групових дисперсій
- дисперсія між групами.
Формула (2) має дуже важливе значення у статистичному аналізі.