Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Розділ_2.doc
Скачиваний:
25
Добавлен:
02.05.2019
Размер:
3.1 Mб
Скачать

Розділ 2. Методи оцінки параметрів розподілів

2.1. Предмет і задачі математичної статистики

Математична статистика – це математична дисципліна, яка займається розробкою методів і моделей аналізу даних з метою виявлення закономірностей у результаті спостережень над масовими випадковими явищами та процесами. Математична статистика базується на поняттях і методах теорії ймовірностей, але розв’язує свої специфічні задачі. У теорії ймовірностей припускається, що імовірності настання окремих подій відомі. Вважаються відомими закони розподілу випадкових величин або їх числові характеристики. Оперуючи цими поняттями, у теорії ймовірностей знаходять закони розподілу і числові характеристики інших більш складних подій і випадкових величин. Як правило, на практиці ймовірності настання подій, закони розподілу випадкових величин або параметри цих розподілів невідомі. Для їх визначення (оцінювання) проводяться спеціальні спостереження або експерименти.

При обробці результатів експериментів статистичними методами основні поняття теорії ймовірностей – імовірності випадкових подій, закони розподілу випадкових величин тощо, виступають як деякі математичні моделі реальних закономірностей. Таким чином, теорія ймовірностей розробляє математичні моделі для описання реальних закономірностей масових випадкових явищ, формує систему поглядів на статистичну обробку та аналіз результатів експериментів.

Математична статистика розробляє методи математичної обробки результатів випробувань і визначення ймовірнісних характеристик випадкових явищ на основі експериментальних даних.

Сучасну математичну статистику визначають як науку про прийняття рішень в умовах невизначеності.

Основні задачі математичної статистики полягають у розробці методів:

  • планування і організації статистичних спостережень;

  • збору статистичних даних;

  • «згортки інформації», тобто групування і скорочення статистичних даних з метою зведення великої кількості даних до невеликого числа параметрів, які у стислому вигляді характеризують усю досліджувану сукупність;

  • аналізу статистичних даних;

  • прогнозування випадкових подій і явищ.

Методи і засоби наукового аналізу даних, які належать до масових явищ, з метою визначення деяких узагальнюючих ці дані характеристик і виявлення статистичних закономірностей і складають предмет математичної статистики.

До основних задач статистичного аналізу відносяться такі задачі:

  • визначення розподілів випадкових величин за результатами їх спостережень. До цієї загальної задачі зводиться багато частинних, наприклад, визначення ймовірностей подій, функцій розподілу, параметрів розподілу тощо;

  • перевірка статистичних гіпотез про вигляд невідомого розподілу або про величину параметрів розподілу, вид якого відомий, перевірка гіпотез про однорідність та незалежність вибірок;

  • аналіз залежностей між випадковими величинами (кореляційний і регресійний аналіз).

2.2. Варіаційні ряди та їх характеристики

2.2.1. Варіаційні ряди

Вихідним матеріалом при розв’язанні задач математичної статистики є послідовність незалежних спостережень випадкових величин. Це означає, що є імовірнісний експеримент, у якому спостерігається випадкова величина Х і виконується n незалежних реалізацій цього експерименту. Спостережувані значення випадкової величини – називаються випадковою вибіркою або просто вибіркою. Кількість спостережень n – об’ємом вибірки. Множина можливих значень випадкової величини X, які можуть спостерігатися при багатократній реалізації експерименту, називається генеральною сукупністю або вибірковим простором. З точки зору теорії ймовірностей вибірка є реалізацією деякої випадкової величини X. Отже, поняття генеральної сукупності, у певному сенсі, аналогічно поняттю випадкової величини, оскільки повністю обумовлено певним комплексом умов.

Задачі математичної статистики виникають, коли закон розподілу ймовірностей випадкової величини X невідомий, при цьому методи статистичного аналізу дозволяють одержати інформацію про різні закономірності у генеральній сукупності. У залежності від того, який клас можливих розподілів генеральної сукупності і що потрібно знати про функцію розподілу, виникають різні статистичні задачі.

У практиці статистичних спостережень розрізняють два види спостережень: суцільне, коли вивчаються усі об’єкти (елементи) сукупності, і несуцільне, вибіркове, коли вивчається частина об’єктів. Прикладом суцільного спостереження є перепис населення, який охоплює усе населення країни. Вибірковим спостереженням є, наприклад, вибірковий контроль якості продукції, коли для контролю вибирається частина продукції з усієї продукції, що виготовляється.

Сутність вибіркового методу полягає у тому, що за деякою частиною генеральної сукупності (за вибіркою) судять про її властивості в цілому. Для того, щоб за даними вибірки мати можливість судити про генеральну сукупність, вона повинна бути відібрана випадково. Вибірка називається репрезентативною (представницькою), якщо вона досить добре відтворює генеральну сукупність. Використовують два способи утворення вибірки:

повторний вибір (за схемою поверненої кулі), коли випадково відібраний і обстежений елемент повертається у загальну сукупність і може бути повторно відібраний;

безповторний вибір (за схемою неповерненої кулі), коли випадково відібраний елемент не повертається у загальну сукупність.

Нехай – деяка вибірка ( -вимірний випадковий вектор). Побудуємо на основі цієї вибірки упорядкований за зростанням випадковий вектор тобто вектор, у якому

 Послідовність у якій називається варіаційним рядом. Спостережені значення випадкової величини X (ознаки) називають варіантами (порядковими статистиками).

Розмахом варіювання або шириною вибірки називається статистика

(2.1)

Рангом елемента вибірки називається число (номер), який він одержує в упорядкованій за зростанням послідовності , тобто у варіаційному ряді.

Так, ранг 1 одержить найменше із спостережених значень вибірки, ранг 2 – друге за величиною значення і т. д., ранг найбільше із чисел .

Оскільки розгляд і осмислення вибіркових даних (особливо при великій кількості спостережень n) ускладнено і за ними практично неможливо уявити характер розподілу випадкової величини X, то вибірки групують. Кількість інтервалів (розрядів) групування вибирають таким чином, щоб згрупований варіаційний ряд не був громіздким, але і не дуже малим, щоб не втратити особливості розподілу ознаки. Якщо коливання щільності розподілу ймовірності не дуже великі, то бажано вибирати однакові розряди. Якщо ж є згущення варіант, то бажано розряди вибирати так, щоб згущення були якомога ближче до середини розрядів. Із границями розрядів повинно як можна менше співпадати значень варіант.

У сукупностях з розподілами, близькими до нормального, кількість груп k (нижня оцінка) орієнтовно можна визначити за формулою Стерджеса:

де n – об’єм вибірки.

 Числа, які дорівнюють кількості варіант із даного розряду, називаються частотами (позначимо їх як , а відношення їх до загальної кількості спостережень n – відносними частотами або частками:

.

При вивченні варіаційних рядів поряд, з поняттям частота, використовується поняття накопиченої частоти , яка показує кількість варіант із значенням, меншим за x. Відношення накопиченої частоти до загальної кількості спостережень n називається накопиченою часткою:

.

 Варіаційний ряд називається дискретним, якщо будь-які його варіанти відрізняються на постійну величину, i – неперервним (інтервальним), якщо варіанти відрізняються на скільки завгодно малу величину.

Дискретний і інтервальний варіаційні ряди представляються у вигляді:

а) дискретний варіаційний ряд:

де – значення випадкової величини X, які спостерігались у експерименті;

– кількість спостережень (частота) ;

– відносна частота ; – обєм вибірки.

б) інтервальний варіаційний ряд:

де – інтервали, на які розбитий діапазон значень випадкової величини X; – частота попадань в i-й інтервал.

Алгоритм групування варіаційного ряду:

  • визначаємо розмах вибірки R;

  • задаємо кількість розрядів групування k і визначаємо їх довжину:

  • визначаємо границі розрядів:

  • визначаємо частоти або частки попадання варіант у задані розряди.

Функції Mathcad, які застосовуються при групуванні варіаційних рядів: