Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Міністерство освіти та науки Україн1.doc
Скачиваний:
42
Добавлен:
02.05.2019
Размер:
9.22 Mб
Скачать

Ііі. Елементи математичної статистики

Сучасна математична статистика — це наука про прийняття рішень в умовах невизначеності. Завдання математичної статистики — це, по-перше, вказати способи збору і групування даних, отриманих в результаті спостережень або спеціально спланованих експериментів, а, по-друге, розробити методи аналізу статистичних даних залежно від мети досліджень.

Виявлення закономірностей, яким підпорядковуються масові випадкові явища ґрунтується на вивченні статистичних даних методами теорії ймовірностей.

Генеральна сукупність і вибірка

Сукупність однорідних об’єктів, які піддаються статистичному аналізу називають генеральною сукупністю. Кількість об’єктів у генеральній сукупності називають об’ємом генеральної сукупності. У процесі статистичних спостережень вивчаються ознаки (одна або кілька), притаманні об’єктам цієї сукупності. Ознаки можуть бути кількісними або якісними.

Розрізняють два види статистичних спостережень — суцільне і вибіркове. При суцільному спостереженні досліджується кожен об’єкт генеральної сукупності. Однак практично такий вид досліджень використовується досить рідко. При вибірковому спостереженні з генеральної сукупності формується вибіркова сукупність (або вибірка) — обмежена множина випадково відібраних з генеральної сукупності об’єктів, для якої проводяться статистичні дослідження. Результати досліджень вибірки переносяться на генеральну сукупність. Очевидно, що для того, щоб правильно оцінювати досліджувану ознаку генеральної сукупності за вибіркою, вибірка повинна достатньо точно представляти генеральну сукупність.

Кажуть, що вибірка є репрезентативною, якщо кожен елемент генеральної сукупності має однакову ймовірність потрапити до цієї вибірки.

Дискретний варіаційний ряд

Нехай з генеральної сукупності зроблена вибірка, причому значення досліджуваної ознаки зустрічалось раз, раз, раз. Число є об’ємом вибірки. Величини називають варіантами, а записану у порядку зростання їх послідовність — варіаційним рядом. Числа називають частотами варіант , а — відносними їх частотами.

Статистичним розподілом вибірки називають перелік варіант і їх відносних частот.

Ламану з вершинами в точках називають полігоном відносних частот.

Позначимо через кількість спостережень, при яких значення спостережуваної ознаки було меншим, ніж х. Величину називають нагромадженою (або кумулятивною) частотою варіанти .

Функцію

(ІІІ.1)

називають емпіричною функцією розподілу (або функцією розподілу за вибіркою) ознаки. Функцію розподілу генеральної сукупності називають теоретичною функцією розподілу. Відмінність між емпіричною і теоретичною функціями розподілу полягає в тому, що теоретична функція розподілу F(x) визначає імовірність події Х < x, а F*(x) — її відносну частоту. Однак на підставі закону Бер­нуллі можемо стверджувати, при великих п функція F*(x) практично мало відрізняється від F(x). Це дає нам змогу знаходити наближені значення числових характеристик розподілу випадкової величини (медіани, квантилей, математичного сподівання, стандартного відхилення та ін.), використовуючи емпіричну функцію розподілу.

Приклад 15. При опитуванні групи учнів за тестом Кеттела були отримані такі значення фактора О : 3, 6, 5, 1, 3, 2, 1, 1, 3, 2, 4, 3, 3, 7, 7, 9, 5, 6, 7, 6, 8, 7, 6, 4, 3, 1, 8, 8, 7, 4, 6, 1, 6, 1, 5, 5, 1, 3, 1, 7. Знайти статистичний розподіл вибірки, емпіричну функцію розподілу, побудувати полігон відносних частот, та графік емпіричної функції розподілу. Визначити медіану та квартилі емпіричного розподілу.

Розв’язання: Об’єм вибірки дорівнює 40. Статистичний розподіл вибірки має вигляд:

1

2

3

4

5

6

7

8

9

1/5

1/20

7/40

3/40

1/10

3/20

3/20

3/40

1/40

Емпірична функція розподілу задається таблицею:

х

x≤1

1<x≤2

2<x≤3

3<x≤4

4<x≤5

5<x≤6

6<x≤7

7<x≤8

8<x≤9

x>9

F(x)

0

0,2

0,25

0,425

0,5

0,6

0,75

0,9

0,975

1

П олігон відносних частот та графік емпіричної функції розподілу наведені на рис. 11.

Оскільки для даного розподілу квартилі за емпіричною функцією розподілу визначаються неоднозначно, то в якості значень квартилей вибираємо середини відповідних інтервалів. Тому , , .