Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Нвчально-методичний посібник-теорія ймов.doc
Скачиваний:
29
Добавлен:
27.11.2019
Размер:
4.87 Mб
Скачать

Емпірична функція розподілу

Нехай маємо статистичний розподіл деякої ознаки Х (кількість балів, оцінка).

Позначимо через п загальну кількість спостережень (об’єм вибірки), kх – кількість спостережень при яких спостережувана ознака Х  х. Тоді відносна частота події Х х дорівнює .

Якщо х змінюється, то може змінюватись і відносна частота, тобто є функцією від х. Оскільки її знаходять дослідним шляхом, то вона має назву емпіричної.

Означення. Емпіричною функцією розподілу (або функцією розподілу вибірки) називають функцію F*(x), яка визначає для кожного значення х відносну частоту події Х х

F*(x)= .

Інтегральна функція F(x) генеральної сукупності у математичній статистиці називається теоретичною функцією розподілу. Так як F(x) – ймовірність того, що F(x)=Р(Х х), а F*(x)= події Х х прямує також до ймовірності цієї події, то функції F(x) і F*(x) мало відрізняються одна від одної.

Властивості емпіричної функції розподілу

  1. 0≤ F*(x) ≤1.

  2. F*(x) – зростаюча.

  3. F*(x)= .

Приклад 3. Знайти емпіричну функцію розподілу за статистичним розподілом (прикл.1) та побудувати її графік

аі

2

3

4

5

ki

3

24

14

15

ni=

Розв’язання.

F*(x)=

Графік емпіричної функції будуємо таким чином:

Запитання для самоконтролю

  1. Що є предметом вивчення математичної статистики. Основна задача математичної статистики?

  2. Який алгоритм проведення статистичного дослідження?

  3. Які є види та способи відбору даних?

  4. Що таке статистична сукупність, вибірка, генеральна сукупність, варіанта, варіаційний ряд?

  5. Описати алгоритм побудови дискретного та інтервального варіаційних рядів.

  6. Що називають частотою, відносною частотою, накопиченою частотою вибірки?

  7. Описати алгоритм побудови полігону частот та гістограми відносних частот.

  8. Що називають емпіричною функцією розподілу? Що є графіком емпіричної функції розподілу?

  9. Які властивості має емпірична функція розподілу?

Тема 8. Статистичні оцінки параметрів розподілу

8.1. Числові характеристики статистичного розподілу

На практиці часто замість повного вивчення даних вибірки буває достатньо обмежитися знаходженням їх числових характеристик.

По аналогії з числовими характеристиками ДВВ визначають вибіркові числові характеристики, замінюючи при цьому імовірності pi відносними частотами .

Числові характеристики, обчислені за вибіркою називаються статистиками.

Числові характеристики, обчислені за генеральною сукупностю називаються параметрами.

Наведемо основні статистики.

Означення. Модаце значення, яке в статистичному ряді зустрічається найчастіше (М0).

Правило обчислення моди: якщо всі значення в ряді зустрічаються однакову кількість разів, то цей ряд моди немає; якщо два сусідні значення зустрічаються однакову кількість разів, то мода дорівнює їх середньому арифметичному; якщо два несусідні значення зустрічаються однакову кількість разів, то ряд має дві моди і називається бімодальним, а якщо більше двох, то полімодальним.

Для інтервального варіаційного ряду розподілу з однаковими інтервалами моду обчислюють за формулою Орженцького:

,

де - нижня межа модального інтервалу, т.т. такого, що має найбільшу частоту.

- частоти передмодального, модального, післямодального інтервалу відповідно.

- довжина інтервалу.

Означення. Медіана – це значення, яке займає центральне місце у впорядкованому ряді розподілу (Ме).

Правило обчислення медіани: для дискретного впорядкованого варіаційного ряду з непарним числом елементів медіану знаходять як варіанту х з порядковим номером , тобто .

Для ряду з парним числом елементів медіану розраховують як середню арифметичну двох варіант з порядковими номерами та : .

Для інтервального ряду розподілу медіану обчислюють за формулою: , де - нижня межа медіанного інтервалу, – довжина медіанного інтервалу, – сума частот накопичених перед медіанним інтервалом, – половина суми частот, – частота медіанного інтервалу.

Примітка: медіанний інтервал визначається як інтервал, для якого накопичена частота дорівнює півсумі всіх частот ряду, або перевищує її.

Означення. Вибірковою середньою статистичного розподілу вибірки називають середню арифметичну значень її варіант з урахуванням їхніх частот , тобто

.

Вибіркова середня є основною характеристикою статистичного розподілу вибірки та аналогом математичного сподівання. ЇЇ узагальненням є поняття початкового емпіричного моменту.

Означення. Початковим емпіричним моментом s-того порядку Мs статистичного розподілу вибірки називається середнє арифметичне значення степенів порядку s варіант , тобто .

Розглянемо основні характеристики розсіювання значень вибірки навколо її середнього значення.

Означення. Розмахом вибірки R називають різницю між найбільшим та найменшим значеннями її варіант, тобто .

Означення. Вибірковою дисперсією DВ статистичного розподілу вибірки називають середню арифметичну квадратів відхилень варіант від вибіркової середньої, тобто .

Для обчислення вибіркової дисперсії часто зручніше використовувати формулу .

Розмірність дисперсії дорівнює квадрату розмірності значень вибірки, що створює незручність у дослідженнях. Щоб її усунути, за характеристику розсіювання значень випадкової величини за результатами значень вибірки приймають вибіркове середнє квадратичне відхилення вибірки В, яке визначається рівністю:

Означення. Коефіцієнтом варіації V статистичного розподілу вибірки називається відношення середнього квадратичного відхилення до середньої арифметичної вираженого у відсотках.

Обчислюється за формулою:

.

Означення. Центральним емпіричним моментом s-того порядку тs статистичного розподілу вибірки називається середнє арифметичне значення степенів порядку s відхилень варіант від середньої вибіркової , тобто:

Зокрема, т1=0, т2= DВ

Для оцінки відхилення статистичного розподілу вибірки від нормального розподілу використовують числові характеристики – асиметрію та ексцес.

Означення. Асиметрією АВ називають число, яке обчислюється за формулою:

де т3 – центральний емпіричний момент 3-го порядку, В – середнє квадратичне відхилення статистичного розподілу вибірки.

Означення. Ексцесом ЕВ статистичного розподілу вибірки називається число, яке обчислюється за формулою:

де т4 – центральний емпіричний момент 4-го порядку, В – середнє квадратичне відхилення статистичного розподілу вибірки.

Якщо випадкова величина Х розподілена за нормальним законом, то її асиметрія і ексцес дорівнюють нулю.

Усі вищезазначені формули можуть бути використані при обчисленні числових характеристик вибірки для випадку, коли емпіричні дані згруповані за допомогою інтервального варіаційного ряду, зокрема, якщо вважати, що – середини інтервалів.

Обчислення можна спростити , використовуючи метод добутків, в основі якого лежать рівновіддалені варіанти та наступна розрахункова таблиця

1

2

3

4

5

6

хі

ki

ui

ui ki

ui ki2

ki (ui+1)2