- •Міністерство освіти і науки україни
- •Криворізький технічний університет
- •Кафедра моделювання та програмного забезпечення
- •Методичні вказівки
- •Укладач: о.В. Мовчан Редагували: є.О. Гуляєв, а.А. Козиков
- •Список лабораторних робіт
- •Лабораторна робота № 1.
- •Лабораторна робота № 2.
- •Лабораторна робота № 3.
- •Лабораторна робота № 4.
- •Лабораторна робота № 5.
- •Лабораторна робота № 6.
- •Лабораторна робота № 7.
- •Лабораторна робота № 8.
- •Лабораторна робота № 9.
- •Лабораторна робота № 10.
- •Список використаної літератури
Лабораторна робота № 3.
Тема: Розрахунок параметрів вибірок і критерія Пірсона.
Завдання: Скласти програму, що буде розраховувати критерій Пірсона і порівнювати його з табличним значенням для будь-якої згенерованої вибірки по одному з 3х основних законів розподілу. Також необхідно побудувати гістограму вибіркових значень, зі спрямляючою кривою, що проходить через середини стовпчиків гістограми. Порахувати теоретичні ймовірності закону розподілу й частоти влучення вибіркових значень у кожен інтервал гістограми.
Доповнення: У програмі потрібно передбачити можливість генерації вибірки по одному закону розподілу, а перевірка на інший закон розподілу, тобто потрібно вибирати закон по якому генеруються вибірки і закон по якому буде перевірятися вибірка.
Теоретичні відомості
Критерій Пірсона відноситься до критерію згоди. Цей критерій дозволяє перевірити статистичні гіпотези. У цьому випадку буде перевірятися гіпотеза про вид закону розподілу вибірки.
Примітка: критерій згоди стрімко втрачає точність обчислення при N < 60(N – об`єм вибірки). Саме тому рекомендується застосовувати критерій Пірсона при N ≥ 100. При N = 30 виходить дуже груба оцінка. При менших обсягах поняття закону розподілу губить зміст.
Методика розрахунку:
-
Генерується вибірка по одному з 3х основних законів розподілу (нормальний, лог-нормальний, експоненціальний).
-
цілочислове значення
Використовуючи підпрограму обчислення визначеного інтеграла (наприклад по формулі Сімпсона) обчислюється квантіль закону розподілу. -
Обчислюється число інтервалів за наступною формулою:
Обсяг вибірки
-
Для того щоб визначити границі інтервалів потрібно відсортувати вибірку по зростанню.
-
Визначаємо розмах вибірки R.
-
Далі розраховується довжина проміжку (ділянки) на гістограмі відповідно .
-
Виводиться отримана гістограма на екран зі спрямляючою кривою, яка проходить через середини стовпчиків.
-
, де f(x) – аналітична формула по математичній статистиці.
Обчислюємо критерій Пірсона(λ2):
, де - частота влучення значень вибірки в iий проміжок.
9.) Далі обчислене значення λ2 порівнюється з табличним значенням. Якщо λ2 < табличного значення, то гіпотеза про вид закону розподілу приймається, інакше ця гіпотеза відкидається.
Лабораторна робота № 4.
Тема: Критерії приналежності 2х вибірок одній генеральній сукупності.
Завдання: Скласти програму для розрахунку F і t критеріїв. Генеруються 2 вибірки, для них розраховуються параметри законів розподілу(середнє та дисперсія). F і t критерії служать для визначення приналежності 2х вибірок до однієї генеральної сукупності. Передбачити як порівняння вибірок згенерованих по одному закону розподілу, так і згенерованих за різними законами розподілу. У результаті роботи програми повинно видаватися повідомлення про приналежність вибірок одній генеральній сукупності, а також повідомлятися про велику розбіжність дисперсій або середніх.
Теоретичні відомості
Генеральна сукупність - це вибірка дуже великого розміру в різних частинах якої параметри законів розподіли не відрізняються один від одного статистично значимо. Завдання визначення приналежності 2х вибірок до однієї генеральної сукупності мають багато прикладних додатків. Прикладом служать наступні завдання: точність виміру приладів час від часу необхідно перевіряти. Перевірка виробляється так, спочатку виміри робляться еталонним приладом, показанням якого можна вірити, потім у тих же умовах виміру робляться виміри досліджуваним приладом. Для визначення придатності приладу застосовується f і T критерії.
f – розбіжність дисперсій;
T – розбіжність середніх у порівнюваних вибірках.
Якщо розбіжність дисперсій статистично значима - то це значить, що занадто велика випадкова помилка випробовуваного приладу і він має потребу в регулюванні.
Якщо велика розбіжність по t - критерію - то це значить, що приклад має занадто велику систематичну помилку і прилад має потребу в перенастроюванні.
Примітка: додатковою умовою при використання даних критеріїв є вимога ергодичності або стаціонарності випадкового процесу вимірів. Ергодичність має на увазі, що середнє по ансамблю дорівнює середньому за часом. Якщо ми проводимо серії вимірів на протязі тривалого часу і знаходимо середнє, то воно називається середнім за часом. Вимога статистичної стаціонарності має на увазі, що всі статистичні характеристики (моменти розподілу) не міняються з плином часу.
Розрахункові формули, необхідні для обчислення критеріїв:
; D2 ≥ D1
Обчислене значення F порівнюється з табличним значенням розподілу. Якщо F < Fтабл. – , то це значить, що розбіжність дисперсій не є значимою, у противному випадку розбіжність дисперсій вважається значимою.
N1,N2 – обсяг першої і другої вибірок;
Обчислене значення t - порівнюється з табличним значенням розподілу. Якщо t < tтабл., та розбіжність середніх не значима, інакше вона є значимою.
Примітка: застосування F, t критеріїв вимагає щоб в 2х вибірках був однаковий вид закону розподілу. Також накладається обмеження на обсяг вибірок N ≥ 60. Для менших обсягів існують непараметричні критерії.