Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lec7_tw.doc
Скачиваний:
4
Добавлен:
05.08.2019
Размер:
582.66 Кб
Скачать

Розподіл частот.

Нехай у вибірці із варіант ознака прийняла значення раз, значення раз, …, значення раз.

Додатне число, що вказує, скільки раз та чи інша варіанта зустрічається в таблиці даних, називається частотою, а ряд називається рядом частот. Відмітимо, що сума усіх частот повинна дорівнювати об’єму вибірки: .

Статистичний розподіл вибірки встановлює зв’язок між рядом варіант, що зростає або спадає, і відповідними частотами. Як правило, його подають у вигляді таблиці:

Заданий такою таблицею розподіл називають простим незгрупованим статистичним розподілом або розподілом частоти варіанти (рядом розподілу частоти варіанти).

Розподіл частоти середньомісячної зарплати співробітників фірми

282

1

314

5

328

2

350

1

290

2

316

3

330

1

352

1

292

2

318

1

331

2

354

1

296

2

320

1

332

4

356

1

298

4

321

3

334

3

360

1

302

4

322

6

336

2

362

2

304

9

323

2

338

4

364

1

308

1

324

7

340

2

366

1

310

1

325

1

342

4

368

2

312

4

326

3

348

1

381

2

.

Подальшим кроком в обробці даних, що призводить до спрощення досліджень, є їх згрупування. Як видно із останньої таблиці максимальне та мінімальне значення варіанти будуть

.

Різниця цих чисел

називається варіаційним розмахом або розмахом варіант.

Введемо для варіанти інтервали зміни середньої зарплати: 280-290, 290-300,…, 380-390. Кожний інтервал називається класом інтервалів або класом, а число одиниць виміру у цих класах, тобто різниця , називається шириною класу. Використовуючи дані попередньої таблиці, отримуємо:

Згрупований розподіл частоти середньомісячної зарплати співробітників фірми

280-290

1

290-300

10

300-310

14

310-320

14

320-330

25

330-340

16

340-350

7

350-360

4

360-370

7

370-380

0

380-390

2

сума

100

Така таблиця, яка встановлює зв’язок між згрупованим рядом варіант, що зростає або спадає, та сумами їхніх частот по класах, називається згрупованим розподілом частоти варіанти. У нашому прикладі ширина класів однакова і дорівнює , а кількість класів . Зазначимо, що введені величини варіаційний розмах, ширина класів та їх кількість пов’язані співвідношенням

.

Зауваження. Інколи неможливо або небажано вибирати ширину класів однаковою. Неоднакова ширина класів бажана, наприклад, коли значення частоти одного чи декількох класів набагато більша (менша) значень частот інших інтервалів. Як правило, ширина інтервалів зростає (або спадає) і може містити інтервали відкритого типу “більше ніж…”, “менше ніж…”.

ЗГРУПОВАНИЙ РОЗПОДІЛ НАКОПИЧЕНОЇ ЧАСТОТИ.

Часто поряд із розподілом частоти варіанти необхідно мати розподіл пакопиченої (кумулятивної) частоти. Такий розподіл одержується послідовним додаванням частот чергового інтервалу, починаючи з першого і зікінчуючи останнім (див.таблицю):

Згрупований розподіл частоти середньомісячної зарплати співробітників фірми

інтервали платні

частоти

платня

накопичені частоти

280-290

1

<290

1

290-300

10

<300

11

300-310

14

<310

25

310-320

14

<320

39

320-330

25

<330

64

330-340

16

<340

80

340-350

7

<350

87

350-360

4

<360

91

360-370

7

<370

98

370-380

0

<380

98

380-390

2

<390

100

сума

100

Розподіл накопиченої частоти дозволяє відповісти на питання: “Скільки існує варіант, менших, наприклад, 350?” Із таблиці знаходимо: .

РОЗПОДІЛ ЧАСТКИ (ВІДНОСНОЇ ЧАСТОТИ АБО ЧАСТОСТІ).

Часто замість значень частот використовуються відношення частоти варіанти до об’єму вибірки :

,

які називаються частками (відносними частотами або частостями), причому .

Залежність між впорядкованим рядом варіант і відповідними їм частками також називають статистичним розподілом вибірки (див.таблицю):

Згрупований розподіл частки та накопиченої частки середньомісячної зарплати співробітників фірми

інтервали платні

частоти

частки

платня

накопичені частоти

накопичені частки

280-290

1

0,01

<290

1

0,01

290-300

10

0,1

<300

11

0,11

300-310

14

0,14

<310

25

0,25

310-320

14

0,14

<320

39

0,39

320-330

25

0,25

<330

64

0,64

330-340

16

0,16

<340

80

0,80

340-350

7

0,07

<350

87

0,87

350-360

4

0,04

<360

91

0,91

360-370

7

0,07

<370

98

0,98

370-380

0

0,00

<380

98

0,98

380-390

2

0,02

<390

100

1

сума

100

1

Розподіл накопиченої частки дозволяє відповісти на питання: “Яка частка варіант, що менші, наприклад, 350?” Із таблиці знаходимо: частка цих варіант становить 0,87.

ЗГРУПОВАНИЙ РОЗПОДІЛ ЩІЛЬНОСТЕЙ ЧАСТОТИ ТА ЧАСТКИ.

Якщо поділити всі частоти на ширину інтервалу, то отримаємо розподіл щільності частоти вибірки:

.

Якщо поділити всі частки на ширину інтервалу, то отримаємо розподіл щільності частки вибірки:

.

Відзначимо, що поняття щільностей мають глибокий імовірністний смисл.

Уведемо до попередньої таблиці стовпці щільностей частот та часток:

інтервали платні

часто-ти

частки

щіль-ність часто-ти

щіль-ність частки

платня

накопичені частоти

накопичені частки

280-290

1

0,01

0,1

0,001

<290

1

0,01

290-300

10

0,1

1,0

0,010

<300

11

0,11

300-310

14

0,14

1,4

0,014

<310

25

0,25

310-320

14

0,14

1,4

0,014

<320

39

0,39

320-330

25

0,25

2,5

0,025

<330

64

0,64

330-340

16

0,16

1,6

0,016

<340

80

0,80

340-350

7

0,07

0,7

0,007

<350

87

0,87

350-360

4

0,04

0,4

0,004

<360

91

0,91

360-370

7

0,07

0,7

0,007

<370

98

0,98

370-380

0

0,00

0,0

0,000

<380

98

0,98

380-390

2

0,02

0,2

0,002

<390

100

1

сума

100

1

ЗАГАЛЬНА СХЕМА ПОБУДОВИ ЗГРУПОВАНОГО РОЗПОДІЛУ ЧАСТОТ.

1. Визначити найбільше та найменше значення варіанти і визначити варіаційний розмах .

2. Задатися певним числом класів , яке рекомендується брати непарним, при об’ємах вибірки доцільно , а при менших об’ємах вибірки можна .

3. Визначити ширину класів . Для спрощення розрахунків, отримане значення ширини класів слід округлити до найближчого цілого.

4. Встановити границі класів і підрахувати кількість варіант у кожному класі.

5. Визначити частоту для кожного класу і записати ряд розподілу.

ЕМПІРИЧНА ФУНКЦІЯ РОЗПОДІЛУ.

Нехай є статистичний розподіл частот деякої ознаки .

Означення. Емпіричною функцією розподілу (або функцією розподілу вибірки) називають функцію , яка визначає для кожного дійсного значення частість події , тобто:

,

де - кількість (частота) варіант, які менші від , а - об’єм вибірки.

Зауваження. Інтегральну функцію розподілу генеральної сукупності в математичній статистиці називають теоретичною функцією розподілу. Вона відрізняється від емпіричної функції розподілу тим, що визначає імовірність події , а не її частість. Із теореми Бернуллі випливає, що частість події прямує до імовірності цієї події. Тому доцільно використовувати емпіричну (вибіркову) функцію розподілу для представлення теоретичної фунції розподілу генеральної сукупності.

Між емпіричною функцією розподілу і функцією накопичених частот на кожному класі інтервалів:

.

ГРАФІЧНЕ ЗОБРАЖЕННЯ СТАТИСТИЧНИХ РОЗПОДІЛІВ.

Полігоном частот називають ламану, відрізки якої з’єднують точки .

Полігоном часток (частостей або відносних частот) називають ламану, відрізки якої з’єднують точки .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]