Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теор. вер. и мат. стат. теория.doc
Скачиваний:
5
Добавлен:
03.11.2018
Размер:
3.53 Mб
Скачать

§5. Значущість вибіркового коефіцієнту кореляції

Отримавши за сумісною вибіркою значень двох випадкових величин ненульовий вибірковий коефіцієнт кореляції

треба вирішити, чи свідчить це про те, що коефіцієнт кореляції вказаних величин відрізняється від нуля

тобто про наявність кореляційного зв’язку між вказаними величинами.

Висуваємо основну статистичну гіпотезу : - кореляційний зв’язок відсутній. Альтернативна гіпотеза - : - кореляційний зв’язок присутній.

Припустимо, що випадкові величини мають нормальний розподіл. Тоді можна застосувати критерій Стьюдента. Оскільки альтернатива двостороння, виберемо рівень значущості . Обчислимо

За таблицею розподілу Стьюдента знайдемо величину .

Якщо то гіпотеза приймається,

якщо то гіпотеза відхиляється на рівні значущості (ймовірність неправильно відхилити не більше, ніж ).

Зауваження. Відхилення основної гіпотези свідчить про велику ймовірність (не менше, ніж ) наявності кореляційного зв’язку (корельованості) між випадковими величинами. В цьому випадку вибірковий коефіцієнт кореляції вважається значущим. В протилежному випадку – він незначущий і з великою ймовірністю випадкові величини некорельовані.

Приклад. За кореляційною таблицею попереднього прикладу (див.§4) зробити висновок про наявність кореляційного зв’язку між випадковими величинами.

У прикладі, що розглядається

Виберемо рівень значущості (двостороння альтернатива), тоді . Обчислимо

Знайдемо за таблицею розподілу Стьюдента величину .

Порівняємо обчислене число та . Маємо

.

Основна гіпотеза відхиляється. Таким чином з ймовірністю помилки не більше, ніж у 10% робимо висновок про наявність кореляційного зв’язку між величинами та , які розглядалися у попередньому прикладі (тобто ми вважаємо ці величини корельованими).

Зауваження. Насправді у нашій таблиці розподілу Стьюдента немає величини . У наявності є тільки величина . Але легко побачити, що величини у таблиці розташовані у порядку спадання, тому і таким чином, менше, ніж .

§6. Критерій , як критерій незалежності ознак

І. Таблиця спряженості ознак

Припустимо, що спостерігаються значення, які набуваються двома випадковими величинами та . Маємо дві вибірки, які складаються

а) для : зі значень , б) для : зі значень , причому кожна пара значень спостерігається разів. Всього маємо спостережень. Значення величин називають ознаками, та записують у вигляді таблиці спряженості ознак

де сума по рядках: - кількість появ значення у вибірці для ,

сума по стовпчиках: - кількість появ значення у вибірці для . Загальна кількість пар (кількість спостережень)

ІІ. Незалежність ознак

Висувається основна гіпотеза : ознаки незалежні, (тобто незалежні випадкові величини та ). За альтернативну гіпотезу візьмемо припущення про залежність ознак. Для перевірки гіпотези застосуємо критерій .

Обчислимо відхилення

,

скорочено

.

Виберемо рівень значущості . Тоді

якщо , то гіпотеза відхиляється на рівні значущості ;

якщо , то гіпотеза приймається.

При цьому

.

Тобто ймовірність неправильно відхилити основну гіпотезу, коли вона справджується, не може бути більшою .

Зауваження. Як завжди, застосування критерію можливо тільки за умови для всіх можливих значень.

Приклад. У наступній таблиці 1915 року наведено дані про 818 випадків, класифікованих за двома ознаками: наявність щеплення проти холери і відсутність захворювання. Чи можна на підставі цих даних зробити висновок про залежність між відсутністю захворювання та наявністю щеплення?

Наявність щеплення

Наявність захворювання

Сума

Не захворіли

Захворіли

Щеплені

276

3

279

Не щеплені

473

66

539

Сума

749

69

818

Розв’язання. Задача формулюється як задача перевірки гіпотези про незалежність ознак (наявність щеплення і відсутність захворювання)

У нашому випадку Перевіримо можливість застосування критерію . Обчислимо .

, ,

, .

Як бачимо, застосування критерію можливе. Обчислимо відхилення

Виберемо рівень значущості . Знайдемо за таблицею розподілу величину .

Оскільки

то гіпотеза відхиляється на рівні значущості . Таким чином, згідно критерію гіпотеза про незалежність ознак (наявність щеплення і

відсутність захворювання) відхиляється; вона суперечить наведеним даним. Це можна з імовірністю помилки, меншою ніж 5%, інтерпретувати як наявність ефекту щеплення.