Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

BiometriaKnuga

.pdf
Скачиваний:
40
Добавлен:
02.03.2016
Размер:
5.65 Mб
Скачать

92

 

Біометрія

 

 

 

Отже, одержується неіменоване значення коефіцієнта кореляції, яке має вираз у долях від одиниці.

Якщо в наведеній вище формулі позначити

xi

 

= αx і

y

 

= α

 

,

x

 

y

y

 

 

 

i

 

то вона може бути представлена у більш скороченому вигляді:

σ

2

=

α2y

,

 

y

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Якщо врахувати, що

 

 

 

 

 

 

а

α2x

= nσ2x

 

тобто: і

 

 

2

 

2

,

 

αy

= nσy

то наведену вище формулу (r) можна представити так:

r =

αx

α y

=

 

αx α y

 

=

 

αx

α y

.

 

 

 

 

 

 

 

 

 

 

 

nσxσy

 

nσ2x nσ2y

 

α2x α2y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблиця 5. Макет допоміжної таблиці для розрахунків коефіцієнта

 

кореляції

 

 

 

 

 

 

 

 

 

 

 

 

 

Дані замірів

 

αх

 

 

αу

 

 

αхαу

αх2

αу2

х

у

αх=xi–x

αy=yi–y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Остання формула зветься формулою Пірсона, вона звільняє від необхідності попередніх розрахунків середніх квадратичних відхилень, що

Розділ 3.5 ЕкОсологіябливості кореляційного аналізу в біометричних дослідженнях

93

 

полегшує визначення коефіцієнтів кореляції.

Для розрахунків коефіцієнта кореляції за формулою Пірсона використовується допоміжна таблиця (табл. 5).

Коефіцієнт кореляції, який визначається для відповідної виборки варіант, так саме, як і окремі варіанти, що досліджуються, є величина випадкова. Тому виникає необхідність також визначати ступінь його наближення до показника генеральної сукупності значень r. Цей показник позначається літерою (ρ). Для вирішення наведеного завдання також застосовується нульова гіпотеза. Вона полягає в припущенні, що ρ = 0, тобто, що між випадковими величинами Х і Y кореляція відсутня.

Для перевірки цієї нульової гіпотези використовується порівняння показників з критерієм tСтьюдента (ts). Значення t при досить значній кількості спостережень (n і 100) є відношенням коефіцієнта кореляції до своєї помилки (mr), яка визначається за формулою

1r2 mr = N 1.

Тоді

t =

r

=

r

 

N 1

.

 

 

 

 

 

m

 

 

1r2

r

Якщо в досліді кількість спостережень менше 100 (n < 100), за критерій для перевірки нульової гіпотези приймається

t =

1r

2

.

N

2

 

 

Якщо t > ts, то нульова гіпотеза відкидається. Це означає, що в генеральній сукупності ρ ≠ 0, тобто одержаний коефіцієнт кореляції (r) достовірно відрізняється від 0, а між Х і Y існує кореляційний зв’язок. При t < ts зберігається нульова гіпотеза, а одержане відхилення (r) від 0 є випадковим.

94

 

Біометрія

 

 

 

Приклад. У виборці, в якій n = 50, одержаний коефіцієнт кореляції r = 0,54. Треба визначити достовірність одержаного значення (r). Вираховуємо критерій достовірності (t):

 

 

 

 

 

 

 

t = 0,

54 502

=

6,92

= 8,0.

10,542

 

0,87

 

 

 

За таблицями Стьюдента для R = 50 2 = 48 і Р =0,01 знаходимо: ts= 2,68. Оскільки t = 8,0 > ts = 2,68, нульова гіпотеза відкидається, тобто одержане значення є достовірне на 0,05 рівні значущості.

Слід мати на увазі різні методичні підходи до використання нульової гіпотези для перевірки критерію достовірності середнього значення виборки і критерію достовірності коефіцієнта кореляції. При визначенні критерію достовірності середнього значення нульова гіпотеза полягає в припущенні, що між параметрами вибіркової і генеральної сукупності різниця відсутня, тобто Пв Пг = 0 (розд. 5).

При визначенні ступеня наближення коефіцієнта кореляції вибіркової сукупності до гіпотетичного коефіцієнта кореляції генеральної сукупності (ρ) застосування нульової гіпотези полягає в припущенні, що між випадковими величинами Х і Y кореляція відсутня, тобто ρ = 0, що означає припущення повної відсутності кореляції між Х і Y.

Р.Фішер запропонував для оцінки ступеню кореляції в малих виборках застосувати не коефіцієнт кореляції, а пов’язану з ним допоміжну величину Z (зет):

Z =1,15129lg1+ r . 1r

Z змінює своє значення від ∞ до +∞ і при малих виборках дає більш надійні результати, ніж коефіцієнт кореляції r.

Перетворення коефіцієнта кореляції в показник Z здійснюється за

Розділ 3.5 ЕкОсологіябливості кореляційного аналізу в біометричних дослідженнях

 

 

95

 

 

 

 

специфічною таблицею, складеною Фішером (додатки 3, 4).

 

 

Критерій достовірності показника Z визначається:

 

 

σZ

=Z

1

;

 

 

 

 

 

n 3

 

 

tZ =

σz

= Z

n 3.

 

 

Цей критерій діє як для

 

малих, так і для великих

виборок, коли замість коефіцієнта кореляції застосовується відповідне до нього значення Z.

Послідовність дій при застосуванні показника Z наступна. За показником коефіцієнта кореляції r за таблицю Фішера встановлюють значення Z (зет). Далі:

визначають величину помилки Z за формулою

Z= Z = Zn 3;

σZ

за таблицею знаходять значення критерію tZ:t

Z= tσ2

значення tZ порівнюється із стандартом за таблицю Стьюдента для прийнятого рівня значимості (Р) і числа ступенів вільності: k = n 2;

за величиною максимальної помилки –

знаходять границі довірчого інтервалу для генерального параметру.

11

σZ = 28 3 = 5 = 0,20.

Приклад. По виборці n = 28 одержаний r = 0,52. За таблицею (додаток 5) знаходимо, що цьому значенню (r) відповідає значення Z = 0,576. Вираховуємо помилку:

96

 

Біометрія

 

 

 

Z = tσ2 =1,96 0,20 = 0,392

Звідси

За таблицею критерію t-Стьюдента (додаток 2) для k = 28 2 = 26 і Р = 0,05 знаходимо ts = 2,006. Порівняємо: tф = 2,88 > ts = 2,06; звідси робимо висновок про те, що нульова гіпотеза відхиляється.

Далі за величиною

 

= Z

= 0,576 = 2,88.

t

Z

 

σZ

25

 

 

знаходимо межі довірчого інтервалу для показника Z (зет):

нижня межа = 0,576 – 0,392 = 0,184;

верхня межа = 0,576 + 0,392 = 0,968.

Користуючись додатком 5 переводимо значення "зет" в величини коефіцієнта кореляції (r) і знаходимо його довірчі границі:

нижня границя – 0,18;

верхня границя – 0,74.

Знайдені межі довірчого інтервалу свідчать про те, що величина коефіцієнту кореляції в генеральній сукупності знаходяться в межах 0,18 < r < 0,74; тобто наведений вище коефіцієнт кореляції: r = 0,52 визначений з достатньою точністю.

Якщо ставиться завдання визначити коефіцієнт кореляції із заданим показником достовірності, то попередньо визначається мінімальна кількість

n =

(1,96)2

 

+ 3 =

3,842

+ 3 = 59+ 3 = 62.

(0,2554)

2

0,065

 

 

 

спостережень, при якій буде забезпечена задана достовірність. Для цього використовується формула

t2

n = ZZ2 + 3;

r1 r2

Розділ 3.5 ЕкОсологіябливості кореляційного аналізу в біометричних дослідженнях

97

 

де n необхідна мінімальна кількість парних спостережень (об’єм виборки); tZ задана по прийнятому порогу довірчої імовірності величина критерію достовірності Z (зет).

Приклад. Для r = 0,25 і n = 20 величина Z = 0,2554. Звідси tZ = 0,2554√(17) = 1,05. Для Р = 0,05 і К = 20 – 2 = 18 ts = 2,10, тобто tф = 1,05 < ts = 2,10. Це означає неможливість відкидання нульової гіпотези.

Питання: яке число спостережень (n) потрібно провести, щоб із заданою імовірністю Р = 0,95 зробити остаточний висновок про наявність або відсутність кореляції між ознаками Х і Y.

Використовуючи останню формулу і виходячи з того, що для імовірності Р = 0,95 відповідає t = 1,96, знаходимо:

t = (mr1)2 + (mr2 )2 .

Тобто відповідь на поставлене запитання можна одержати, якщо провести не менше 62 спостережень.

У біометричних дослідженнях зустрічаються ситуації, коли необхідно дати оцінку вибіркових сукупностей, що порівнюються, за показниками тісноти зв'язку, тобто за коефіцієнтами кореляції відповідних ознак в цих сукупностях. В таких випадках необхідно оцінити достовірність різниці між відповідними коефіцієнтами кореляції. Для цього визначається критерій t різниці коефіцієнтів кореляції:

m

 

=

 

 

1

+

1

 

.

DZ

 

 

 

 

 

 

n1

3

n2 3

 

 

 

 

Одержане значення t порівнюється із значенням ts. Різницю можна вважати достовірною, якщо t > ts > 3.

Оцінку достовірності різниці між коефіцієнтами кореляції можна також

98

 

Біометрія

 

 

 

здійснити за допомогою критерія Z Фішера. Для цього за таблицею (додаток 4) переводимо значення коефіцієнтів кореляції (r1 i r2) в показники критерію Z (Z1 i Z2). Позначимо різницю між Z1 i Z2 літерою D:

D = Z1 Z2.

Далі визначається помилка цієї різниці як сума помилок Z1 i Z2, тобто

tD

=

 

Z1 Z2

 

 

.

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

+

 

 

1

 

 

 

 

 

n 3

n

2

3

 

 

 

1

 

 

 

 

 

К р и т е р і й

 

 

 

 

 

 

 

 

достовірності оцінки різниці

значень Z1 i Z2 є її відношення до наведеної помилки:

 

 

r

2

+ r

2

+ 2r

r

r

 

r =

xz

yz

xy

xz

yz

.

xyz

 

 

1r2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xy

 

 

 

 

Одержане значення tD за описаним вже принципом порівнюється із табличним значенням критерія tSt.

98

 

Біометрія

 

5.4. Множинний коефіцієнт кореляції

Множинний коефіцієнт кореляції визначається тоді, коли на дану ознаку одночасно комплексно впливають дві інших ознаки (фактора) X i Z. В таких випадках визначається не парний (по 2-х ознаках), а сукупний коефіцієнт кореляції для 3-х ознак X, Y, Z:

 

r2

+ r2

+ 2r r

r

r =

xz

yz

xy xz

yz

.

xyz

1r2

 

 

 

 

 

 

 

 

 

xy

 

 

На відміну від парних коефіцієнтів кореляції сукупний коефіцієнт кореляції має лише позитивне значення.

Розділ 3.5 ЕкОсологіябливості кореляційного аналізу в біометричних дослідженнях

 

99

 

 

 

 

Іноді необхідно при трьох взаємообумовлюючих факторах виявити взаємовплив лише для двох з них.

Тоді застосовується коефіцієнт парціальної кореляції для обраних двох факторів (ознак).

Це частинний (частковий) або парціальний коефіцієнт кореляції:

 

 

ad bc

ra =

 

 

 

,

 

 

 

 

 

 

(a + b)(c + d)(a + c)(b + d)

Відповідно

r

=

 

rxz rxy ryz

;

 

xz( y)

 

2

ad

2+ bc

 

ra

=

(1rxy )(1

ryz )

*10,

 

(a b)(c + d)(a + c)(b + d)

 

 

 

 

Розділ 3.5 ЕкОсологіябливості кореляційного аналізу в біометричних дослідженнях

 

99

 

r

=

rxz rxy ryz ;

 

xz( y)

 

 

ознаками, коефіцієнт

5.5. Кореляція між якісними2 2

асоціації

 

(1rxy )(1ryz )

 

 

 

 

Коли ознаки не можуть бути виміряні і не розподіляються у варіаційний ряд, кореляція між ними визначається за наявністю одного або декількох ознак в залежності від наявності інших альтернативних ознак.

Приклад. Від самки плодової мушки дрозофіли, що мала сірий колір і нормальні крила і самця, що мав чорне забарвлення і лише зачатки крил, одержане потомство, в якому було:

сірі з нормальними крилами – 75;

сірі з укороченими крилами – 16;

чорні з нормальними крилами – 14;

чорні з укороченими крилами – 68.

Питання: чи існує зв'язок між чорним забарвленням тіла і рудиментами крил?

Для цього якісні ознаки розміщені в табл. 6.

Після цього визначаються коефіцієнт асоціації за формулою

ra = 0,65.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]