Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Переклад.docx
Скачиваний:
6
Добавлен:
12.02.2016
Размер:
3.33 Mб
Скачать

3.3 Врахування вплив простору, часу та інших факторів

У цьому розділі ми обговоримо деякі особливі характеристики, які можуть бути використані для аналізу просторових або тимчасових індукованих впливів. Ми вже описували деякі з них в . 3.1 і 3.2. Інші підходи впроваджені і пояснюється більш детально, особливо за допомогою деяких прикладів

3.3.1 Класичний Коефіцієнт кореляції, кореляційна функція, і вплив функції

Класичний коефіцієнт кореляції p=p (X, Y) між двома випадковими значеннями (або векторів) X і Y визначається таким чином:

Роль коефіцієнта кореляції схожа на косинус між двома тут випадкових векторів X і Y. Цей коефіцієнт приймає значення від -1 до 1, а квадрат дисперсії відповідає довжині випадкового вектора. Таким чином, ми можемо пояснити той факт, що коефіцієнт кореляції допомагає нам зрозуміти і виявити лінійну залежність між X і Y. Якщо коефіцієнт кореляції дорівнює 1, існує лінійна залежність між X і Y, тобто Y = C • X, C> 0. Існує також лінійна залежність між X і Y, якщо коефіцієнт кореляції дорівнює -1, але з Y = С • X, C <0. Якщо коефіцієнт кореляції дорівнює нулю, ми говоримо про корелюють випадкових значень Х і Y, але не обов'язково стохастичні незалежні змінні. При 0 <| p | <0,4 це прийнято говорити про слабку лінійності, на 0.4 ≤ | p | < 0.8 про середню лінійності, і для | p| ≥ 0,8 про сильну нелінійність між X і У. Іноді значення 0,7 використовується в якості нижнього граничного значення.

Примітка: В основному помилки зроблені в коефіцієнтах кореляції. Ще раз, давайте повторимо, що цей коефіцієнт вимірює тільки лінійну залежність між цими випадковими величинами або векторів. Тепер подумайте про ситуацію, в якій нелінійне співвідношення між X і Y задається наступним аналітична функція F: Y = F (X). Якщо функціональна залежність між е X і Y. є оборотним, то нова змінна. Якщо лінійна залежність між X і змінної Y-1 знаходиться з урахуванням коефіцієнта кореляції p.X, Y-1. То є нелінійна залежність F: Y = F (X) між X і Y.

Емпіричний коефіцієнт кореляції відіграє важливу роль в реальних додатках, так як в більшості випадків випадкові значення X і Y з їх теоретичними розподілами не дано, але кінцеві вимірювання x1, ..., Xn і Y1, ..., уп дві змінні доступні. Визначення емпіричного коефіцієнта кореляції полягає в наступному

Очевидно, що емпіричні коефіцієнти кореляції аналогічним чином не даєть лінійну залежність між змінними розглянутих. Ми бачимо , це в прикладі 3.3.1.1

Приклад 3.3.1.1

Проста зміна від х і у, як на рис. 3.29 показує, що співвідношення між змінними, ймовірно, нелінійна. Дійсно, обчислення емпіричного коефіцієнта p (х, у), ми отримуємо:

З більш докладного розгляду випливає, що відношення у = х2 можна припустити, і якщо це припущення справедливе, нові виміри можуть бути побудовані

3.3 Врахування впливу простору, часу та інших факторів що відповідає в нашому випадку

Розрахувавши нові виміри , ми бачимо , що зворотна функція f складається з двох різних функцій по відношенню до даної інтервалом х , що доводить лінійність між х і у- 1 .

Тепер ми отримуємо наступні результати:

Унаслідок досить великої лінійності між X і Y-1 , прийнято позначати емпіричний кореляційний коефіцієнт рівним 0.96, а функціональне співвідношення виду Y = X2 приймається з вихідних даних.

Можна перевірити ступінь лінійності за допомогою наступної гіпотези:

Параметр ρ0 приймає значення в діапазоні від -1 до 1. Р. А. Фішер запропонував наступні перевірочні значення :

Тут використовується оцінка коефіцієнта кореляції (3-82) . Рекомендується приймати n>24 спостереженнь параметрів X і Y під час обрахунку. Прогнозована H0 повинна бути відхилена з помилкою α типу I якщо

де zq - це q-квантиль нормально розподіленої випадкової величини.

Примітка: лінійність між X і Y не пояснює причини, що є початком цієї лінійності. Що робити, якщо є третій параметр Z , що безпосередньо впливає як на змінні, тим самим викликаючи вторинну, високу залежність між X і Y? Для того щоб довести цю можливість, повинні бути розглянуті так звані часткові коефіцієнти кореляції.

Нехай,маємо n спостереженнь (x, y, z) з  (X,Y, Z), які слідуватимуть тривимірному нормальному розподілу. Наступними  характеристиками  є емпіричні коефіцієнти часткової кореляції :

Оцінки " звичайних" коефіцієнтів кореляції наведені в ( 3-82 ) .

Для того, щоб перевірити гіпотезу про незалежність X і Y після видалення первинного впливу Z, потрібно буде розрахувати:

Гіпотеза про незалежність відкидається з помилкою α типу I якщо

де tm;q q-квантель , t- розподіл, m- ступінь вільності .

Приклад 3.3.1.2 Розглянемо наступні 34 тривимірних спостереження і

перевіримо незалежності X і Y після видалення первинного впливу Z :

Для первинного аналізу даних, ми рекомендуємо візуалізувати ці значення, як показано на рис. 3.30. Спочатку ми використовуємо рівняння (3-82) щоб розрахувати "звичайні" емпіричні коефіцієнти кореляції:

Як ми бачити, існує сильна нелінійність серед всіх параметрів. Використовуючи (3-85), ми бачимо, що емпіричний коефіцієнт кореляції між Х і Y після видалення впливу Z відповідає:

3.30 Візуалізація даних для первинного аналізу : хмари даних (x, y), (x, y ) і ( y, z)

Емпіричний коефіцієнт часткової кореляції вказу’ на середн. лінійність між X і Y після зняття впливу Z. Але ці параметри не є незалежними

тому що, використовуючи ( 3-86 ) і ( 3-86 ) , гіпотеза повинна бути відкинута

з помилкою α = 0,05 типу I:

Може бути доведено, що

Таким чином , зняття впливу Z призводить до значного зниження ступеня

Лінійності між X і Y, але не до підтвердження гіпотези про незалежність

між Х і Y.

Ми визначили функцію кореляції і показали її оцінку раніше в

пункті 3.2.2 . Не кожна функція, яка виглядає " оптично " є кореляційної функції насправді. Кореляційна функція характеризується певними властивостями, які мають виконуватись одночасно, але їх часто буває складно довести. Є дуже багато моделей кореляційних функцій , які можуть бути розглянуті для різних додатків, але виведення цих функцій іноді ускладнюється: наприклад, якщо число даної величини дуже маленьке. Окрім того, а що коли ми не хочемо перейняти на себе стохастичне відношення між параметрами, тобто, кореляцію? Є інша- " детермінована " можливість кількісного впливу? Звичайно, є така можливість. Обговоримо тепер детермінований еквівалент кореляційної функції , відомий як функція впливу , що є альтернативним способом аналізу взаємодії . Метод дуже простий. Найбільш важливою перевагою використання функції впливу замість кореляційної функції є те , що немає ніяких обмежувальних припущеннях.

Ми пояснюємо основну ідею методу впливу на прикладі лісового господарства. Припускаємо , що характеристика кожного дерева ( наприклад, параметри і знак ) -DBH (діаметр на висоті грудей) , висота дерева , Бай ( поперечна площа приріст ) та інші , залежить від інших дерев , а саме від їх місць розташування і характеристик. Тоді цілком реально припустити , що вплив одного дерева на інше зменшується із збільшенням відстані між ними. Позначимо остаточну відстань мыж деревами, де цей вплив f все ще існує з параметром R. Таким чином, вірно , що f (r) = 0, г> R.

Передбачається, що функція f є однаковою для кожного дерева в лісі.

Друга модель припущення стосується лінійності середньої величини єдиних впливів, що належать сусіднім деревам , а це означає, що

дерево знаходяться в точці х0 з N сусідніх дерев на відстанях , менших, ніж R:

Щоб уникнути систематичної недо- або переоцінки, сума ваг має бути рівною одиниці. Тим не менш, наша мета полягає щоб вплив функції f був

"оптимальним " . Поліноміальна функція

може бути взята до уваги. Ми можемо також використовувати іншу функціональну модель. Метод найменших квадратів Може бути застосований метод найменших квадратів. Тоді, наступну суму доведеться мінімізувати:

Сума в (3-89) розглядає всі дерева в лісі. Слід зазначити, що число сусідів N може змінюватись для різних дерев .Крім того, рівняння ( 3-89 ) може мати вигляд:

Можна подати (3-87) в такому вигляді

Таким чином, достатньо звести до мінімуму

Використовуючи ( 3-88 ) в ( 3-90 ) і застосовуючи методи найменших квадратів , ми отримаємо LSE (системи лінійних рівнянь) щодо невідомих параметрів a1 ,. , , , a M :

Це має сенс, якщо вибрати ступінь полінома М , набагато меншим, ніж число

дерев у лісі.Це означає,що сума різниць ( 3-90 ), може використовуватись для встановлення найкращого значення параметрів R і М .Якщо є ˝n˝ дерев, тоточність σ підгонки функції впливу може становити:

Приклад вирахування функції впливу можна зробити таким чином.

Приклад 3.3.1.3 Ми вираховуємо функцію впливу для наступного набору даних (див3,31 ) :

Приймемо ,що параметр R , рівний 5 , тоді перше дерево матиме вісім сусідніх дерев. Відстань до дерев з номерами 2-6 , 5, 21, 22 є меншою, ніж R. Спочатку припустимо, що функція впливу - многочлен п'ятого ступеня , що означає:

Після розв’язання ( 3-91 ) , ми отримаємо

Малюнок 3.32 показує цей многочлен . Відповідна точність σ із ( 3-90 ) становить

Мінімум функції впливу зазначає відстань від дерева, що є поганою при

збільшенні параметра дерева m. Це відповідає тут віддалі 1.2 .

По-друге, ми перевіряємо поліномом восьмого степеня для функції впливу і отримаємо:

Обчисливши рівняння ( 3-91 ) ,отримаємо

Малюнок 3.33 показує цей многочлен . Відповідна точність σ із (3-90) становить

Мінімум функції впливу зазначає відстань від дерева, що є поганою при збільшенні параметра дерева m. Це відповідає тут віддалі 0,9.

108 3 Деякі реальні проблеми та їх вирішення

Мал. 3.31 Ділянки .де є дерева ( х , у)

Порівнюючи точності в (* 0,2 ) і ( 0,4 * ) видно, що поліном восьмого степеня підходить функції впливу краще, ніж п'ятого степеня. Ясно ,що можна оптимізувати це значення степені з використанням системи лінійних рівнянь ( 3-91 ) і контролю точності в ( 3-90 )покроково.

Примітка: Ми представили деякі методи, які допоможуть нам розглянути різні види впливу : ( 1) ставлення одного параметра до іншого (коефіцієнт кореляції).

Мал. 3.33 Місця функції впливу (*.3)

(2 ) залежність двох параметрів від третього (часткового коефіцієнта кореляції), і ( 3) залежність параметра від часу або простору (кореляційної функції , функції впливу).

Ми відзначили , що є не лише лінійна залежність одного параметра

від іншого , а й показали шлях , який допоміг нам визначити ще один вид залежності з використанням коефіцієнта кореляції ( див. приклад 3.3.1.1 ). Загалом, ми представили два способи або методи, - стохастичний і детермінований – і обговорили аргументи для їх використання.