Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1553 Статистика.doc
Скачиваний:
5
Добавлен:
01.05.2019
Размер:
2.06 Mб
Скачать

Запитання для самоконтролю

  1. У чому сутність перевірки гіпотез?

  2. Що розуміється під нульовою гіпотезою?

  3. Що розуміється під альтернативною гіпотезою?

  4. У чому відмінність між односторонньою і двосторонньою перевіркою гіпотез?

  5. Як перевірити справджуваність нульової гіпотези? Який рівень істотності доцільно використати?

  6. Яка аналітична функція покладається на статистичний критерій?

Теми "Статистичні методи аналізу кореляційних зв’язків", "Аналіз таблиць взаємної спряженості"

Мета роботи: засвоєння, поглиблення та систематизація знань про методи вивчення зв’язків між окремими ознаками, кореляційно-регресійний аналіз, сутність таблиць взаємної спряженості.

Питання для самостійного вивчення.

1.Загальні методи вивчення зв’язків між окремими явищами.

2.Основні завдання, передумови застосування, сутність та етапи кореляційно-регресійного аналізу.

3.Знаходження параметрів рівняння регресії та їх економічна інтерпретація.

4.Оцінка щільності зв’язку та перевірка його суттєвості у коркляційно-регресійному аналізі.

5.Непараметричні методи дослідження взаємозв’язків між ознаками.

6.Сутність таблиць взаємної спряженості. Застосування коефіцієнтів спряження до аналізу взаємозв’язків між ознаками.

Література: 2-11

Методичні рекомендації

Усі соціально-економічні явища взаємопов'язані. Зв'язок між ними має причинно-наслідковий характер. Ознаки, що характеризують причини та умови зв'язку, називаються факторними , а ті, що характеризують наслідки зв'язку, – результативними . Між ознаками і виникають різні за природою та характером зв'язки, зокрема функціональні та стохастичні. У разі функціонального зв'язку кожному значенню ознаки х відповідає одне чітко визначене значення у. Цей зв'язок виявляється однозначно в кожному окремому випадку. У разі стохастичного зв'язку кожному значенню ознаки х відповідає певна множина значень у, які утворюють так званий умовний розподіл. Як закон цей зв'язок виявляється лише у масі випадків і характеризується зміною умовних розподілів . Якщо замінити умовний розподіл середньою величиною , то утвориться різновид стохастичного зв'язку – кореляційний. У разі кореляційного зв'язку кожному значенню ознаки х відповідає середнє значення результативної ознаки .

Прикладом стохастичного, зокрема кореляційного, зв'язку може бути розподіл проданих на аукціоні акцій за курсовою ціною у залежно від їх номінальної ціни .

У кожній групі за факторною ознакою спостерігатиметься свій умовний розподіл у, який за наявності стохастичного зв'язку відрізнятиметься від розподілів в інших групах та від підсумкового безумовного розподілу. Умовні розподіли можна замінити середніми значеннями результативної ознаки, які обчислюються як середня арифметична зважена:

.

Поступова зміна середніх від групи до групи свідчитиме про наявність кореляційного зв'язку між ознаками.

Характеристикою кореляційного зв'язку є лінія регресії, яка розглядається у двох моделях: аналітичного групування та регресійного аналізу. У моделі аналітичного групування – це емпірична лінія регресії, утворювана з групових середніх значень результативної ознаки для кожного значення (інтервалу) .

Ефекти впливу на визначаються як відношення приростів середніх групових значень , де , .

Оцінка щільності зв'язку ґрунтується на правилі розкладання дисперсій, згідно з яким дисперсія результативної ознаки в моделі^ аналітичного групування розкладається на дисперсію в кожній групі, виділеній за ознакою (групову), та дисперсію між групами (міжгрупову). Цей взаємозв'язок між трьома дисперсіями дістав назву правила розкладання дисперсій, яке записується так:

.

Загальна дисперсія характеризує варіацію ознаки у за рахунок впливу всіх причин (факторів), міжгрупова за рахунок фактора , покладеного в основу групування, а групові – за рахунок інших факторів, не врахованих у групуванні.

Групова дисперсія розраховується окремо для кожної j-ої групи:

де – значення ознаки окремих елементів сукупності;

– середнє значення ознаки в j -й групі;

– частота j-ї групи.

Для всіх груп у цілому обчислюється середня з групових дисперсій, зважених на частоти відповідної групи:

.

Міжгрупова дисперсія обчислюється за формулою:

.

Відношення міжгрупової дисперсії до загальної є мірою щільності зв'язку в моделі аналітичного групування і називається кореляційним відношенням:

.

Кореляційне відношення коливається від 0 до 1, а якщо подіться у процентах, то від 0 до 100 % і показує, скільки процентів варіації результативної ознаки пов'язано з варіацією факторної ознаки. Чим більше наближається до одиниці, тим щільніший зв'язок. За відсутності зв'язку , а за умови функціонального зв'язку .

Втім, навіть щільний зв'язок може виникнути випадково, тому слід перевірити його істотність, тобто довести невипадковість зв’язку. Перевірка істотності зв'язку – це порівняння фактичного значення з його критичним значенням для певного рівня істотності та кількості ступенів свободи і , де – кількість груп; – обсяг сукупності. Якщо , то зв'язок визнається істотним.

У моделі регресійного аналізу характеристикою кореляційного зв'язку є теоретична лінія регресії, що описується функцією , яка називається рівнянням регресії. Залежно від характеру зв'язку використовують:

- лінійні рівняння , коли зі зміною ознака змінюється більш чи менш рівномірно;

- нелінійні рівняння, коли взаємозв'язані ознаки змінюються нерівномірно (з прискоренням, уповільненням або зі змінним напрямом зв'язку), зокрема степеневе рівняння , гіперболічне , параболічне тощо.

Найчастіше застосовують лінійні рівняння або рівняння, зведені до лінійного вигляду. У лінійному рівнянні параметр коефіцієнт регресії – вказує, на скільки одиниць в середньому зміниться зі зміною на одиницю. Він має ту саму одиницю, що й результативна ознака. У разі прямого зв'язку – величина додатна, а в разі зворотного – від'ємна. Параметр – вільний член рівняння регресії, тобто це значення при . Якщо не набуває нульових значень, цей параметр має лише розрахункове призначення. Параметри визначаються методом найменших квадратів методом найменших квадратів, згідно з яким сума квадратів відхилень емпіричних значень від теоретичних мінімальна . Відповідно до умови мінімізації параметри обчислюються на основі системи нормальних рівнянь:

Звідси

.

Характеристикою відносної зміни за рахунок є коефіцієнт еластичності

,

який показує, на скільки процентів у середньому змінюється результативна ознака зі зміною факторної на 1 %.

На підставі рівняння регресії визначаються теоретичні значення , тобто значення результативної ознаки за умови впливу лише фактора , коли рівень інших факторів незмінний.

Відхилення емпіричних значень від теоретичних називають залишковими. Вони характеризують вплив на результативну ознаку всіх інших факторів, окрім . Середній розмір цих відхилень визначає залишкова дисперсія

.

Варіацію , зумовлену впливом тільки фактора , вимірює факторна дисперсія:

.

Частка факторної дисперсії в загальній характеризує щільність Ін'язку і називається коефіцієнтом детермінації:

.

Він має такий самий зміст, інтерпретацію та цифрові межі, як і . Для оцінювання щільності лінійного зв'язку використовується лінійний коефіцієнт кореляції (Пірсона) :

,

який набуває значень у межах , тому характеризує не лише щільність, а й напрям зв'язку. Додатне значення свідчить про прямий зв'язок, а від'ємне – про зворотний.

Щоб інтерпретувати , потрібно перейти до .

Істотність зв'язку перевіряють так само, як і в моделі аналітичного групування: порівнюють і . Відмінності стосуються лише визначення і , в яких – кількість параметрів рівняння регресії.

Аналіз та оцінювання взаємозв'язків між атрибутивними (описовими) ознаками виконують на підставі частот (часток) розподілу сукупності за двома взаємозалежними ознаками. Комбінаційний розподіл сукупності за факторною ознакою та результативною описується таблицями взаємної спряженості (співзалежності).

За наявності стохастичного зв'язку умовні розподіли змінюються (відрізняються) від групи до групи. Оцінка щільності зв'язку в таблицях взаємної спряженості ґрунтується на порівнянні (відхиленнях чи зіставленнях) частот (часток) умовного та безумовного розподілів.

Найпростішим є аналіз 4-клітинкової таблиці спряженості, на підставі якої може бути обчислений показник відношення шансів

,

де – частоти i-го рядка за факторною ознакою та j-го стовпця за результативною.

Відношення шансів характеризує міру відносного ризику фактора на результат і розраховується як відношення перехресних добутків частот.

Таблиці взаємної спряженості можуть використовуватись для аналізу взаємозв'язку не лише атрибутивних, а й кількісних ознак. Проте для останніх доцільно використовувати більш чутливі методи оцінювання кореляційного зв'язку та міри його щільності – кореляційне відношення та коефіцієнт детермінації.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]