Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2.doc
Скачиваний:
8
Добавлен:
16.03.2015
Размер:
302.59 Кб
Скачать

Лабораторная работа

ИСПОЛЬЗОВАНИНЕ СТАТИСТИЧЕСКИХ МЕТОДОВ ДЛЯ АНАЛИЗА СВЯЗЕЙ МЕЖДУ ПОКАЗАТЕЛЯМИ. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ

Использование статистических методов для анализа связей между показателями. Корреляционно-регрессионный анализ.

Цель работы – на основе заданных статистических данных методом корреляционно-регрессионного анализа оценить параметры модели зависимости двух показателей, используя табличный процессор Excel.

Классификация статистических методов анализа связей

Для изучения характера и силы связей между различными явлениями используются различные методы исследования и измерения: общеэкономические, статистические, математические.

Статистические методы можно разделить на две группы:

1. традиционные (средних и относительных величин, индексный и др.);

2. математико-статистические (корреляционный анализ, регрессионный анализ, дисперсный анализ, ковариационный анализ, кластерный анализ).

Выбор того или иного метода определяется целью анализа, требованиями к степени детализации анализа, к точности результатов, характером взаимосвязи между показателями.

Различают два типа связей между различными явлениями и их признаками: функциональную и статистическую.

Функциональная связь – связь, при которой каждому значению одной переменной (факторному признаку) соответствует одно или несколько точно заданных значений другой переменной (результативного признака). Связь, при которой каждому значению факторного признака соответствует множество значений результативного признака, то есть определенное статистическое распределение – статистическая связь.

Частным случаем статистической связи является корреляционная связь. Это связь, при которой разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака х закономерным образом изменяется среднее значение признака у; в то время как в каждом отдельном случае значение признака у с различными вероятностями может принимать множество различных значений.

Например: корреляция между уровнями производительности труда рабочих и уровнем оплаты 1 ч труда (тарифной ставкой).

С одной стороны, уровень зарплаты – следствие производительности труда: чем она выше, тем выше и оплата. Но с другой стороны, установленные тарифные ставки и расценки играют стимулирующую роль: при правильной системе оплаты они выступают в качестве фактора, от которого зависит производительность труда.

Для исследования такого вида связи будем используется корреляционно-регрессионный анализ.

Обязательным условием применения метода является массовость значений изучаемых показателей, позволяющая выявить закономерность развития.

Задачи корреляционного и регрессионного анализа

Корреляция может быть парной и множественной.

Парная корреляция – это связь между двумя показателями, один из которых является фактором, другой – результативным показателем.

Множественная корреляция – связь между несколькими факторами и одним результативным показателем.

Корреляционный анализ направлен на решение двух задач:

  • установление тесноты связи между двумя и более признаками;

  • количественную оценку влияния факторов на результативный показатель.

С помощью регрессионного анализа строятся математические модели зависимости между признаками.

Алгоритм корреляционно-регрессионного анализа парной связи

Алгоритм расчета при корреляционно-регрессионном анализе связи парной корреляции состоит из ряда этапов.

Этап 1. Производится отбор наиболее важных существенных факторов, влияющих на результативный показатель.

При отборе факторов учитываются причинно-следственные связи между показателями, причем все факторы должны быть количественно измеримы.

При отборе факторов для корреляционной модели используют аналитические группировки, способ сравнения параллельных и динамических рядов, линейные графики. Они позволяют определить наличие, направление и форму зависимости между изучаемыми показателями.

Отобранные для анализа показатели и результаты наблюдений за их изменением помещаются в таблицу, в которой факторные признаки располагаются в порядке возрастания или убывания.

Для лабораторной работы таблица изменения двух показателей представлена в Задании.

Этап 2. Данные из таблицы наносятся на плоскость координат – строится корреляционное поле (график).

Этап 3. Производится обоснование формы связи между факторами и результативным показателем:

  • по форме корреляционного поля (размещению точек на графике);

  • путем визуального анализа ранжированного ряда.

Форма связи определяет дальнейшие действия корреляционного анализа.

Этап 4. Выбор и решение уравнения регрессии.

В условиях использования ПЭВМ выбор модели (уравнения), описывающего зависимость между показателями, осуществляется перебором решений, наиболее часто применяемых в анализе парной корреляции уравнений регрессии.

Если связь носит прямолинейный характер, то наиболее простым уравнением, характеризующим зависимость между двумя показателями, является уравнение прямой:

,

где х – факторный показатель;

у – результативный признак;

а и b – параметры уравнения регрессии.

Прямолинейное уравнение парной регрессии показывает равномерное возрастание или убывание результативного признака с изменением факторного.

Коэффициент регрессии b показывает, на сколько единиц в среднем изменяется результативный признак у с изменением на одну единицу факторного признака х. Эта величина на графике показывает угол наклона прямой.

Свободный член а показывает начальную ординату, то есть расстояние от начала координат до пересечения прямой с осью у.

Значения коэффициентов определяются методом наименьших квадратов (МНК). В соответствии с этим методом регрессионная зависимость определяется так, чтобы сумма квадратов отклонений вычисляемых значений от полученных опытным путем была минимальной, то есть:

;

где – число опытов.

Q принимает минимальное значение, если частные производные

и .

После дифференцирования получим:

Полученные уравнения называются нормальными уравнениями МНК для прямой линии.

Приравняв обе части к 0 и умножив их на , получим:

Суммируя каждый член уравнения в отдельности, получим:

Система нормальных уравнений будет иметь вид:

Таким образом, при решении этой системы уравнений могут быть вычислены оба параметра уравнения линейной регрессии.

Для измерения тесноты связи между показателями используется коэффициент корреляции.

При прямолинейной форме связи коэффициент корреляции рассчитывается по формуле:

.

Коэффициент корреляции может быть представлен и как среднее значение произведений нормированных отклонений .

.

Нормированные отклонения определяются по формулам:

; ,

где – средние квадратичные отклонения:

; .

Коэффициент корреляции может принимать значения от 0 до 1:

если , то связь между показателями отсутствует;

если , то связь между показателями – функциональная, то есть более тесная;

если – отрицательная величина, то связь между показателями обратная, то есть параметры х и у связаны убывающей зависимостью.

Применение корреляционно-регрессионного анализа рассмотрим на примере прямолинейной зависимости между фактором х и результативным признаком у.

Пример №1: Имеются данные по фирме (таблица 1). Провести корреляционно-регрессионный анализ зависимости суммы прибыли (Yi,) от объема выручки (Xi).

Таблица 1