Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Novoe3

.doc
Скачиваний:
3
Добавлен:
16.03.2015
Размер:
187.39 Кб
Скачать

Использование статистических методов для анализа связей между показателями. Корреляционно-регрессионный анализ.

Невозможно управлять различными явлениями, предсказывать их развитие без изучения характера, силы и других особенностей связей между ними. Для этого используются различные методы исследования и измерения связей: общеэкономические, статистические, математические.

Статистические методы можно разделить на две группы:

1. традиционные (средних и относительных величин, индексный и др.);

2. математико-статистические (корреляционный анализ, регрессионный анализ, дисперсный анализ, ковариационный анализ, кластерный анализ).

Выбор того или иного метода определяется целью анализа, требованиями к степени детализации (глубины) анализа, к точности результатов, характером взаимосвязи между показателями.

Различают два типа связей между различными явлениями и их признаками: функциональную (детерминированную) и статистическую (стахостически детерминированную).

Функциональная связь – связь, при которой каждому значению одной переменной (факторному признаку) соответствует одно или несколько точно заданных значений другой переменной (результативного признака). Связь, при которой каждому значению факторного признака соответствует множество значений результативного признака (т.е. определенное статистическое распределение) – статистическая связь.

Частным случаем статистической связи является корреляционная связь. Это связь, при которой разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака х закономерным образом изменяется среднее значение признака у; в то время как в каждом отдельном случае значение признака у (с различными вероятностями) может принимать множество различных значений.

Например: корреляция между уровнями производительности труда рабочих и уровнем оплаты 1 ч труда (тарифной ставкой).

С одной стороны, уровень зарплаты – следствие производительности труда: чем она выше, тем выше и оплата. Но с другой стороны, установленные тарифные ставки и расценки играют стимулирующую роль: при правильной системе оплаты они выступают в качестве фактора, от которого зависит производительность труда.

Обязательным условием применения корреляционного метода является массовость значений изучаемых показателей, позволяющая выявить тенденцию, закономерность развития. Форма взаимосвязи между факторами и результативным показателем выявляется только тогда, когда для исследования используется большое количество наблюдений. Тогда в соответствии с законом больших чисел влияние других факторов сглаживается, нейтрализуется.

Корреляция может быть парной и множественной.

Парная корреляция – это связь между двумя показателями, один из которых является фактором, другой – результативным показателем.

Множественная корреляция – связь между несколькими факторами и одним результативным показателем.

Корреляционный анализ направлен на решение двух задач:

  • установление тесноты связи между двумя и более признаками;

  • количественную оценку влияния факторов на результативный показатель (зависимость результативного признака от значений одного или нескольких факторных признаков).

С помощью регрессионного анализа строятся математические модели зависимости между признаками.

Алгоритм расчета при корреляционно-регрессионном анализе связи парной корреляции состоит из ряда этапов.

Этап 1. Производится отбор наиболее важных существенных факторов, влияющих на результативный показатель.

При отборе факторов учитываются причинно-следственные связи между показателями, причем все факторы должны быть количественно измеримы, то есть иметь единицу измерения.

Большую помощь при отборе факторов для корреляционной модели оказывают аналитические группировки, способ сравнения параллельных и динамических рядов, линейные графики. Они позволяют определить наличие, направление и форму зависимости между изучаемыми показателями.

Отобранные для анализа показатели и результаты наблюдений за их изменением помещаются в таблицу, в которой факторные признаки располагаются в порядке возрастания или убывания, то есть ранжируются.

Этап 2. Данные из таблицы наносятся на плоскость координат – строится корреляционное поле (график).

Этап 3. Производится обоснование формы связи между факторами и результативным показателем:

  • по форме корреляционного поля (размещению точек на графике);

  • путем визуального анализа ранжированного ряда.

Форма связи определяет дальнейшие действия корреляционного анализа.

Этап 4. Выбор и решение уравнения регрессии. Выбор конкретного уравнения регрессии, адекватно описывающего форму связи, является довольно сложной процедурой. В условиях использования ПЭВМ выбор адекватной модели осуществляется перебором решений, наиболее часто применяемых в анализе парной корреляции уравнений регрессии.

Если связь носит прямолинейный характер, то наиболее простым уравнением, характеризующим зависимость между двумя показателями, является уравнение прямой:

,

где х – факторный показатель; у –результативный признак;

а и b – параметры уравнения регрессии.

Прямолинейное уравнение парной регрессии показывает равномерное возрастание или убывание результативного признака с изменением факторного.

Коэффициент регрессии b показывает, на сколько единиц в среднем изменяется результативный признак у с изменением на одну единицу факторного признака х. Эта величина на графике показывает угол наклона прямой.

Свободный член а показывает начальную ординату, то есть расстояние от начала координат до пересечения прямой с осью у.

Значения коэффициентов определяются методом наименьших квадратов (МНК). В соответствии с этим методом регрессионная зависимость определяется так, чтобы сумма квадратов отклонений вычисляемых значений от полученных опытным путем была минимальной, то есть:

;

где – число опытов.

Q принимает минимальное значение, если частные производные

и .

После дифференцирования получим:

Полученные уравнения называются нормальными уравнениями МНК для прямой линии.

Приравняв обе части к 0 и умножив их на , получим:

Суммируя каждый член уравнения в отдельности, получим:

Система нормальных уравнений будет иметь вид:

Таким образом, при решении этой системы уравнений могут быть вычислены оба параметра уравнения линейной регрессии.

Для измерения тесноты связи между показателями используется коэффициент корреляции.

При прямолинейной форме связи коэффициент корреляции рассчитывается по формуле:

.

Коэффициент корреляции может быть представлен и как среднее значение произведений нормированных отклонений .

.

Нормированные отклонения определяются по формулам:

; ,

где – средние квадратичные отклонения:

; .

Коэффициент корреляции может принимать значения от 0 до 1:

если , то связь между показателями отсутствует;

если , то связь между показателями – функциональная (детерминированная), то есть более тесная;

если – отрицательная величина, то связь между показателями обратная.

ПРИМЕР 1

Если связь между показателями криволинейная, то прежде всего определяются теоретические значения ух с помощью уравнения регрессии, которое описывает связь между изучаемыми показателями.

Нелинейная форма связи может быть представлена уравнением гиперболы, параболы, логарифмической функцией и т.д.

Если при увеличении одного показателя значения другого возрастают до определенного уровня, а потом начинают снижаться (например, зависимость производительности труда рабочих от их возраста), то для записи такой зависимости лучше всего подходит уравнение параболы второго порядка:

В соответствии с требованиями метода наименьших квадратов для определения параметров а, b и c необходимо решить систему трех уравнений:

Если при увеличении одной переменной значения другой увеличиваются до определенного уровня, а потом прирост снижается, то для записи криволинейной зависимости используется уравнение гиперболы:

Для определения ее параметров необходимо решить следующую систему:

При более сложном характере зависимости между показателями используются более сложные функции.

Таким образом, используя тот или иной тип математического уравнения, можно определить степень зависимости между изучаемыми явлениями, то есть узнать, на сколько единиц изменяется величина результативного показателя с изменением факторного на единицу.

Для измерения тесноты связи при криволинейной форме зависимости используется корреляционное отношение. Корреляционное отношение, или коэффициент корреляции, дает количественную оценку тесноты связи, характеризует силу влияния факторных признаков на результативные.

Количественная оценка тесноты связи в зависимости от корреляционного отношения приведена в табл. 1.

Таблица 1.

Количественная оценка тесноты связи при различных значениях корреляционного отношения

Величина корреляционного отношения

0,1 – 0,3

0,3 – 0,5

0,5 – 0,7

0,7 – 0,9

0,9 – 0,99

Теснота связи

Слабая

Умеренная

Заметная

Высокая

Весьма высокая

Общая формула корреляционного отношения:

,

где – среднее квадратичное отклонение у от теоретических значений ух, а ух определяется на основе уравнений регрессии;

– среднее квадратичное отклонение фактических значений у от среднего .

; .

Если коэффициент корреляции возвести в квадрат, то получим коэффициент (индекс) детерминации, который показывает, чему равна доля влияния изучаемого фактора на совокупный показатель.

При значениях тесноты связи меньше 0,7 величина индекса детерминации d всегда будет меньше 50%. Это означает, что на долю вариации факторного признака х приходится меньшая доля по сравнению с другими признаками, влияющими на изменение результативного показателя.

Если значения показателей тесноты связи более 0,7, выбирается уравнение регрессии, с помощью которого описывается форма связи между показателями.

ПРИМЕР 2

Экономические явления и процессы хозяйственной деятельности предприятий зависят от большого количества факторов. Как правило, каждый фактор в отдельности не определяет изучаемое явление во всей полноте. Только комплекс факторов в их взаимосвязи может дать более или менее полное представление о характере изучаемого явления.

На практике значительно чаще встречаются многомерные зависимости, то есть такие, в которых результирующий параметр зависит от многих факторов, и зависимости между ними нелинейные.

Например, увеличение фондовооруженности труда рабочих дает разный прирост производительности труда на разных предприятиях даже при очень выровненных прочих условиях. Это объясняется тем, что все факторы, от которых зависит производительность труда, действуют в комплексе, взаимосвязано. В зависимости от того, насколько оптимально сочетаются разные факторы, будет неодинаковой степень воздействия каждого из них на величину результативного показателя.

Применение многофакторного корреляционного анализа позволяет изучить закономерности изменения результативного показателя в зависимости от поведения разных факторов.

Многофакторный корреляционный анализ состоит из нескольких этапов.

На первом этапе определяются факторы, которые оказывают воздействие на изучаемый показатель, и отбираются наиболее существенные для корреляционного анализа.

На втором этапе собирается и оценивается исходная информация, необходимая для корреляционного анализа.

На третьем этапе изучается характер и моделируется связь между факторами и результативным показателем, то есть подбирается и обосновывается математическое уравнение, которое наиболее точно выражает сущность исследуемой зависимости.

На четвертом этапе проводится расчет основных показателей связи корреляционного анализа.

На пятом этапе дается статистическая оценка результатов корреляционного анализа и практическое их применение.

На этапе I при отборе факторов учитываются следующие условия:

  1. между показателями должна быть причинно-следственная связь;

  2. необходимо выбирать самые значимые факторы, которые оказывают решающее воздействие на результативный показатель;

  3. все факторы должны быть количественно измеримы, то есть иметь единицу измерения;

  4. связь между результативным показателем и факторами не должна быть функциональной.

Например, для многофакторной корреляционной модели уровня рентабельности (у) подобраны следующие факторы, которые оказывают наиболее существенное влияние на ее уровень:

х1 – материалоотдача, руб.;

х2 – фондоотдача, коп.;

х3 – производительность труда (среднегодовая выработка продукции на одного работника), млн. руб.;

х4 – продолжительность оборота оборотных средств предприятия, дни;

х5 – удельный вес продукции высшей категории качества, %.

Так как корреляционная связь со всей полнотой проявляется только в массе наблюдений, то объем выборки данных должен быть большим.

Следующим этапом (II) анализа является сбор и статистическая оценка исходной информации. Эта информация должна быть проверена на достоверность, однородность и соответствие закону нормального распределения.

Критерием однородности информации служит среднеквадратическое отклонение и коэффициент вариации, которые рассчитываются по каждому факторному и результативному показателю.

Среднеквадратическое отклонение показывает абсолютное отклонение индивидуальных значений от среднеарифметического и определяется:

Коэффициент вариации характеризует относительную меру отклонения отдельных значений от среднеарифметической:

.

Если вариация более 33%, то информация неоднородна и необходимо исключить нетипичные наблюдения, то есть уменьшить объем выборки данных.

При проверке соответствия исходной информации закону нормального распределения учитывается условие: основная масса исследуемых сведений по каждому показателю должна быть сгруппирована около ее среднего значения, а объекты с малыми или очень большими значениями должны встречаться реже.

После отбора факторов и оценки исходной информации важной задачей в корреляционном анализе является моделирование связи между факторным и результативными показателями (этап III), то есть подбор соответствующего уравнения, которое наилучшим образом описывает изучаемые зависимости.

Если связь всех факторных показателей с результативным носит прямолинейный характер, то для записи этих зависимостей можно использовать линейную функцию:

.

Если связь между результативным и факторными показателями носит криволинейный характер, то может быть использована степенная функция:

или логарифмическая:

Приведенные модели выгодны тем, что их параметрам () можно дать экономическое объяснение. В линейной модели коэффициенты показывают, на сколько единиц изменяется результативный показатель и изменением факторного на единицу в абсолютном выражении, в степенных и логарифмических – в процентах.

В случаях, когда трудно обосновать форму зависимости, решение задачи можно провести по разным моделям и сравнить полученные результаты.

Решение задачи многофакторного корреляционного анализа проводится на ПЭВМ по типовым программам (например, используя табличный процессор Ехсеl, статистические функции).

Сначала формируется матрица исходных данных (таблица 3), в первой колонке которой записывается порядковый номер наблюдения, во второй – результативный показатель (у), а в следующих – факторные показатели (хi).

Таблица 3

Номер наблюдения

Фактор

Результирующий показатель

x1

x2

...

xn

y

1

x11

x12

x1n

y1

2

x21

x22

x2n

y2

m

xm1

xm2

xmn

yn

Эти сведения вводятся в ПЭВМ ( Microsoft Excel) и рассчитываются матрицы парных и частных коэффициентов корреляции, уравнение множественной регрессии, а также показатели, с помощью которых оценивается надежность коэффициентов корреляции и уравнения связи: критерий Стъюдента, критерий Фишера, средняя ошибка аппроксимации, множественные коэффициенты корреляции и детерминации.

Коэффициенты парной корреляции характеризуют тесноту связи между двумя показателями в общем виде с учетом взаимосвязей факторов, оказывающих воздействие на результативный показатель.

Чтобы получить количественную характеристику связи между результативным и факторными показателями в чистом виде, то есть без учета влияния других факторов, рассчитываются частные коэффициенты корреляции.

При определении коэффициентов корреляции необходимо учитывать, что в корреляционной модели факторы должны быть независимы друг от друга. Если в матрице коэффициент корреляции двух факторов выше 0,85, то один из них необходимо исключить из модели.

Значимость коэффициентов корреляции проверяется по критерию Стъюдента:

,

где – коэффициент корреляции;

– среднеквадратическая ошибка коэффициента корреляции, которая определяется по формуле:

,

где – количество наблюдений.

Табличные значения находят по таблице критериев Стъюдента. При этом учитываются количество степеней свободы () и уровень доверительной вероятности.

Если расчетное значение выше табличного, то связь между результативным и факторными показателями является надежной, а величина коэффициента корреляции – значимой.

Следующий этап (этап IV) корреляционного анализа – расчет уравнения связи (регрессии).

Решение проводится обычно шаговым способом. Сначала в расчет принимается один фактор, который оказывает наиболее значимое влияние на результативный показатель, потом второй, третий и т.д. И на каждом шаге рассчитывается уравнение связи, множественный коэффициент корреляции R и детерминации D, критерий Фишера F, стандартная ошибка ε и другие показатели, с помощью которых оценивается надежность уравнения связи. Величина их на каждом шаге сравнивается с предыдущей.

Критерий Фишера (F - отношение) рассчитывается следующим образом:

где – индивидуальные значения результативного показателя, рассчитанные по уравнению; – среднее значение результативного показателя, рассчитанное по уравнению; – фактические индивидуальные значения результативного показателя; m – количество параметров в уравнении связи, учитывая свободный член уравнения; n – количество наблюдений.

Фактическая величина F сравнивается с табличной. Она должна быть больше.

Средняя ошибка аппроксимации определяется по формуле:

.

Величина средней ошибки аппроксимации тем меньше, чем меньше отклонение теоретической линии регрессии (рассчитанной по уравнению) от фактической.

Чем выше величина коэффициентов множественной корреляции, детерминации и критерия Фишера и чем ниже величина стандартной ошибки, тем точнее уравнение связи описывает зависимости между исследуемыми показателями. Если добавление следующих факторов не улучшает оценочных показателей связи, то надо их отбросить, то есть остановиться на том уравнении, где эти показатели наиболее оптимальны.

Полученное уравнение можно использовать для практических целей:

  1. для оценки результатов хозяйственной деятельности;

  2. для расчета влияния факторов на прирост результативного показателя;

  3. для подсчета резервов повышения уровня исследуемого показателя;

  4. для планирования и прогнозирования его величины.

При планировании и прогнозировании уровня результативного показателя необходимо в полученное уравнение связи подставить плановый (прогнозный) уровень факторных показателей.

Таким образом, многофакторный корреляционный анализ имеет важную практическую значимость. Он позволяет изучить закономерности изменения результативного показателя в зависимости от поведения разных факторов, определить их влияние на величину результативного показателя, установить, какие из них являются основными, а какие второстепенными. Этим достигается более объективная оценка деятельности предприятия, более точное и полное определение внутрихозяйственных резервов и планового уровня показателей.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]