Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие по статистике.doc
Скачиваний:
439
Добавлен:
19.03.2015
Размер:
2.64 Mб
Скачать

3.5.3. Корреляционно - регрессионный анализ

При статистических исследованиях корреляционных связей одной из главных задач является определение формы корреляционной связи, т.е. построение модели связи.

Для аналитических целей корреляционную связь представляют при помощи математических функций, т.е. придают ей функциональную форму. Под формой связи понимают тенденцию, которая проявляется в изменении результативного признака в связи с изменением признака – фактора.

Построение и анализ корреляционной модели связи осуществляются с помощью корреляционно – регрессионного анализа. Все этапы связаны между собой, границы их часто переплетаются и носят условный характер.

Форма корреляционной связи может быть выражена различными математическими функциями. Выбор формы связи решается на основе теоретического анализа существа изучаемых явлений и исследования эмпирических данных.

Эмпирическое исследование формы связи включают построение графиков корреляционных полей, эмпирических линий регрессии, а также анализ параллельных рядов. Изучение эмпирического материала дает возможность установить направление и форму связи.

Для определения вида функции необходимо применять комплекс приемов: экономический, логический, графический и математический.

Линейная форма связи может быть выражена уравнением прямой yx = a0 + a1Х.

где, yx - теоретические значения результативного признака;

Х – факторный признак;

a0 и a1- параметры уравнения связи.

Нелинейная форма связи показана:

уравнением параболы второго порядка yx = a0 + a1Х + a2Х2

уравнением гиперболы yx = a0 + a1

показательной функцией yx = a0 + a1х

степенной функцией yx = a0Ха1

и другими функциями.

Главной проблемой при построении модели связи является определение вида аналитической функции, которая отразит механизм связи между факторным и результативным признаками и даст количественную оценку этой связи.

Уравнением связи называется уравнение регрессии, а анализ, производимой с помощью уравнения регрессии, называется регрессионным анализом.

После установления вида функции для модели связи определяются параметры уравнения регрессии a0 и a1. Параметры уравнения регрессии определяются методом наименьших квадратов, суть которого состоит в том, что теоретическая линия регрессии должна быть проведена так, чтобы сумма квадратов отклонений эмпирических данных от теоретических была величиной минимальной. Исчисляя первые производные по a0 и a1 от функции.

(y - a0 - a1x)2→ min и приравнивая их к нулю, получаем систему нормальных уравнений вида: ∑y = na0 + а1∑х,

∑yх = a0∑х + а1∑х2.

Решая систему нормальных уравнений, определяем параметры a0 и a1 а0 = –a1

Параметр a1 называется коэффициентом регрессии и показывает изменения результативного признака при изменении факторного признака на единицу. Параметр a0 не имеет экономического содержания, так как может принимать отрицательные значения.

Для оценки влияния факторного признака на результативный применяется коэффициент эластичности. Он вычисляется для каждой точки и в среднем для всей совокупности. Теоретический коэффициент эластичности вычисляют по формуле:

(3.51)

где у'х – первая производная уравнения регрессии ух.

Средний коэффициент эластичности для уравнения прямой вычисляется так: (3.52.)

Коэффициент эластичности показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на один процент.

Уравнение регрессии имеет практическое значение. Сравнивая фактический объем продукции у отдельных предприятий с теоретическим, можно получить возможность его оценки с точки зрения средних условий существующих в данной совокупности предприятий.

При корреляционной связи невозможно изучить влияние всех факторов, поэтому для ориентировочной оценки тесноты связи между факторными и результативными признаками пользуются непараметрическими показателями статистики. К ним относятся:

  • Коэффициент корреляции знаков;

  • Коэффициент корреляции рангов;

  • Коэффициент ассоциации;

  • Коэффициент взаимной сопряженности.

Для числовой оценки возможной связи между двумя случайными величинами х и у используется линейный коэффициент парной корреляции. В зависимости от тесноты связи между данными случайными величинами, этот коэффициент может принимать значения от

-1 до +1. Чем ближе коэффициент корреляции к 1 (по модулю), тем связь теснее. Если коэффициент корреляции равен нулю, то х и у называют некорреляционными. Коэффициент корреляции служит показателем интенсивности линейной связи. В общем виде его формула выглядит:

(3.53) (3.54)

где σ – среднее квадратическое отклонение.

На практике чаще используется преобразованная формула Пирсона:

(3.55)

При любой форме связи для измерения тесноты корреляционной связи применяется теоретическое корреляционное отношение (3.56) и индекс корреляции(3.57), которые вычисляются по формулам:

(3.56) (3.57)

где η – теоретическое корреляционное отношение;

R – индекс корреляции;

Факторная дисперсия, характеризующая вариацию результативного признака под влиянием вариации признака – фактора определяется по следующей формуле:

(3.58.)

Общая дисперсия, характеризующая вариацию результативного признака под влиянием всех факторов, вызывающих эту вариацию, определяется по формуле:

(3.59.)

Остаточная дисперсия, характеризующая вариацию результативного признака под влиянием прочих неучтенных факторов, определяется по формуле:

(3.60.)

Индекс корреляции и теоретическое корреляционное отношение изменяются от 0 до 1 и показывают не только тесноту связи, но и степень пригодности подобранных функций связи.

η2, R – называются коэффициентами детерминации, которые показывают долю вариации результативного признака под влиянием вариации признака – фактора. Коэффициент детерминации используют в качестве критерия оценки подбора наилучшей модели связи.

Показатели тесноты корреляционной связи используется для выбора оптимального варианта формы связи. Если теоретический анализ не дает возможности дать однозначный ответ о форме связи, то необходимо строить уравнения регрессии с различными формами связи – линейные и нелинейные. Оценка пригодности модели связи осуществляется путем анализа коэффициента детерминации или индекса корреляции. Наилучшей считается модель с наибольшими значениями этих показателей.

При линейной форме связи теоретическое корреляционное отношение и линейный коэффициент корреляции равны.

Тесты и задания для самопроверки:

1.Вариация – это:

а) изменяемость величины признака у отдельных единиц совокупности; б) изменение структуры статистической совокупности во времени; в) изменение состава совокупности.

2. Наилучшей характеристикой для сравнения вариации различных совокупностей служит: а) размах вариации; б) дисперсия;

в) среднее квадратическое отклонение; г) коэффициент вариации.

3.Если увеличить все значения признака в 2 раза, то дисперсия от этого: а) уменьшится в 4 раза; б) увеличится в 4 раза;

в) не изменится; г) увеличится в 2 раза.

4. Признак совокупности принимает значения: 10, и 20. Частость первого из них 30%, второго – 70%. Определите коэффициент вариации, если среднее арифметическое значение равно 17. а среднее квадратическое отклонение - 4,1. а) 4,14% ; б) 24,1%.

5. Величина дисперсии альтернативного признака существует в интервале: а) 0,0- 0.25; б) 0,0 - 0,5; в) 0,0 - 1,0.

6. Какие из приведенных чисел могут быть значениями эмпирического корреляционного отношения:

а) 0,4; б) 2,7; в) 1; г) 0,7; д) 0,2; е) 0,9; ж) -2,5 з) – 1,5.

7. Общая дисперсия признака равна: а) дисперсии групповых средних (межгрупповой) плюс средней из внутригрупповых дисперсий;

б) дисперсии групповых (межгрупповой) минус средней из внутригрупповых дисперсий.

8. По вариации результативного признака имеются следующие данные: средняя из внутригрупповых дисперсий – 400; общая дисперсия – 1000. Какова при этом величина эмпирического корреляционного отношения? Она будет находиться в интервале: а) до 0,70;б) 0,70 – 0,75; в) 0,75 -0,80; г) 0,80 и более.

9. Средний уровень моментного ряда исчисляется как средняя взвешенная при: а) равных интервалах между датами; б) неравных интервалах между датами; как средняя хронологическая при: в) равных интервалах между датами; г) неравных интервалах между датами.

10. Средний уровень интервального ряда динамики определяется как:

а) средняя арифметическая простая; б) средняя арифметическая взвешенная; в) средняя хронологическая; г) средняя геометрическая.

11. Количество автомобилей марки на автобазе на 01.01. составило 49 шт. В течении месяца произошли следующие изменения: 11.01. – поступило три автомобиля, 16.01. – выбыло два. Определите среднее количество автомашин в январе. а) 50; б) 48; в) 52

12. Если сравниваются смежные уровни ряда динамики, показатели называются: а) цепными; б) базисными. Если все уровни ряда динамики сравниваются с одним и тем же уровнем, показатели называются: в) цепными; г) базисными.

13. Продажа мяса птицефабрики увеличилась за пять лет в 2,15 раза. Определить среднегодовой темп прироста мяса птицы птицефабрикой. а) 22,0 б) 21,09 в) 20,5.

14. Темп роста исчисляется как: а) разность уровней ряда; б) отношений уровней ряда; в) отношение абсолютного прироста к уровню ряда, взятому за базу сравнения; г) отношение абсолютного прироста к темпу роста.

15. Общий индекс представляет собой результат сравнения во времени или в пространстве общественного явления, состоящего из элементов: а) соизмеримых; б) несоизмеримых.

16. В общем индексе себестоимости индексируемой величиной является: а) качественный; б) количественный показатель; вес индекса фиксируется (постоянный) в) базисного; г) отчетного периода.

17. Индекс производительности труда равен 1,25. Как изменилась производительность труда в отчетном периоде по сравнению с базисной? а) повысилась на 25%, б) снизилась на 20%; в) повысилась на 1,25%; г) повысилась на 20%

18. Найти Ipq:

Изделие

q0 (шт.)

q1 (шт.)

p0 (руб.)

p1 (руб.)

1

2

2000

120

2926

160

2,0

430,0

2,0

310,0

а) 1,83; б) 1,49; в) 0,997; в)0,861

19. Физический объем продукции в отчетном периоде по сравнению с базисным возрос на 20%, а издержки производства уменьшились на 4%. Как изменилась себестоимость продукции (%)?

а)–20; б) +24; в) –10; г) +5.

20. Индекс трудоемкости равен 0,8. Как изменилась производительность труда в отчетном периоде по сравнению с базисным?

а)снизилась на 20%; б)снизилась на 0,8%; в)повысилась на 20%; г)повысилась на 25%.

21. Как изменились издержки производства в отчетном периоде по сравнению с базисным, если физический объем продукции возрос на 25%, себестоимость снизилась на 20%.а) возросли на 5%; б) возросли на 25%; в)снизилась на 20%; г) не изменилась.

22. Определите общий индекс себестоимости различных изделий, если их выпуск в среднем снизился на 20%, а общие денежные затраты на их производство (zq) не изменилась. а) 1,25, б) 0,8; в) 1,1.

23. Выборочная совокупность – это часть генеральной совокупности:

а) случайно попавшая в поле зрения исследователя; б) состоявшаяся из единиц, отобранных случайном порядке; в) состоявшаяся из единиц, номера которых отобраны в случайном порядке.

24. Отбор, при котором попавшая в выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор, является: а) повторным; б) бесповторным.

25.Укажите основные способы отбора единиц в выборочную совокупность из генеральной: а) собственно-случайный; б) механический;

в) монографический; г) анкетный; д) типический; е) серийный.

26. Отклонения выборочных характеристик от соответствующих характеристик генеральной совокупности, возникающее вследствие несплошного характера наблюдения, называется:

а) случайной ошибкой репрезентативности; б) систематической ошибкой репрезентативности.

27. Величина ошибки выборки зависит от: а) величины самого вычисляемого параметра; б) единиц измерения параметра; в) объема численности выборки.

28. Укажите, что произойдет с предельной ошибкой выборки, если дисперсию уменьшить в 4 раза, численность выборки увеличить в 9 раз, а вероятность исчисления изменится с 0,683 до 0,997 (t = 1 и t = 3): а) уменьшится в 18 раз; б) увеличится в 18 раз;

в) уменьшится в 2 раза; г) не изменится.

29. Малой выборкой называется выборочное наблюдение, объем которого: а) не превышает 30 единиц; б) не превышает 50 единиц.

30. Из партии готовой продукции методом случайного бесповторного отбора отобрано 250 изделий, из которых пять оказались бракованными. Определите с вероятностью 0,954 возможные пределы процента брака во всей партии. Объем выборки составляет 10% всего объема готовой продукции: а) 2% ± 1,6%; б) 10% ± 2%.

31. По характеру различают связи: а) функциональные и корреляционные; б) функциональные, криволинейные и прямые; в) корреляционные и обратные; г) статистические и прямые.

32. По прямой (положительной) связи с увеличением факторного признака: а) результативный признак уменьшается; б) результативный признак не изменяется; в) результативный признак увеличивается.

33. Какие методы используются для выявления наличия, характера и направления связи в статистике: а) средних величин; б) сравнения параллельных рядов; в) метод аналитической группировки; г) относительных величин; д) графический метод.

34. Коэффициент эластичности показывает: а) на сколько процентов изменяется функция с изменением аргумента на одну единицу своего измерения; б) на сколько процентов изменяется функция с изменением аргумента на 1%% в) на сколько единиц своего измерения изменяется функция с изменением аргумента на 1%.

35. Величина индекса корреляции, равная 1,587, свидетельствует:

а) об отсутствии взаимосвязи между признаками; б) о слабой их взаимосвязи; в) о заметной или сильной (тесной) взаимосвязи; г) об ошибках в вычислениях.