- •Раздел I
- •Глава 1. Статистика как наука
- •1.1. Понятие статистики и краткие сведения из ее истории
- •1.2. Предмет статистики
- •1.3. Метод статистики
- •1.4. Основные категории статистики
- •1.5. Задачи статистики и основные направления ее реформирования
- •Контрольные вопросы
- •Глава 2. Источники статистической информации
- •2.2. Статистическое наблюдение
- •2.2.1. Понятие о статистическом наблюдении
- •2.2.2. Программно-методологические вопросы статистического наблюдения
- •2.2.3. Формы, виды и способы наблюдения
- •Глава 3. Сводка и группировка материалов статического наблюдения
- •3.1. Сводка статистических данных
- •3.2. Задачи и виды группировок
- •3.3. Выполнение группировки по количественному признаку
- •Группировка акционеров по размеру выплаты дивидендов на одну акцию
- •Вторичная группировка акционеров по размеру дивидендов на одну акцию (группировка единая)
- •3.4. Статистические ряды распределения
- •Контрольные вопросы
- •Глава 4. Абсолютные и относительные статистические величины
- •4.1. Абсолютные статистические величины
- •4.2. Относительные статистические величины
- •Контрольные вопросы
- •Глава 5. Средние величины и показатели вариации
- •5.1. Понятие о средних величинах
- •5.2.1. Средняя арифметическая
- •Распределение рабочих по среднему стажу работы
- •5.2.2. Расчет средней арифметической в рядах распределения
- •Распределение рабочих ао по уровню оплаты труда
- •Распределение предприятий региона по стоимости основных производственных фондов (опф)
- •5.2.3. Средняя гармоническая
- •Цена и выручка от реализации по трем коммерческим магазинам
- •Информация о вкладах в банке для расчета средних значений
- •5.2.4. Средняя геометрическая
- •5.2.5. Средняя квадратическая и средняя кубическая
- •5.2.6 Структурные средние
- •5.3.Показатели вариации
- •Распределение рабочих по сменной выработке изделия а и расчетные значения для исчисления показателей вариации
- •5.3.1 .Правило сложения дисперсий
- •Распределение рабочих по среднечасовой выработке изделий
- •Контрольные вопросы
- •Глава 6. Выборочный метод в статистике
- •6.1. Понятие о выборочном наблюдении, его задачи
- •6.2. Ошибки выборки
- •6.3. Распространение выборочных результатов на генеральную совокупность
- •Распределение урожайности по хозяйствам региона, имеющим различную форму собственности
- •Контрольные вопросы
- •Глава 7. Статистическое изучение динамики
- •7.1. Понятие о рядах динамики
- •Добыча нефти в Российской Федерации, млн. Т:
- •7.2. Правила построения рядов динамики
- •Динамика объема реализации продукции фирмы «Весна» в сопоставимых ценах, млн. Руб. (по годам)
- •7.3. Показатели анализа ряда динамики
- •Динамика производства электроэнергии в Российской Федерации
- •Динамика объемов производства продукции машиностроения и металлообработки (в сопоставимых ценах 1990 г., млн. Руб.), и базисные темпы изменения объемов производства
- •Остатки вкладов в сберегательных банках на начало месяца, млн. Руб.
- •Динамика промышленного производства отрасли
- •7.4. Методы анализа основной тенденции развития в рядах динамики
- •Объем производства продукции предприятия (по месяцам) в сопоставимых ценах, млн. Руб.
- •Объем производства продукции предприятия (по кварталам) в сопоставимых ценах, руб.
- •Исходные данные и результаты расчета скользящей средней, ц/га
- •Выравнивание по прямой ряда динамики урожайности зерновых культур
- •7.5. Методы изучения сезонных колебаний
- •Яйценоскость по месяцам года и расчет индексов
- •7.6. Экстраполяция в рядах динамики и прогнозирование
- •Контрольные вопросы
- •Глава 8. Экономические индексы
- •8.1. Индексы и их классификация
- •8.2. Общие индексы количественных показателей
- •Выработка продукции на предприятии
- •8.3. Общие индексы качественных показателей
- •Продажа товаров на рынке
- •Данные о продаже товаров
- •8.4. Индексы средних величин
- •Среднемесячная заработная плата и число работников
- •8.5. Базисные и цепные индексы
- •Контрольные вопросы
- •Глава 9. Статистические методы изучения взаимосвязи социально-экономических явлений
- •9.1. Стохастико-детерминированный характер социально-экономических явлений и виды связей между ними
- •9.1.1. Функциональные
- •9.2. Статистические методы моделирования связи
- •9.2.1. Простейшие методы изучения стохастических связей
- •9.2.2. Статистическое моделирование связи методом корреляционного и регрессионного
- •9.2.2.1 Корреляционный и регрессионный анализ
- •9.2.2.2. Двухмерная линейная модель
- •Распределение рабочих бригады по выработке и стажу работы
- •От стажа работы х (по данным табл. 9.1)
- •9.2.2.3 Проверка адекватности
- •Расчетные значения, необходимые для исчисления дост, дx
- •9.2.2.4. Экономическая интерпретация параметров регрессии
- •9.2.2.5. Многофакторный корреляционный и регрессионный анализ
- •9.2.2.6. Построение и статистический анализ
- •9.2.2.7. Трехфакторные линейные регрессионные модели
- •Стохастическая связь между производительностью труда, внутрисменными простоями и квалификацией рабочих
- •К расчету параметров и оценке линейной двухфакторной регрессионной модели
- •9.2.2.8. Парные коэффициенты корреляции
- •9.2.2.9. Частные коэффициенты корреляции
- •9.2.2.10.Совокупный коэффициент множественной
- •9.2.2.11. Совокупный коэффициент множественной детерминации
- •9.2.2.12. Многошаговый регрессионный анализ
- •9.2.2.13. Экономическая интерпретация многофакторной регрессионной модели
- •9.3. Непараметрические методы
- •Распределение отцов и сыновей по росту, чел.
- •Распределение семей по уровню образования мужа и жены
9.2.2.10.Совокупный коэффициент множественной
корреляции
Показателем тесноты связи, устанавливаемой между результативными и двумя или более факторными признаками, является совокупный коэффициент множественной корреляции . В случае линейной двухфакторной связи совокупный коэффициент множественной корреляции может быть рассчитан по формуле:
(9.22)
где r — линейные коэффициенты корреляции (парные); подстрочные индексы показывают, между какими признаками они исчисляются.
Совокупный коэффициент множественной корреляции измеряет одновременное влияние факторных признаков на результативный. Его значения находятся в пределах -1 до +1. Чем меньше наблюдаемые значения изучаемого показателя отклоняются от линии множественной регрессии, тем корреляционная связь является более интенсивной, а следовательно, значение R ближе к единице.
9.2.2.11. Совокупный коэффициент множественной детерминации
Совокупным коэффициентом множественной детерминации называется величина R2, которая показывает, какая доля вариации изучаемого показателя объясняется влиянием факторов, включенных в уравнение множественной регрессии. Значение совокупного коэффициента множественной детерминации находится в пределах от 0 до 1. Поэтому, чем ближе R2 к единице, тем вариация изучаемого показателя в большей мере характеризуется влиянием отобранных факторов.
Для выявления, в нашем примере, тесноты связи производительности труда с обоими факторами одновременно исчисляем совокупный коэффициент множественной корреляции:
Совокупный коэффициент множественной детерминации = 0,749 показывает, что вариация производительности труда на 74,9 % обусловливается двумя анализируемыми факторами. Значит, выбранные факторы существенно влияют на показатель производительности труда. Таким образом, изучаемая с помощью многофакторного корреляционного и регрессионного анализа стохастическая связь между исследуемыми показателями свидетельствует о целесообразности построения двухфакторной регрессионной модели производительности труда в виде линейного уравнения регрессии:
=81,03-0,41 x1+3,37х2.
9.2.2.12. Многошаговый регрессионный анализ
Однако показатели множественной регрессии и корреляции могут оказаться подверженными действию случайных факторов. Поэтому только после проверки адекватности уравнения оно может быть пригодно, например, для выявления резервов повышения производительности труда.
Общая оценка адекватности уравнения может быть получена с помощью дисперсионного F-критерия Фишера. Применение же в этих целях множественного коэффициента корреляции недопустимо ввиду того, что многофакторный регрессионный анализ оперирует случайными наблюдениями, но не обязательно распределенными по многомерному нормальному закону (этому закону должны подчиняться отклонения фактических значений функции от расчетных). Совокупный коэффициент множественной детерминации определяет только качество выравнивания по уравнению регрессии.
Проверку значимости уравнения регрессии производят на основе вычисления F-критерия Фишера:
(9.23)
где m- число параметров в уравнении регрессии.
Полученное значение — критерия Fpacч сравнивают с критическим (табличным) для принятого уровня значимости 0,05 или 0,01 и чисел степеней свободы ν1 = m — 1 и ν2 = n- m. Если оно окажется больше соответствующего табличного значения, то данное уравнение регрессии статистически значимо, т. е. доля вариации, обусловленная регрессией, намного превышает случайную ошибку.
Принято считать, что уравнение регрессии пригодно для практического использования в том случае, если Fpacч > Fтабл не менее чем в 4 раза.
Для оценки значимости коэффициентов регрессии при линейной зависимости у от x1 и x2 - (двух факторов) используют t-критерий Стьюдента при n-m-1 степенях свободы:
(9.24, a)
(9.24, б)
Существенность совокупного коэффициента корреляции определяют по формуле:
(9.25)
Значения оцениваемых a1, a2, берутся по модулю.
Если в уравнении все коэффициенты регрессии значимы, то данное уравнение признают окончательным и применяют в качестве модели изучаемого показателя для последующего анализа.
Оценку значимости коэффициентов регрессии с помощью t-критерия используют для завершения отбора существенных факторов в процессе многошагового регрессионного анализа. Он заключается в том, что после оценки значимости всех коэффициентов регрессии из модели исключают тот фактор, коэффициент при котором незначим и имеет наименьшее значение критерия. Затем уравнение регрессии строится без исключенного фактора, и снова проводится оценка адекватности уравнения и значимости коэффициентов регрессии. Такой процесс длится до тех пор, пока все коэффициенты регрессии не окажутся значимыми, что свидетельствует о наличии в регрессионной модели только существенных факторов. В некоторых случаях расчетное значение tрасч находится вблизи tтабл, поэтому с точки зрения содержательности модели такой фактор можно оставить для последующей проверки его значимости в сочетании с другим набором факторов.
Последовательный отсев несущественных факторов рассмотренным выше приемом (или последовательным включением новых факторов) составляет основу многошагового регрессионного анализа.
Проверим адекватность построенной двухфакторной модели производительности труда по F-критерию Фишера:
Табличное значение F-критерия при доверительной вероятности 0.95, т. е. (1-0,05) при н1 = т - 1 = 2 - 1 = 1; н2= n - т = 20 -2 = 18 составляет 4,41.
Поскольку Fpacч > Fтабл уравнение регрессии = 81,03-0,41 x1+3,37 x2 следует признать адекватным.
Значимость a1 , a2 и оценим t-критерием Стьюдента:
Табличное значение t-критерия при 5 %-ном уровне значимости и 17степенях свободы (n-m = 20—2—1 = 17) составляет 2,11. Так как соответствующие tрасч> tтабл, оба фактора a1, a2 и совокупный коэффициент корреляции следует признать значимыми (существенными).
Таким образом, построенная регрессионная модель производительности труда = 81,03 -0,41 x1+3,37 x2 пригодна для практического
применения. Она может быть использована для выявления резервов повышения производительности труда.