- •Раздел I
- •Глава 1. Статистика как наука
- •1.1. Понятие статистики и краткие сведения из ее истории
- •1.2. Предмет статистики
- •1.3. Метод статистики
- •1.4. Основные категории статистики
- •1.5. Задачи статистики и основные направления ее реформирования
- •Контрольные вопросы
- •Глава 2. Источники статистической информации
- •2.2. Статистическое наблюдение
- •2.2.1. Понятие о статистическом наблюдении
- •2.2.2. Программно-методологические вопросы статистического наблюдения
- •2.2.3. Формы, виды и способы наблюдения
- •Глава 3. Сводка и группировка материалов статического наблюдения
- •3.1. Сводка статистических данных
- •3.2. Задачи и виды группировок
- •3.3. Выполнение группировки по количественному признаку
- •Группировка акционеров по размеру выплаты дивидендов на одну акцию
- •Вторичная группировка акционеров по размеру дивидендов на одну акцию (группировка единая)
- •3.4. Статистические ряды распределения
- •Контрольные вопросы
- •Глава 4. Абсолютные и относительные статистические величины
- •4.1. Абсолютные статистические величины
- •4.2. Относительные статистические величины
- •Контрольные вопросы
- •Глава 5. Средние величины и показатели вариации
- •5.1. Понятие о средних величинах
- •5.2.1. Средняя арифметическая
- •Распределение рабочих по среднему стажу работы
- •5.2.2. Расчет средней арифметической в рядах распределения
- •Распределение рабочих ао по уровню оплаты труда
- •Распределение предприятий региона по стоимости основных производственных фондов (опф)
- •5.2.3. Средняя гармоническая
- •Цена и выручка от реализации по трем коммерческим магазинам
- •Информация о вкладах в банке для расчета средних значений
- •5.2.4. Средняя геометрическая
- •5.2.5. Средняя квадратическая и средняя кубическая
- •5.2.6 Структурные средние
- •5.3.Показатели вариации
- •Распределение рабочих по сменной выработке изделия а и расчетные значения для исчисления показателей вариации
- •5.3.1 .Правило сложения дисперсий
- •Распределение рабочих по среднечасовой выработке изделий
- •Контрольные вопросы
- •Глава 6. Выборочный метод в статистике
- •6.1. Понятие о выборочном наблюдении, его задачи
- •6.2. Ошибки выборки
- •6.3. Распространение выборочных результатов на генеральную совокупность
- •Распределение урожайности по хозяйствам региона, имеющим различную форму собственности
- •Контрольные вопросы
- •Глава 7. Статистическое изучение динамики
- •7.1. Понятие о рядах динамики
- •Добыча нефти в Российской Федерации, млн. Т:
- •7.2. Правила построения рядов динамики
- •Динамика объема реализации продукции фирмы «Весна» в сопоставимых ценах, млн. Руб. (по годам)
- •7.3. Показатели анализа ряда динамики
- •Динамика производства электроэнергии в Российской Федерации
- •Динамика объемов производства продукции машиностроения и металлообработки (в сопоставимых ценах 1990 г., млн. Руб.), и базисные темпы изменения объемов производства
- •Остатки вкладов в сберегательных банках на начало месяца, млн. Руб.
- •Динамика промышленного производства отрасли
- •7.4. Методы анализа основной тенденции развития в рядах динамики
- •Объем производства продукции предприятия (по месяцам) в сопоставимых ценах, млн. Руб.
- •Объем производства продукции предприятия (по кварталам) в сопоставимых ценах, руб.
- •Исходные данные и результаты расчета скользящей средней, ц/га
- •Выравнивание по прямой ряда динамики урожайности зерновых культур
- •7.5. Методы изучения сезонных колебаний
- •Яйценоскость по месяцам года и расчет индексов
- •7.6. Экстраполяция в рядах динамики и прогнозирование
- •Контрольные вопросы
- •Глава 8. Экономические индексы
- •8.1. Индексы и их классификация
- •8.2. Общие индексы количественных показателей
- •Выработка продукции на предприятии
- •8.3. Общие индексы качественных показателей
- •Продажа товаров на рынке
- •Данные о продаже товаров
- •8.4. Индексы средних величин
- •Среднемесячная заработная плата и число работников
- •8.5. Базисные и цепные индексы
- •Контрольные вопросы
- •Глава 9. Статистические методы изучения взаимосвязи социально-экономических явлений
- •9.1. Стохастико-детерминированный характер социально-экономических явлений и виды связей между ними
- •9.1.1. Функциональные
- •9.2. Статистические методы моделирования связи
- •9.2.1. Простейшие методы изучения стохастических связей
- •9.2.2. Статистическое моделирование связи методом корреляционного и регрессионного
- •9.2.2.1 Корреляционный и регрессионный анализ
- •9.2.2.2. Двухмерная линейная модель
- •Распределение рабочих бригады по выработке и стажу работы
- •От стажа работы х (по данным табл. 9.1)
- •9.2.2.3 Проверка адекватности
- •Расчетные значения, необходимые для исчисления дост, дx
- •9.2.2.4. Экономическая интерпретация параметров регрессии
- •9.2.2.5. Многофакторный корреляционный и регрессионный анализ
- •9.2.2.6. Построение и статистический анализ
- •9.2.2.7. Трехфакторные линейные регрессионные модели
- •Стохастическая связь между производительностью труда, внутрисменными простоями и квалификацией рабочих
- •К расчету параметров и оценке линейной двухфакторной регрессионной модели
- •9.2.2.8. Парные коэффициенты корреляции
- •9.2.2.9. Частные коэффициенты корреляции
- •9.2.2.10.Совокупный коэффициент множественной
- •9.2.2.11. Совокупный коэффициент множественной детерминации
- •9.2.2.12. Многошаговый регрессионный анализ
- •9.2.2.13. Экономическая интерпретация многофакторной регрессионной модели
- •9.3. Непараметрические методы
- •Распределение отцов и сыновей по росту, чел.
- •Распределение семей по уровню образования мужа и жены
Расчетные значения, необходимые для исчисления дост, дx
у- |
(у- )2 |
- |
( - )2 |
y- |
|
-3,3 |
10,89 |
-2,7 |
7,29 |
-0,6 |
0,36 |
-2,3 |
5,29 |
-2,1 |
4,41 |
-0,2 |
0,04 |
-1,3 |
1,69 |
-1,5 |
2,25 |
0,2 |
0,04 |
-0,3 |
0,09 |
-0,9 |
0,81 |
0,6 |
0,36 |
-0,3 |
0,09 |
-0,3 |
0,09 |
0,0 |
0,0 |
0,7 |
0,49 |
0,3 |
0,09 |
0,4 |
0,16 |
0,7 |
0,49 |
0,9 |
0,81 |
-0,2 |
0,04 |
1,7 |
2,89 |
1,5 |
2,25 |
0,2 |
0,04 |
2,7 |
7,29 |
2,1 |
4,41 |
0,6 |
0,36 |
1,7 |
2,89 |
2,7 |
7,29 |
-1,0 |
1,0 |
Итого |
32,10 |
— |
29,70 |
— |
2,40 |
Средние квадратические отклонения (см. табл. 9.1):
=2,87.
Расчетные значения t- критерия Стьюдента:
По таблице распределения Стьюдента для ν= 8 находим критическое значение t-критерия: (tтабл= 3,307 при α = 0,05).
Поскольку расчетное значение tрасч>tтабл, оба параметра a0, a1 признаются значимыми (отклоняется гипотеза о том, что каждый из этих параметров в действительности равен нулю, и лишь в силу случайных обстоятельств оказался равным проверяемой величине).
Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношением ηэ, когда (межгрупповая дисперсия) характеризует отклонения групповых средних результативного признака от общей средней: ηэ = .
Говоря о корреляционном отношении как о показателе измерения тесноты зависимости, следует отличать от эмпирического корреляционного отношения — теоретическое.
Теоретическое корреляционное отношение η представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выровненных значений результативного признака δ, т. е. рассчитанных по уравнению регрессии, со средним квадратическим отклонением эмпирических (фактических) значений результативного признака σ:
ηэ = .
Где ;
Тогда η= (9.6)
Изменение значения η объясняется влиянием факторного признака.
В основе расчета корреляционного отношения лежит правило
сложения дисперсий (см. главу 5), т. е. , где - отражает вариацию у за счет всех остальных факторов, кроме х, т. е. является остаточной дисперсией:
Тогда формула теоретического корреляционного отношения примет вид:
(9.7)
или (9.8)
Подкоренное выражение корреляционного отношения представляет собой коэффициент детерминации (меры определенности, причинности). Коэффициент детерминации показывает долю вариации результативного признака под влиянием вариации признака-фактора.
Теоретическое корреляционное отношение применяется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаком. При криволинейных связях теоретическое корреляционное отношение, исчисляемое по формулам (9.7), (9.8), часто называют индексом корреляции R. При значительной корреляции расчет по формулам (9.7) и (9.8) значительно проще, так как отклонение (у- ), как правило, по значению меньше, чем отклонение ( - ).
Как видно из формул (9.7) и (9.8), корреляционное отношение может находиться в пределах от 0 до 1, т. е. (0 ≤ η ≤ 1). Чем ближе корреляционное отношение к 1, тем связь между признаками теснее.
Проиллюстрируем расчет теоретического корреляционного отношения как меры тесноты связи на примере, рассмотренном в табл.9.1, для которого по уравнению прямой регрессии = 4 + 0,6x найдены значения дневной выработки каждого рабочего.
Теоретическое корреляционное отношение рассчитываем двумя способами (см. данные табл.9.2):
По формуле (9.6) = ;
По формуле (9.8) =
Полученное значение теоретического корреляционного отношения свидетельствует о возможном наличии весьма тесной прямой зависимости между рассматриваемыми признаками.
Коэффициент детерминации равен 0,925. Отсюда заключаем, что 92,5% общей вариации выработки в изучаемой бригаде обусловлено вариацией фактора — стажа работы рабочих (и только 7,5% общей вариации нельзя объяснить изменением стажа работы).
Кроме того, при линейной форме уравнения применяется другой показатель тесноты связи - линейный коэффициент корреляции:
(9.9)
где n— число наблюдений.
Для практических вычислений при малом числе наблюдений, n ≤ (20 ÷30), линейный коэффициент корреляции удобнее исчислять по следующей формуле:
. (9.10)
Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале: -1 ≤ r ≤ +1.
Отрицательные значения указывают на обратную связь, положительные — на прямую. При r = 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к единице, тем теснее связь между признаками. И, наконец, при r= ±1 связь — функциональная.
Используем данные табл. 9.1 и рассчитаем линейный коэффициент корреляции по формуле (9.10):
Квадрат линейного коэффициента корреляции называется линейным коэффициентом детерминации. Из определения коэффициента детерминации очевидно, что его числовое значение всегда заключено в пределах от 0 до 1, т. е. 0 < < 1. Степень тесноты связи полностью соответствует теоретическому корреляционному отношению, которое является более универсальным показателем тесноты связи по сравнению с линейным коэффициентом корреляции.
Факт совпадений и несовпадений значений теоретического корреляционного отношения з и линейного коэффициента корреляции r используется для оценки формы связи.
Выше отмечалось, что посредством теоретического корреляционного отношения измеряется теснота связи любой формы, а с помощью линейного коэффициента корреляции - только прямолинейной. Следовательно, значения η и r совпадают только при наличии прямолинейной связи. Несовпадение этих значений свидетельствует, что связь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено, что если разность квадратов и не превышает 0,1, то гипотезу о прямолинейной форме связи можно считать подтвержденной. В приведенном ранее примере совпадение значений η и r (η = r = 0,962) дает основание считать связь между выработкой рабочих и их стажем прямолинейной.
Показатели тесноты связи, исчисленные по данным сравнительно небольшой статистической совокупности, могут искажаться действием случайных причин. Это вызывает необходимость проверки их существенности, дающей возможность распространять выводы по результатам выборки на генеральную совокупность.
Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.
При линейной однофакторной связи t-критерий можно рассчитать по формуле:
(9.11)
где (n -2) — число степеней свободы при заданном уровне значимости б и объеме выборки п.
Полученное значение tрасч сравнивают с табличным значением t-критерия (для α = 0,05 и 0,01). Если рассчитанное значение tрасч превосходит табличное значение критерия tтабл, то практически невероятно, что найденное значение обусловлено только случайными колебаниями (т. е. отклоняется гипотеза о его случайности).
Так, для коэффициента корреляции между выработкой и стажем работы получим:
Это значительно больше критического значения t для n — 2 = 8 степеней свободы и α = 0,01 (tтабл = 3,356), что свидетельствует о значимости коэффициента корреляции и существенности связи между выработкой и стажем работы.
Таким образом, построенная регрессионная модель = 4 + 0,6x в целом адекватна, и выводы, полученные по результатам малой выборки, можно с достаточной вероятностью распространить на всю гипотетическую генеральную совокупность.