- •Раздел I
- •Глава 1. Статистика как наука
- •1.1. Понятие статистики и краткие сведения из ее истории
- •1.2. Предмет статистики
- •1.3. Метод статистики
- •1.4. Основные категории статистики
- •1.5. Задачи статистики и основные направления ее реформирования
- •Контрольные вопросы
- •Глава 2. Источники статистической информации
- •2.2. Статистическое наблюдение
- •2.2.1. Понятие о статистическом наблюдении
- •2.2.2. Программно-методологические вопросы статистического наблюдения
- •2.2.3. Формы, виды и способы наблюдения
- •Глава 3. Сводка и группировка материалов статического наблюдения
- •3.1. Сводка статистических данных
- •3.2. Задачи и виды группировок
- •3.3. Выполнение группировки по количественному признаку
- •Группировка акционеров по размеру выплаты дивидендов на одну акцию
- •Вторичная группировка акционеров по размеру дивидендов на одну акцию (группировка единая)
- •3.4. Статистические ряды распределения
- •Контрольные вопросы
- •Глава 4. Абсолютные и относительные статистические величины
- •4.1. Абсолютные статистические величины
- •4.2. Относительные статистические величины
- •Контрольные вопросы
- •Глава 5. Средние величины и показатели вариации
- •5.1. Понятие о средних величинах
- •5.2.1. Средняя арифметическая
- •Распределение рабочих по среднему стажу работы
- •5.2.2. Расчет средней арифметической в рядах распределения
- •Распределение рабочих ао по уровню оплаты труда
- •Распределение предприятий региона по стоимости основных производственных фондов (опф)
- •5.2.3. Средняя гармоническая
- •Цена и выручка от реализации по трем коммерческим магазинам
- •Информация о вкладах в банке для расчета средних значений
- •5.2.4. Средняя геометрическая
- •5.2.5. Средняя квадратическая и средняя кубическая
- •5.2.6 Структурные средние
- •5.3.Показатели вариации
- •Распределение рабочих по сменной выработке изделия а и расчетные значения для исчисления показателей вариации
- •5.3.1 .Правило сложения дисперсий
- •Распределение рабочих по среднечасовой выработке изделий
- •Контрольные вопросы
- •Глава 6. Выборочный метод в статистике
- •6.1. Понятие о выборочном наблюдении, его задачи
- •6.2. Ошибки выборки
- •6.3. Распространение выборочных результатов на генеральную совокупность
- •Распределение урожайности по хозяйствам региона, имеющим различную форму собственности
- •Контрольные вопросы
- •Глава 7. Статистическое изучение динамики
- •7.1. Понятие о рядах динамики
- •Добыча нефти в Российской Федерации, млн. Т:
- •7.2. Правила построения рядов динамики
- •Динамика объема реализации продукции фирмы «Весна» в сопоставимых ценах, млн. Руб. (по годам)
- •7.3. Показатели анализа ряда динамики
- •Динамика производства электроэнергии в Российской Федерации
- •Динамика объемов производства продукции машиностроения и металлообработки (в сопоставимых ценах 1990 г., млн. Руб.), и базисные темпы изменения объемов производства
- •Остатки вкладов в сберегательных банках на начало месяца, млн. Руб.
- •Динамика промышленного производства отрасли
- •7.4. Методы анализа основной тенденции развития в рядах динамики
- •Объем производства продукции предприятия (по месяцам) в сопоставимых ценах, млн. Руб.
- •Объем производства продукции предприятия (по кварталам) в сопоставимых ценах, руб.
- •Исходные данные и результаты расчета скользящей средней, ц/га
- •Выравнивание по прямой ряда динамики урожайности зерновых культур
- •7.5. Методы изучения сезонных колебаний
- •Яйценоскость по месяцам года и расчет индексов
- •7.6. Экстраполяция в рядах динамики и прогнозирование
- •Контрольные вопросы
- •Глава 8. Экономические индексы
- •8.1. Индексы и их классификация
- •8.2. Общие индексы количественных показателей
- •Выработка продукции на предприятии
- •8.3. Общие индексы качественных показателей
- •Продажа товаров на рынке
- •Данные о продаже товаров
- •8.4. Индексы средних величин
- •Среднемесячная заработная плата и число работников
- •8.5. Базисные и цепные индексы
- •Контрольные вопросы
- •Глава 9. Статистические методы изучения взаимосвязи социально-экономических явлений
- •9.1. Стохастико-детерминированный характер социально-экономических явлений и виды связей между ними
- •9.1.1. Функциональные
- •9.2. Статистические методы моделирования связи
- •9.2.1. Простейшие методы изучения стохастических связей
- •9.2.2. Статистическое моделирование связи методом корреляционного и регрессионного
- •9.2.2.1 Корреляционный и регрессионный анализ
- •9.2.2.2. Двухмерная линейная модель
- •Распределение рабочих бригады по выработке и стажу работы
- •От стажа работы х (по данным табл. 9.1)
- •9.2.2.3 Проверка адекватности
- •Расчетные значения, необходимые для исчисления дост, дx
- •9.2.2.4. Экономическая интерпретация параметров регрессии
- •9.2.2.5. Многофакторный корреляционный и регрессионный анализ
- •9.2.2.6. Построение и статистический анализ
- •9.2.2.7. Трехфакторные линейные регрессионные модели
- •Стохастическая связь между производительностью труда, внутрисменными простоями и квалификацией рабочих
- •К расчету параметров и оценке линейной двухфакторной регрессионной модели
- •9.2.2.8. Парные коэффициенты корреляции
- •9.2.2.9. Частные коэффициенты корреляции
- •9.2.2.10.Совокупный коэффициент множественной
- •9.2.2.11. Совокупный коэффициент множественной детерминации
- •9.2.2.12. Многошаговый регрессионный анализ
- •9.2.2.13. Экономическая интерпретация многофакторной регрессионной модели
- •9.3. Непараметрические методы
- •Распределение отцов и сыновей по росту, чел.
- •Распределение семей по уровню образования мужа и жены
5.3.Показатели вариации
Вариация — это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.
Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д.
Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.
Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Особенно актуально оно в период формирования многоукладной экономики. Измерение вариации, выяснение ее причины, выявление влияния отдельных факторов дает важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.п.) для принятия научно обоснованных управленческих решений.
Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом — эти отличия велики, т.е. в одном случае вариация признака мала, а в другом — велика, это имеет весьма важное значение для характеристики надежности средней величины.
Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своем средней, и наоборот, — чем меньше варианты отличаются друг от друга, тем меньше они отличаются от средней, которая в тан ком случае будет более реально представлять всю совокупность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны и другие показатели, характеризующие отклонения отдельных значений от общей средней.
Это можно показать на таком примере. Предположим, что одинаковую работу выполняют две бригады, каждая — из трех человек. Пусть количество деталей, шт., изготовленных за смену отдельными рабочими, составляло:
в первой бригаде — 95, 100, 105 ( = 100 шт.);
во второй бригаде — 75, 100, 125 ( = 100 шт.).
Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет = = 100 шт., однако колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй.
Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике применяют ряд обобщающих показателей.
К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, коэффициент вариации.
Самым элементарным показателем вариации признака является размах вариации R, представляющий собой разность между максимальным и минимальным значениями признака:
.
В нашем примере размах вариации сменной выработки деталей составляет: в первой бригаде — R1= 10 шт. (т.е. 105 — 95); во второй бригаде — R2= 50 шт. (т.е. 125 — 75), что в 5 раз больше.
Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более «устойчива». Размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими максимальной для этой бригады выработки деталей, ею может быть изготовлено 375 шт., т.е. (3x125), а в первой - только 315 шт., т.е. (3 х 105).
Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением ее размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и даёт обобщённую характеристику. Простейший показатель такого типа - среднее линейное отклонение
Среднее линейное отклонение d представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда предполагают, что среднюю вычитают из варианта: ( ).
Среднее линейное отклонение:
Для несгруппированных данных , (5.18)
где n – число членов ряда;
Для сгруппированных данных , (5.19)
где — сумма частот вариационного ряда.
В формулах (5.18) и (5,19) разности в числителе взяты по модулю, (иначе в числителе всегда будет ноль — алгебраическая сумма отклонений вариантов от их средней арифметической). Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике редко (только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл). С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли.
Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):
простая дисперсия для несгруппированных данных
, (5.20)
взвешенная дисперсия для вариационного ряда
. (5.20)
Формула (5.21) применяется при наличии у вариантов своих весов (или частот вариационного ряда).
Формулу для расчета дисперсии (5.20) можно преобразовать, учитывая, что
(5.22)
т.е. дисперсия равна разности средней из квадратов вариантов и квадрата их средней.
Техника вычисления дисперсии по формулам (5.20), (5.21) достаточно сложна, а при больших значениях вариантов и частот может быть громоздкой.
Расчет можно упростить, используя свойства дисперсии (доказываемые в математической статистике). Приведем два из них:
первое — если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится;
второе — если все значения признака уменьшить или увеличить в одно и то же число раз (i раз), то дисперсия соответственно уменьшится или увеличится в i2 раз. Используя второе свойство дисперсии, разделив все варианты на величину интервала, получим следующую формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу моментов:
(5.23)
где — дисперсия, исчисленная по способу моментов;
i - величина интервала;
новые (преобразованные) значения вариантов (А — условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой);
- момент второго порядка;
- квадрат момента первого порядка.
Расчет дисперсии по формуле (5.23) менее трудоемок.
Дисперсия имеет большое значение в экономическом анализе. В математической статистике важную роль для характеристики качества статистических оценок играет их дисперсия. Ниже, в частности, будет показано разложение дисперсии на соответствующие элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака; использование дисперсии для построения показателей тесноты корреляционной связи при оценке результатов выборочных наблюдений.
Среднее квадратическое отклонение равно корню квадратному из дисперсии:
для несгруппированных данных
, (5.24)
для вариационного ряда
. (5.25)
Среднее квадратическое отклонение — это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.
Обозначим: 1 — наличие интересующего нас признака; 0 — его отсутствие; р — доля единиц, обладающих данным признаком; q — доля единиц, не обладающих данным признаком; p + q =1. Исчислим среднее значение альтернативного признака и его дисперсию. Среднее значение альтернативного признака
, (5.26)
так как р + q = 1.
Дисперсия альтернативного признака
. (5.27)
Подставив в формулу дисперсии q = 1- р, получим
(5.28)
Таким образом, = pq — дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, на долю единиц, не обладающих данным признаком.
Например, если на 10 000 человек населения района приходится 4500 мужчин и 5500 женщин, то
Дисперсия альтернативного признака = pq = 0,45*0,55 = 0,2475.
Предельное значение дисперсии альтернативного признака равно 0,25. Оно получается при р = 0,5.
Среднее квадратическое отклонение альтернативного признака
(5.29)
Если, например, 2% всех деталей бракованные (р = 0,02), то 98% — годные (q = 0,98), тогда дисперсия доли брака
= 0,02- 0,98 = 0,0196.
Среднее квадратическое отклонение доли брака составит:
= 0,14, т.е. = 14%.
При вычислении средних величин и дисперсии для интервальных рядов распределения истинные значения признака заменяются центральными (серединными) значениями интервалов, которые отличаются от средней арифметической значений, включенных в интервал. Это приводит к появлению систематической погрешности при расчете дисперсии. В.Ф.Шеппард установил, что погрешность в расчете дисперсии, вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала (т.е. i2/12) как в сторону занижения, так и в сторону завышения величины дисперсии.
Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по большому количеству исходных данных (n>500). Однако исходя из того, что в ряде случаев обе погрешности, действуя в противоположных направлениях, нейтрализуются и компенсируют друг друга, можно иногда отказаться от введения поправок.
Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.
В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.
Для осуществления такого рода сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации — коэффициент вариации.
Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:
(5.30)
Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33 %.
Покажем расчет различными способами показателей вариации на примере данных о сменной выработке рабочих бригады, представленных интервальным рядом распределения (табл. 5.7).
Исчислим среднесменную выработку, шт.:
Рассчитаем дисперсию выработки по (5.21):
Найдем среднее квадратическое отклонение, шт.:
.
Определим коэффициент вариации, %:
.
Таким образом, данная бригада рабочих достаточно однородна по выработке, поскольку вариация признака составляет лишь 8%.
Теперь выполним расчет дисперсии по формуле (5.22) и по способу моментов по формуле (5.23), для расчета воспользуемся данными табл. 5.7, графы 8-11.
Расчет дисперсии по формуле (5.20):
Расчет дисперсии по способу моментов, см. формулу (5.21):
.
где А = 50 — центральный вариант с наибольшей частотой;
i = 20 — величина интервала данного ряда;
Таблица 5.7