- •Раздел I
- •Глава 1. Статистика как наука
- •1.1. Понятие статистики и краткие сведения из ее истории
- •1.2. Предмет статистики
- •1.3. Метод статистики
- •1.4. Основные категории статистики
- •1.5. Задачи статистики и основные направления ее реформирования
- •Контрольные вопросы
- •Глава 2. Источники статистической информации
- •2.2. Статистическое наблюдение
- •2.2.1. Понятие о статистическом наблюдении
- •2.2.2. Программно-методологические вопросы статистического наблюдения
- •2.2.3. Формы, виды и способы наблюдения
- •Глава 3. Сводка и группировка материалов статического наблюдения
- •3.1. Сводка статистических данных
- •3.2. Задачи и виды группировок
- •3.3. Выполнение группировки по количественному признаку
- •Группировка акционеров по размеру выплаты дивидендов на одну акцию
- •Вторичная группировка акционеров по размеру дивидендов на одну акцию (группировка единая)
- •3.4. Статистические ряды распределения
- •Контрольные вопросы
- •Глава 4. Абсолютные и относительные статистические величины
- •4.1. Абсолютные статистические величины
- •4.2. Относительные статистические величины
- •Контрольные вопросы
- •Глава 5. Средние величины и показатели вариации
- •5.1. Понятие о средних величинах
- •5.2.1. Средняя арифметическая
- •Распределение рабочих по среднему стажу работы
- •5.2.2. Расчет средней арифметической в рядах распределения
- •Распределение рабочих ао по уровню оплаты труда
- •Распределение предприятий региона по стоимости основных производственных фондов (опф)
- •5.2.3. Средняя гармоническая
- •Цена и выручка от реализации по трем коммерческим магазинам
- •Информация о вкладах в банке для расчета средних значений
- •5.2.4. Средняя геометрическая
- •5.2.5. Средняя квадратическая и средняя кубическая
- •5.2.6 Структурные средние
- •5.3.Показатели вариации
- •Распределение рабочих по сменной выработке изделия а и расчетные значения для исчисления показателей вариации
- •5.3.1 .Правило сложения дисперсий
- •Распределение рабочих по среднечасовой выработке изделий
- •Контрольные вопросы
- •Глава 6. Выборочный метод в статистике
- •6.1. Понятие о выборочном наблюдении, его задачи
- •6.2. Ошибки выборки
- •6.3. Распространение выборочных результатов на генеральную совокупность
- •Распределение урожайности по хозяйствам региона, имеющим различную форму собственности
- •Контрольные вопросы
- •Глава 7. Статистическое изучение динамики
- •7.1. Понятие о рядах динамики
- •Добыча нефти в Российской Федерации, млн. Т:
- •7.2. Правила построения рядов динамики
- •Динамика объема реализации продукции фирмы «Весна» в сопоставимых ценах, млн. Руб. (по годам)
- •7.3. Показатели анализа ряда динамики
- •Динамика производства электроэнергии в Российской Федерации
- •Динамика объемов производства продукции машиностроения и металлообработки (в сопоставимых ценах 1990 г., млн. Руб.), и базисные темпы изменения объемов производства
- •Остатки вкладов в сберегательных банках на начало месяца, млн. Руб.
- •Динамика промышленного производства отрасли
- •7.4. Методы анализа основной тенденции развития в рядах динамики
- •Объем производства продукции предприятия (по месяцам) в сопоставимых ценах, млн. Руб.
- •Объем производства продукции предприятия (по кварталам) в сопоставимых ценах, руб.
- •Исходные данные и результаты расчета скользящей средней, ц/га
- •Выравнивание по прямой ряда динамики урожайности зерновых культур
- •7.5. Методы изучения сезонных колебаний
- •Яйценоскость по месяцам года и расчет индексов
- •7.6. Экстраполяция в рядах динамики и прогнозирование
- •Контрольные вопросы
- •Глава 8. Экономические индексы
- •8.1. Индексы и их классификация
- •8.2. Общие индексы количественных показателей
- •Выработка продукции на предприятии
- •8.3. Общие индексы качественных показателей
- •Продажа товаров на рынке
- •Данные о продаже товаров
- •8.4. Индексы средних величин
- •Среднемесячная заработная плата и число работников
- •8.5. Базисные и цепные индексы
- •Контрольные вопросы
- •Глава 9. Статистические методы изучения взаимосвязи социально-экономических явлений
- •9.1. Стохастико-детерминированный характер социально-экономических явлений и виды связей между ними
- •9.1.1. Функциональные
- •9.2. Статистические методы моделирования связи
- •9.2.1. Простейшие методы изучения стохастических связей
- •9.2.2. Статистическое моделирование связи методом корреляционного и регрессионного
- •9.2.2.1 Корреляционный и регрессионный анализ
- •9.2.2.2. Двухмерная линейная модель
- •Распределение рабочих бригады по выработке и стажу работы
- •От стажа работы х (по данным табл. 9.1)
- •9.2.2.3 Проверка адекватности
- •Расчетные значения, необходимые для исчисления дост, дx
- •9.2.2.4. Экономическая интерпретация параметров регрессии
- •9.2.2.5. Многофакторный корреляционный и регрессионный анализ
- •9.2.2.6. Построение и статистический анализ
- •9.2.2.7. Трехфакторные линейные регрессионные модели
- •Стохастическая связь между производительностью труда, внутрисменными простоями и квалификацией рабочих
- •К расчету параметров и оценке линейной двухфакторной регрессионной модели
- •9.2.2.8. Парные коэффициенты корреляции
- •9.2.2.9. Частные коэффициенты корреляции
- •9.2.2.10.Совокупный коэффициент множественной
- •9.2.2.11. Совокупный коэффициент множественной детерминации
- •9.2.2.12. Многошаговый регрессионный анализ
- •9.2.2.13. Экономическая интерпретация многофакторной регрессионной модели
- •9.3. Непараметрические методы
- •Распределение отцов и сыновей по росту, чел.
- •Распределение семей по уровню образования мужа и жены
3.3. Выполнение группировки по количественному признаку
При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить количество групп и интервалы группировки.
Интервал — количественное значение, отделяющее одну единицу (группу) от другой, т. е. интервал очерчивает количественные границы групп.
Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе.
Вопрос о числе групп и величине интервала следует решать с учетом множества обстоятельств, прежде всего исходя из целей исследования, значения изучаемого признака и т.д.
Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными.
При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представляют интерес и малочисленные группы: новое, передовое, пока оно не станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики — выделить эти факты, изучить их.
Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления. На количество выделяемых групп существенное влияние оказывает степень вариации группировочного признака: чем она больше, тем больше следует образовать групп.
Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского ученого Стерджесса:
, (3.1)
где N — численность единиц совокупности.
Получаем следующее соотношение:
N |
15 - 24 |
25 - 44 |
45 - 89 |
90 - 179 |
180 - 359 |
360 - 719 |
|
п |
5 |
6 |
7 |
8 |
9 |
10 |
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления.
Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 человек, 100 - 200, 200 - 300, 300 - 500, 500 - 1000, 1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количества работающих на 50 - 100 человек имеет существенное значение для мелких предприятий, а для крупных - не имеет.
Группировки с равными интервалами целесообразны в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке рабочих одной профессии по размеру заработной платы, посевов какой — либо культуры по урожайности).
Для группировок с равными интервалами величина интервала:
, (3.2)
где xmax, xmin — наибольшее и наименьшее значения признака, п - число групп.
Если, например, требуется произвести группировку с равными интервалами по данным об уровне месячной заработной платы бюджетных работников, которая колеблется в пределах от 600 до 750 руб., и необходимо при этом выделить 5 групп, то величина интервала, руб.:
.
Если в результате деления получится не целое число и возникает необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую.
Прибавляя к минимальному значению признака (в данном случае 600 руб.) найденное значение интервала, получаем верхнюю границу первой группы: 600 + 30 = 630.
Прибавляя далее величину интервала к верхней границе первой группы, получаем верхнюю границу второй группы: 630 + 30 = 660 и т.д.
В результате получим такие группы работников по размеру заработной платы, руб.:
600 - 630; 630 - 660; 660 - 690; 690 - 720; 720 - 750.
В этом распределении имеет место неопределенность: к какой группе, например, отнести работника с заработком в 630 руб., к первой или второй? Для устранения неопределенности открывают один из крайних интервалов или используют принцип единообразия — левое число включает в себя обозначенное значение, а правое — не включает. Значит работник, получающий 630 руб., должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп.
Интервалы групп могут быть закрытыми, когда указаны нижняя и верхняя границы (как в приведенном выше примере), и открытыми, когда указана лишь одна из границ (первый или последний интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что работник с заработной платой, равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить «750 и выше». И наоборот, чтобы показать, что значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить «свыше 750». Подобные функции выполняют слова «до», «менее» и «более».
Все сказанное выше о группировках относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. Для приведения таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки.
Вторичная группировка — образование новых групп на основе ранее осуществленной группировки.
Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединение первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).
Использование вторичной группировки для приведения двух группировок с различными интервалами к единому виду рассмотрим на примере распределения акционеров двух районов области по размеру дивидендов на одну акцию (по условным данным табл. З.1.).
Таблица 3.1