Практическая работа 01
.docПрактическая работа № 1. Сводка и группировка данных
Цель работы. Ознакомиться с принципами сводки и группировки статистических данных, развить навыки структурной и аналитической группировки.
Теоретические положения.
Сводка – научно организованная обработка материалов статистического наблюдения в целях получения обобщенных характеристик изучаемого явления по ряду существенных для него признаков.
Группировка – разделение единиц изучаемой совокупности на качественно однородные группы по наиболее существенным признакам.
Различают качественную (атрибутивную) и количественную (вариационную) группировку. Число групп в количественной группировке зависит от степени вариации группировочного признака, а в атрибутивной – определяется числом градаций атрибутивного признака.
В свою очередь, вариационная делится на структурную и аналитическую. Структурная группировка предполагает расчет удельного веса каждой группы. Цель аналитической группировки – выявить взаимосвязь между признаками. Она предусматривает группировку единиц совокупности по факторному признаку и расчет средних показателей факторного и результативного признаков по каждой группе. По степени сложности группировки могут быть простые и комбинационные (по признакам).
По исходной информации различают первичную и вторичную группировки, первичная осуществляется на основе исходных данных наблюдения, вторичная использует данные первичной группировки.
При проведении группировки необходимо:
- проведение всестороннего анализа природы изучаемого явления;
- выявление группировочного признака (один или несколько);
- определение необходимого и достаточного количества групп;
- установление границы групп таким образом, чтобы группы существенно отличались друг от друга, и в каждой группе объединялись однородные элементы.
Число групп зависит от:
задач исследования
группировочного признака;
объёма совокупности;
степени вариации группировочного признака.
Если основанием группировки служит количественный признак, то количество групп определяется по формуле Стерджесса:
n = 1+3,322*lgN, (1.1)
где n - количество групп, N – объём генеральной совокупности.
Интервал группировки – значения варьирующего признака, лежащие в определенных границах. Величина интервала рассчитывается как разница между верхней и нижней границами.
Если в группировке используются равные интервалы, то величина интервала равна
h = (Xmax – Xmin)/n, (1.2)
где Xmax, Xmin - максимальное и минимальное значение признака в совокупности.
Величину интервала обычно округляют до целого числа, исключение составляют лишь случаи, когда изучаются малейшие колебания признака.
Интервалы могут быть равные и неравные, последние в свою очередь возрастающие и убывающие по закону арифметической и геометрической прогрессии, закрытые и незакрытые. Открытыми могут быть первые и последние интервалы, которые могут включать и не включать границы интервала.
Нижнюю границу первого интервала принимают равной минимальному значению признака (чаще всего его округляют до целого меньшего числа); верхняя граница первого интервала соответствует значению (Xmin + h). Для последующих групп границы определяются аналогично, т.е. последовательно прибавляется величина интервала.
Если интервалы закрытые, а основанием группы служит непрерывный признак и ничего не сказано как считать граничные значения, то верхняя граница формируется по принципу «включительно», а нижняя (кроме первого интервала) – по принципу «исключительно». Если интервалы открытые, то ориентируются по последнему интервалу.
Признак в интервалах может измеряться дискретно (с прерывным изменением) и непрерывно (т.е. дробиться).
Если признак измеряется дискретно, то нижняя граница (i+1)-го интервала равна верхней границе i-го интервала, увеличенной на 1. Например, группировка по количеству обрабатываемых деталей: 1 – 10, 11 – 20, 21 – 30.
Если интервалы открытые, то величина последнего интервала приравнивается к предыдущему, а первого ко второму.
При группировке и сводке социально-экономических показателей формируется ряд распределения – это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку. Ряды распределения делятся на вариационные (дискретные и интервальные) и атрибутивные, ранжированные и неранжированные, сгруппированные и несгруппированные. Ранжированный ряд - ряд данных, расположенных в порядке убывания или возрастания признака.
Для сгруппированных ранжированных рядов выделяют следующие характеристики: варианту, частоту или частость, кумуляту и плотность распределения.
Варианта (xi) – среднее интервальное значение признака. Т.к. при создании группировки должен выполняться принцип равномерного распределения признака в каждом интервале, то варианту можно рассчитывать как полусумму границ интервалов.
Частота (fi) показывает сколько раз встречается данное значение признака. Частость (fi%) – относительное выражение частоты, т.е. доля, удельный вес от суммы частот.
Кумулята (Si) – накопленная частота или частость, рассчитывается нарастающим итогом, путём последовательного прибавления к частоте первого интервала частот последующих интервалов. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем данное значение.
Порядок выполнения работы.
Определить федеральный округ и признаки для группировки по данным таблицы 1.2.
Расчеты производить по данным краткого статистического сборника «Россия в цифрах», раздел 1, таблица 1.5 «Основные социально-экономические показатели по субъектам Российской Федерации»
Определить количество групп по формуле Стерджесса (N – число регионов в федеральном округе)
Величины интервалов группировки принять равными
Произвести группировку регионов, проранжировав их по факторному признаку, заполнить таблицу 1.1, рассчитать основные характеристики полученного ряда распределения.
Сформулировать выводы о наличии или отсутствии взаимосвязи исследуемых показателей.
Таблица 1.1 Группировка регионов ФО по факторному признаку
№ группы |
Интервал |
№ региона |
Величина факторного признака |
Число регионов, fi |
Среднее групповое значение факторного признака |
Доля группы регионов, fi% |
Кумулята, Si |
Кумулята, Si% |
Величина результативного признака |
Среднее групповое значение результативного признака |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
Итого |
|
|
Σfi= |
|
Σfi%= |
- |
- |
|
|
Таблица 1.2 Варианты заданий к практической работе № 1
|
Номер варианта |
|||||
Федеральный округ |
Группировочный признак |
Результативный признак |
Групп. признак |
Результативн. признак |
Групп. признак |
Результативн. признак |
Численность населения на 1 января рассматриваемого года, тыс. человек |
Среднегодовая численность занятых в экономике, тыс. человек |
Среднедушевые денежные доходы (в месяц), руб. |
Среднедушевые денежные расходы (в месяц), руб. |
Среднегодовая численность занятых в экономике, тыс. человек |
Валовой региональный продукт (в текущих основных ценах), млрд. руб |
|
Центральный |
1 |
5 |
9 |
|||
Южный |
2 |
6 |
10 |
|||
Приволжский |
3 |
7 |
11 |
|||
Сибирский |
4 |
8 |
12 |
|||
Северо-Западный |
13 |
14 |
15 |
Контрольные вопросы к практической работе № 1
Приведите определения сводки и группировки
Приведите примеры атрибутивной, структурной и аналитической группировок
Перечислите виды группировок
Приведите определение интервала и величины интервала
Перечислите виды интервалов
Как определяется величина интервала в зависимости от вида группировки?
Перечислите основные характеристики ряда распределения
Как рассчитывается кумулята?