2. Вариационный анализ
Первый этап вариационного анализа - построение вариационного ряда. На этом этапе важно правильно определить, ряд какого вида целесообразно построить. Т.к. изучаемый признак – чмсленность населения в возрасте моложе трудоспособного – относится к непрерывному виду, то строим интервальный вариационный ряд. Для построения вариационного ряда определим количество интервалов в ряду и длину интервала. Воспользуемся формулой Стержесса:
Количество интервалов k = 1 + 3,32 * lg80 = 7,3.
В качестве длины интервала l выберем целочисленное и удобное для восприятия значение в интервале от l2 до l1:
l1 = (1348893-14577)/7 = 190617
l2 = (1348893-14577)/8 = 166790
Получим вариационный ряд, состоящий из 7 интервалов длиной 180000. (Таблица 2.1).
Таблица 2.1 - Вариационный ряд
Численность населения в возрасте моложе трудоспособного на 1.01.2002 г., тыс. чел. |
Менее 180 |
180-360 |
360-540 |
540-720 |
720-900 |
900-1080 |
Более 1080 |
Число регионов |
23 |
31 |
9 |
10 |
4 |
2 |
1 |
Графически интервальный вариационный ряд изображается гистограммой:
Д иаграмма 2.1 - Вариационный ряд
Второй этап вариационного анализа - расчет показателей вариации (Приложение Б). Оформим его в виде таблицы:
Таблица 2.2 - Показатели вариации
Показатель |
Значение |
Качественная оценка |
Среднее значение |
339750 |
На 1.01.2002 средняя численность населения в возрасте моложе трудоспособного по регионам РФ составляла 339750 чел. |
Показатели структуры вариации |
||
Мода |
228000 |
Наиболее часто встречающееся значение численности населения в возрасте моложе трудоспособного составляет около 228000 чел. |
Медиана |
278710 |
40 регионов РФ характеризуется численностью населения в возрасте моложе трудоспособного ниже 278710 чел. и 40 регионов выше |
Показатели силы и интенсивности вариации |
||
Размах вариации |
976409 |
Даже исключив из совокупности регион с аномальным значением показателя (г. Москва - 1348893 чел.), найдем, что абсолютный разброс значений признака чрезвычайно высок. |
Среднее линейное отклонение |
197663 |
Значения численности населения в возрасте моложе трудоспособного по регионам на 1.01.2002 отличались в среднем на 197663 чел. от среднего значения 339750 чел. |
Дисперсия |
61959937500 |
Квадрат отклонений значений признака по регионам от среднего значения по всей стране равен 61959937500 чел.2 |
Среднее квадратическое отклонение |
248918 |
СКО является мерой надежности средней величины: чем оно меньше, тем точнее средняя арифметическая отражает собой всю изучаемую совокупность |
Относительный размах вариации |
287% |
Разница между максимальным и минимальным значениями превышает среднее значение почти в 3 раза, т.е. относительный разброс значений признака также чрезвычайно высок |
Относительное линейное отклонение |
58% |
Доля усредненного значения абсолютных отклонений от средней величины равна 58% |
Коэффициент вариации |
73% |
По численности населения в возрасте моложе трудоспособного совокупность является неоднородной |
Показатели характера вариации |
||
Коэффициент асимметрии |
0,45 |
Распределение умеренно асимметрично, асимметрия правосторонняя (смещение в область более низких значений показателя) |
Показатель эксцесса |
0,88 |
Распределение островершинное |