Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kursovaya_neretina_osintseva.docx
Скачиваний:
3
Добавлен:
13.07.2019
Размер:
140.42 Кб
Скачать
  1. Вариационный анализ.

Выполним вариационный анализ показателя «Число больничных коек на 10 000 тысяч человек населения по субъектам Российской Федерации» в 2009г.

Для этого построим вариационный ряд. Так как изучаемый признак относится к дискретному и число значений показателя достаточно велико, то необходимо строить интервальный ряд, то есть разбить все значения на интервалы. Для построения вариационного ряда определим количество интервалов в ряду и длину интервала.

Количество интервалов примерно можно определить с помощью формулы Стержесса:

k=1+3,32 lg(n) (2)

где k – количество интервалов;

nколичество субъектов РФ, попадающих в вариационный анализ.

Длину интервалов считаем по формуле (3):

l = , коек (3)

где l – длина интервалов;

– максимальное и минимальное значение признака в ряду соответственно.

В задании 1 содержится 83 единицы совокупности. Рассчитаем количество интервалов:

k=1+3,32 lg (83) =1+3,32*1,92 = 7,4

Значит, ряд следует разделить на 7 или 8 интервалов с длиной интервала заключенной между и .

Рассчитаем шаг интервалов:

l = = = 17,1

l = = = 19,5

В качестве длины интервала выбирается целочисленное и удобное для восприятия значение в интервале от до .

Наш вариационный ряд получится наиболее наглядным, если мы возьмем за длину интервала 18. Исходя из полученных интервалов и длины построим таблицу 2.1

Таблица 2.1 – Распределение больничных коек по субъектам РФ.

№ п/п

Число больничных коек на 10 000 человек населения

Количество субъектов

1

Менее 58

1

2

58 – 76

2

3

76 – 94

20

4

94 – 112

45

5

112 – 130

10

6

130 – 148

3

7

148 – 166

1

8

Более 166

1

Итого:

83

Структуру вариаций легче увидеть, когда данные представлены графически. Для отображения интервального вариационного ряда наиболее подходящим графиком является гистограмма. Построим гистограмму по полученным значениям (Рисунок 3) .

Рисунок 3. Гистограмма распределения числа больничных коек на 10 000 тысяч человек населения по субъектам Российской Федерации.

Анализ диаграммы показывает, что распределение не подчиняется нормальному закону. Явно выражена правосторонняя симметрия, то есть положительная. Из этого можно сделать вывод о том, что большинство значений признака сконцентрировано слева от и имеет значение меньшее, чем среднее. По гистограмме можно приблизительно определить моду, значение которой попадает в середину четвёртого интервала.

Для построения огивы и кумуляты составим таблицу накопленных частот:

Таблица 2.2 – Накопленные значения для кумуляты и огивы

Номер по порядку

Число больничных коек на 10 000 человек населения

Количество субъектов

Накопленные частоты

для кумуляты

Накопленные частоты для огивы

1

< 58

1

1

83

2

58 – 76

2

3

80

3

76 – 94

20

23

60

4

94 – 112

45

68

15

5

112 – 130

10

78

5

6

130 – 148

3

81

2

7

148 – 166

1

82

1

8

> 166

1

83

1

Итого:

83

-

-

Рисунок 4. Кумулята и огива распределения.

Анализ вышеприведённого графика позволяет примерно определить медианное значение.

Второй этап вариационного анализа – расчет показателей. Среднее значение в ряду рассчитывается как средняя арифметическая взвешенная.

Для интервального ряда среднее значение ряда считается по формуле(4):

= (4)

где – середина интервала (значение, лежащее в середине между верхней и нижней границей интервала);

– количество единиц в j-том интервале.

Подставим значения в формулу (4) и получим: = 102 больничных койки.

Для характеристики структуры вариационного ряда рассчитаем моду и медиану вариационного ряда, они рассчитываются по формулам (5) и (6) соответственно:

Mo = + (5)

где – начальное значение модального интервала,

, , - частота появления признака в интервале модальном, предшествующем модальному и следующем за модальным соответственно,

l – длина интервала.

В нашем случае модальный интервал {94-112} с частотой 45.

Mе = + (6)

где – начальное значение медианного интервала;

– накопленная частота в интервале, предшествующем медианному;

– частота появления признака в медианном интервале;

l – длина интервала.

Подставим значения и получим:

Mo = 94+18 = 101,5 койки.

Mе = 94+18 = 102,6

Проанализируем, насколько велик абсолютный и относительный разброс значений признака с помощью показателей силы и интенсивности вариации.

Размах вариации:

R= (7)

где – максимальное значение признака в ряду;

– минимальное значение признака в ряду.

Среднее линейное отклонение для интервального ряда:

d = (8)

где – середина интервала (значение, лежащее в середине между верхней и нижней границей интервала);

– количество единиц в j-том интервале.

Среднее квадратическое отклонение для интервального ряда:

σ = (9)

Подставим значения в формулы и получим:

Размах вариации:

R = 177 – 40 = 137 больничных коек

Размах вариации равен 137 больничных коек. Абсолютный разброс значений признака достаточно высок, но он дает лишь общее представление о размахе вариации, так как показывает только разницу между крайними значениями.

Среднее линейное отклонение:

d = = 11,3 больничных койки. Это означает, что в среднем число больничных коек на 10 000 человек населения отклоняется от среднего числа больничных коек на 10 000 человек населения на 11,3 койки.

Среднее квадратическое отклонение:

σ = больничных коек.

Среднее квадратическое отклонение равно 18,08. Это значит, что значение признака в совокупности отклоняется от средней величины в ту или иную сторону в среднем на 18 больничных коек.

Посчитаем все остальные показатели по вариационному ряду.

Дисперсия:

= (10)

= = 327 больничных коек.

Квадрат отклонений значений признака по регионам от среднего значения по всей стране равен 327 больничных коек.

Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации. Они вычисляются как отношения абсолютных показателей силы вариации к средней арифметической величине признака. Рассмотрим следующие показатели:

Относительный размах вариации:

ρ = (11)

ρ = = 1,34

Разница между максимальным и минимальным значениями превышает среднее значение почти в 1,5 раза. Таким образом, относительный разброс значений признака достаточно высок.

Относительное линейное отклонение:

m = ×100% (12)

m =

Относительное линейное отклонение, равное 0,11 показывает, что доля усредненного значения абсолютных отклонений от средней величины составляет 11%.

Коэффициент вариации:

V = ×100% (13)

V = ×100% = 17,7%

Коэффициент вариации отражает состояние между вариацией выборки и ее центром. Так как наше значение менее 33%, то совокупность можно считать однородной.

Для того чтобы представить, как именно распределены единицы совокупности по всему диапазону значений признака: симметрично или с заметным смещением в область более высоких или более низких значений, концентрируются в области среднего значения или распределены почти равномерно по всему диапазону, рассчитаем показатели асимметрии и эксцесса:

Коэффициент асимметрии рассчитывается по формуле:

As = (14)

где – центральный момент третьего порядка:

= (15)

= = 5338,5

As = = 0,9

Коэффициент асимметрии не равен нулю, следовательно, рассчитывать показатель эксцесса не имеет смысла.

Так как выполняется неравенство Me> >Mo, то распределение не симметричное. Коэффициент Асимметрии равен 0,9. Это говорит о правосторонней асимметрии, а так же о том, что большинство значений признака имеет значение ниже среднего.

Для удобства и наглядности все полученные значения в ходе вычислений сведем в таблицу 2.3

Номер по порядку

Название показателя

Значение показателя

1

Среднее значение, коек на10 000 тысяч человек

102

2

Мода, больничных коек на10 000 тысяч человек

101,5

3

Медиана, коек на10 000 тысяч человек

102,6

4

Размах вариации, коек на10 000 тысяч человек

137

5

Среднее линейное отклонение, %

11

6

Среднее квадратическое отклонение, больничных коек на10 000 тысяч человек

18

7

Дисперсия, (коек на10 000 тысяч человек)2

327

8

Относительный размах вариации, коек на 10 000 человек

1,34

9

Относительное линейное отклонение, %

11

10

Коэффициент вариации, %

17,7

11

Коэффициент асимметрии

0,9

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]