Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
вариант 10 Задача 1.1-1.10.doc
Скачиваний:
4
Добавлен:
18.09.2019
Размер:
1.47 Mб
Скачать

Задача 1.8

По данным задачи 1.7 (вторая таблица) построить статистические графики – полигон, гистограмму, кумуляту.

Решение

Для построения графиков используется следующая информация.

Таблица 1

№ группы

Значение интервалов

Середина интервала, Х´

Частоты, f

Накопленные частоты "Cum f"

1

10000-21150

15575

2

2

2

21150-32300

26725

4

6

3

32300-43450

37875

7

13

4

43450-54600

49025

9

22

5

54600-65750

60175

4

26

6

65750-76900

71325

4

30

Итого

 

 

30

 

Полигон применяют для дискретных рядов распределения. Это график, на котором ряд распределения изображается в виде линейной диаграммы. Если ряд интервальный, то в полигоне частоты изображаются через точки, соответствующие серединам интервалов.

Середина интервала рассчитывается как средняя арифметическая простая:

Х´с = (Хн + Хв) /2 (1),

где Хн, Хв – соответственно нижняя и верхняя граница интервала.

Например, середина первого интервала равна

Х´с= (10000+21150)/2 = 15575 и т. д. см. таблицу 1, гр. 3.

Полигон распределения данных о денежных доходах семей в месяц представлен на рис. 1.

Рис. 1. Полигон распределения семей по денежным доходам в месяц

Для изображения интервального вариационного ряда служит гистограмма.

Для ее построения в прямоугольной системе координат по оси абсцисс откладывают отрезки, изображающие интервалы варьирования, и на этих отрезках, как на основании, строят прямоугольники с высотами, равными частотам (или частостям) соответствующего интервала. В результате получают ступенчатую фигуру, состоящую из прямоугольников, которую и называют гистограмма.

На рисунке 2 представлена гистограмма ряда распределения семей по денежным доходам в месяц.

Рис. 2. Гистограмма распределения семей по денежным доходам в месяц

Для построения кумуляты на оси абсцисс откладывают размеры изучаемого признака (х1), а по оси ординат накопленные частоты. Кумулята представлена на рисунке 3.

Рис. 3. Кумулята распределения семей по денежным доходам в месяц

Задача 1.9

По исходным данным выполнить.

  1. Рассчитать следующие статистические характеристики:

-среднее значение признака,

-дисперсию,

-среднеквадратическое отклонение.

Расчеты произвести способом моментов.

  1. Определите моду, медиану, децильный коэффициент дифференциации. Моду и медиану изобразите графически.

  2. Рассчитайте показатели эксцесса и ассиметрии основанные на определение центральных моментов третьего и четвертного порядка. Поясните полученные результаты.

Решение

1. Используя свойства средней арифметической, можно упростить расчеты. Расчет средней арифметической по способу «моментов» осуществляется по формуле:

Хср. = m1* i + А (1),

где А – условная величина, равная середине интервала, имеющего наибольшую частоту,

i – величина интервала,

m1 - условный момент первого порядка, который для индивидуальных значений признака рассчитывается по формуле:

m1 =  а / n (2),

для групповых данных:

m1 =  а * /  (3),

где а = (i - А): i (4),

где А - условная варианта.

Примем А=48500, i=10000.

Расчет по индивидуальным данным представлен в таблице 1.

Таблица 1

Расчет дисперсии по способу «Моментов»

№ п/п единиц наблюдения

Денежные доходы семьи за месяц, руб. Х1

х-А

Расчетные величины

(х-А)/i

((X-A)/i)²

1

2

3

4

5

1

14400

-34100

-3,41

11,6281

2

15250

-33250

-3,325

11,055625

3

26800

-21700

-2,17

4,7089

4

26900

-21600

-2,16

4,6656

5

27640

-20860

-2,086

4,351396

6

29680

-18820

-1,882

3,541924

7

30200

-18300

-1,83

3,3489

8

38100

-10400

-1,04

1,0816

Окончание таблицы 1

1

2

3

4

5

9

38250

-10250

-1,025

1,050625

10

38900

-9600

-0,96

0,9216

11

39600

-8900

-0,89

0,7921

12

39600

-8900

-0,89

0,7921

13

39680

-8820

-0,882

0,777924

14

44400

-4100

-0,41

0,1681

15

44800

-3700

-0,37

0,1369

16

45000

-3500

-0,35

0,1225

17

45400

-3100

-0,31

0,0961

18

46560

-1940

-0,194

0,037636

19

47100

-1400

-0,14

0,0196

20

48500

0

0

0

21

48500

0

0

0

22

48700

200

0,02

0,0004

23

55800

7300

0,73

0,5329

24

56450

7950

0,795

0,632025

25

57100

8600

0,86

0,7396

26

58900

10400

1,04

1,0816

27

65240

16740

1,674

2,802276

28

67215

18715

1,8715

3,50251225

29

68760

20260

2,026

4,104676

30

76890

28390

2,839

8,059921

Сумма

1330315

 

-12,4685

70,75314025

По полученным данным имеем:

Условный момент первого порядка:

m1 = -12,4685/30 = -0,4156

Хср = -0,4156*10000 + 48500 = 44343,83 (руб.)

б) дисперсия по способу “моментов” определяется по формуле:

² = ² * m2 – m1²) (5),

где - величина интервала;

m1 – условный момент первого порядка;

m2– условный момент второго порядка, который определяется по формуле:

для индивидуальных значений признака

m2=  а²/ n (6),

для групповых данных

m2= а²*/ (7),

Подставляя данные из таблицы 1, получаем:

Условный момент второго порядка m2=70,7531/30=2,3584;

Дисперсия δ²= 10000² * [2,3484 – (-0,4156)²] = 218570079;

в) Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии, т. е.

δ=² = 218570079= 14784,116

2. Сгруппируем данные таблицы 1, образовав 6 групп, приняв нижнюю границу первого интервала 10000 и величину интервала 11150. Рассчитаем средние значения по группам как средние арифметические простые (см. табл. 2, гр. 1-4).

Таблица 2

Расчет показателей вариации по сгруппированным данным признака х1

Номер группы

Нижние и верхние границы интервалов

Средняя по группе Xs

Чис

ло наблюдений fs

(Xs-A)

(Xs-A)/i

((Xs-A)/i)*fs

((Xs-A)/i)²

((Xs-A)/i)²*f

1

10000-21150

14825,00

2

-30075,00

-2,70

-5,39

7,2755

14,5510

2

21150-32300

28244,00

5

-16656,00

-1,49

-7,47

2,2315

11,1574

3

32300-43450

39021,67

6

-5878,33

-0,53

-3,16

0,2779

1,6677

4

43450-54600

46551,11

9

1651,11

0,15

1,33

0,0219

0,1974

5

54600-65750

58698,00

5

13798,00

1,24

6,19

1,5314

7,6569

6

65750-76900

70955,00

3

26055,00

2,34

7,01

5,4605

16,3815

Итого

 

 

30

-11105,22

-1,00

-1,50

16,7987

51,6117

Используя выше приведенные формулы, рассчитаем статистические характеристики для сгруппированных данных.

Примем значение А серединное значение дискретного ряда: (44800+45000)/2 = 44900, тогда моменты

- первого порядка m1 = -1,5/30 =-0,04988

- второго порядка m2 = 51,6117/30 =1,7204

Среднее значение признака Х1: Хср=11150*(-0,04988)+44900 = 44343,83 (руб.)

Дисперсия равна σ² = 11150²(1,7204-(-0,04988²) = 213574023,7

Среднее квадратическое отклонение: σ = √213574023,7= 14614,17

Как показывают расчеты, средние величины, рассчитанные по индивидуальным и групповые данным, полностью совпали, между дисперсиями имеется незначительное различие.

2. Медианой называют значение признака, приходящееся на середину ранжированного ряда наблюдений.

Чтобы рассчитать медиану нужно определить накопленные частоты (S) суммированием частот данной группы и частот предыдущих групп.

Например, накопленная частота 1 группы будет равна 8;

Второй группы S2=8+6 =14; третьей группы S3=14+7=21; и т. д. см. табл. 3, гр. 4.

В интервальном ряду медиана рассчитывается по следующей формуле:

 /2 – Sме-1

Ме = Хме + ------------------ * i (8)

 ме

где Хме – низшая граница интервала, в котором находится медиана,

Sме-1 – накопленная частота в интервале, предшествующем медианному,

 ме – частота в медианном интервале, i - величина интервала.

Таблица 3

Накопленные частоты в интервальном ряду

Номер группы

Значение интервалов

Частота

S

1

10000-21150

2

2

2

21150-32300

5

7

3

32300-43450

6

13

4

43450-54600

9

22

5

54600-65750

5

27

6

65750-76900

3

30

Итого

30

Совокупность состоит из 30 предприятий, т. е.  +1/2=30+1/2=15,5

В ряду, приведенном в таблице 3, медианным является интервал четвертый (43450 - 54600), так как по накопленным частотам видно, что 15,5-е значение признака находится в нем. Нижняя граница интервала Хме=43450,  ме = 9.

Тогда, Ме =43450 + 11150*(15,5 - 13)/9 = 46547,22 руб., т.е. одна половина семей имеет денежные доходы в месяц в среднем менее 46547,22 руб., другая – более 46547,22 руб.

Модой (Мо) называют такое значение признака, которое наблюдалось наибольшее число раз. В случае интервального вариационного ряда мода вычисляется по следующей формуле:

мо - мо-1

Мо = Хмо + ---------------------------------------------*i (9)

(мо - мо-1) + (мо - мо+1)

где Хмо – нижняя граница модального интервала,

мо - частота в модальном интервале,

мо-1 - частота в интервале, которая предшествует модальному,

мо+1 - частота в интервале, следующего за модальным,

i - величина интервала.

Для рассматриваемого ряда модальный интервал четвертый (43450 - 54600), так как  мо = 9 =max!

Тогда мода равна:

Мо = 43450 + 11150 * [(9 – 6) / (9 – 6) + (9 –5)] = 48228,57 (руб.), т.е. на анализируемый момент времени преобладает среди семей средний размер денежного дохода в месяц, равный 48228,57 руб.

Моду и медиану в интервальном ряду можно определить графически. Мода строится по гистограмме. Для этого выбирается самый высокий прямоугольник, который является модальным, и его вершины соединяются с вершинами предшествующего и последующего прямоугольников. Абсцисса точек пересечения этих прямых и будет модой ряда распределения (см. рис. 1).

Рис. 1. Графическое изображение моды

Медиана строится по кумуляте. Для чего из точки на шкале постоянных частот, соответствующей 50 % проводится прямая параллельная линия оси абсцисс до пересечения с кумулятой. Затем из точки пересечения опускается перпендикуляр на ось абсцисс и медиана определена (см. рис. 2).

Рис. 2. Графическое изображение медианы

Под децилем понимается варианта, которая делит ранжированную по доходам совокупность на десять равных по объему групп (Di). По сгруппированным данным рассчитываются децили:

ki ΣF –cum fDi-1

Di = XDimin + i ---------------------- (10),

fDi

где Di- i-й дециль;

i- номер дециля, I=1~9 (рассчитывается девять децилей);

XDimin - нижняя граница интервала, содержащая i-й дециль (определяется по накопленным частотам);

i - величина интервала по доходу;

ki – коэффициент, соответствующий номеру дециля: для D1 к1=10, для D2 к2=20. . . . для D9 к9=90;

Σf - объем совокупности (общее число данных);

cum fDi-1 - накопленная частота в интервале, предшествующем интервалу, содержащему i-й дециль;

fDi – частота интервала, содержащего i-й дециль.

На основе данных таблицы 3 первый дециль расположен во втором интервале (21150-32300), тогда

D1=21150+11150*(1*30/10 – 2)/5=23380 руб.

Первый дециль 23380 руб., характеризует максимальный денежный доход семьи в месяц 10 % наименее состоятельных семей.

Девятый дециль, расположенный в пятом интервале:

D9= 54600 + 11150(9*30/10 – 27)/2 = 54600 руб.

Характеризует минимальный денежный доход семьи в месяц 10 % наиболее состоятельных семей.

Децильный коэффициент дифференциации рассчитывается по формуле:

ДКД = D9*100/ D1 (11)

ДКД = 54600*100/23380 = 233,5 % или в 2,3 раза.

Таким образом, наиболее состоятельные семьи имеют среднемесячный доход в среднем в 2,3 раза больше, чем менее состоятельная часть семей.

3. Относительный показатель ассиметрии рассчитывается на основе центрального момента третьего порядка по формуле:

М3

Аs = -------- (12)

σ³

Эксцесс рассчитывается на основе центрального момента четвертого порядка по формуле:

М4

Ех = -------- - 3 (13)

4

σ

Определение выше названных коэффициентов предполагает расчет условных моментов 3-го и 4-го порядка по формулам:

Σа³f

m3 = --------- (14)

Σf

4

Σа *f

m4 = --------- (15)

Σf

Промежуточные расчеты представлены в таблице 3.

Таблица 3

Расчет условных моментов третьего и четвертого порядка

Номер группы

Средняя по группе Xs

Число наблюдений fs

(X-A)

(X-A)/i

((X-A)/i)³

((X-A)/i)³*f

((X-A)/i)4

((X-A)/i)4*f

1

14825,00

2

-30075,00

-2,70

-19,62

-39,25

52,93

105,8652

2

28244,00

5

-16656,00

-1,49

-3,33

-16,67

4,98

24,8974

3

39021,67

6

-5878,33

-0,53

-0,15

-0,88

0,08

0,4635

4

46551,11

9

1651,11

0,15

0,00

0,03

0,00

0,0043

5

58698,00

5

13798,00

1,24

1,90

9,48

2,35

11,7256

6

70955,00

3

26055,00

2,34

12,76

38,28

29,82

89,4512

Итого

 

30

-11105,22

-1,00

-8,45

-9,01

90,15

232,4072

Подставляя данные из таблицы 4, получим

m3 = -9,01/30 = -0,3 m4 = 232,4072/30 = 7,7469

Перейдем от условных моментов к центральным по формулам:

М3 = с³(m3 – 3m2m3 + 2 m1³) (16)

4 4

М4 = с (m4 – 4m3m1 + 6m2m1² - 3 m1) (17)

Подставляя данные получим М3=11150³(-0,3-3*1,7204*(-0,3)+2*(-0,04988)³) =-2,8015Е+12; М4 = 1,17824Е+17

Показатель ассиметрии Аs =( -2,8015Е+12)/(14614,17³) =- 0,898

Показатель ассиметрии отрицательный, это свидетельствует о левосторонней ассиметрии, что подтверждается расчетами

Хсредняя =44343,83<Ме=46547,22<Мо=48228,57.

4

Ексцесс равен: Ех = 1,17824Е+17/(14614,17) - 3,0 = -0,417

Так как Ех < 0, то вершина плоская и находится ниже кривой нормального распределения.