Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Алгоритм выполнения задания 1

.pdf
Скачиваний:
13
Добавлен:
25.03.2016
Размер:
858.3 Кб
Скачать

Алгоритм выполнения индивидуального задания 1

1)Скопируйте свой вариант задания на лист Excel.

2)Исключите суммарные итоги по федеральным округам и Российской федерации в целом (удалите эти строки).

3)Ранжируйте полученный вариационный ряд, используя кнопку .

4)Найдите первый и последний децили. Исключите из вариационного ряда значения первого и последнего дециля (используя статистическую

функцию «ПЕРСЕНТИЛЬ»). Для этого выбирается , категория

статистические

, функция ПЕРСЕНТИЛЬ

, заполните раскрывшееся окно

Значение К=0,1, поскольку первый дециль составляет одну десятую часть персентиля. Для нахождения последнего персентиля вместо 0,1

проставьте 0,9

Регионы, попавшие в первый и последний дециль выделите курсивом и заливкой, они из анализа исключаются.

5) Для оставшегося вариационного ряда постройте интервальный ряд распределения с равными интервалами, предварительно рассчитав количество групп по формуле Стерджесса n = 1 + 3,322 lgN,

где n — число групп; N — число единиц совокупности. Поскольку оставшихся регионов 63, n = 1 + 3,322 lg63=7.

6) Рассчитайте интервал группировки. h R xmax xmin n n

где xmax = 8268,7 и xmin = 607,9 максимальное и минимальное значения

признака в совокупности; n=7 - число групп. Тогда h 8268,7 607,9 =1094,4

7

Определите начальные и конечные значения каждого из 7 интервалов по

формуле hконечные = hначальные + h, например, h1конечное = h1начальное + h= 607,9 +

1094,4 = 1702,3. Каждый из интервалов удобно выделить своей заливкой.

7) Определите количество единиц в каждой группе и накопленную частоту. Накопленная частота рассчитывается путем последовательного суммирования частот предшествующих интервалов.

8)Рассчитайте среднюю взвешенную величину по формуле x xi f i

f i

где x - средневзвешенная арифметическая всего интервального ряда, xi -

средняя арифметическая в каждой группе, f i - число элементов (частота) в

каждой группе.

9) Рассчитайте моду (значение признака, наиболее часто встречающееся в исследуемой совокупности) по формуле

Mo x0 i

f

 

f

 

f

 

 

 

f

 

 

f

 

Mo

f

 

 

 

 

 

 

 

Mo 1

 

 

 

 

Mo

 

M 0 1

 

 

Mo

 

 

Mo 1

 

 

 

 

 

 

 

где x0 и i - соответственно нижняя граница и величина модального интервала; fMo , fMo 1, fMo 1 - частоты модального, предмодального и послемодального интервалов. В рассматриваемом примере модальный интервал (тот, в

который входит наибольшее количество элементов) – второй (в него входят

25 регионов). Тогда нижняя граница равна 1702,3, частоты модального интервала равна 25, предмодального интервала равна 17, послемодального интервала равна 6, величина модального интервала равна интервалу группировки 1094,4.

Мода равна Mo 1702,3 1094,4 25 17 2026,625 17 25 6

10)Рассчитайте медиану( значение признака, приходящееся на

середину

 

 

ранжированной

(упорядоченной) совокупности по

формуле

 

 

 

1

m

 

 

 

 

 

 

 

 

f i

S Me 1

 

 

 

Me x0 i

 

2

 

 

 

 

1

 

,

где x0

и i — соответственно нижняя граница и

 

 

f

 

 

 

 

 

Me

 

 

 

величина

медианного интервала;

fMe — частота медианного

интервала;

SMe 1 — кумулятивная частота предмедианного интервала.

В интервальном ряду медианным интервалом является тот в который попадает половина суммарного значения 63/2 = 31,5. В рассматриваемом примере модальный интервал второй. Тогда нижняя граница равна 1702,3,

частоты модального интервала равна 25, кумулятивная частота

предмедианная интервала равна 17, величина модального интервала равна интервалу группировки 1094,4.

 

1

63 17

 

Медианная частота равна Me 1702,3 1094,4

2

2337,1

 

 

25

 

 

 

 

11) Постройте полигон распределения (графического изображения

дискретного вариационного ряда), строится по столбцам Число элементов.

Полигон распределения

30

 

 

 

 

 

 

 

 

 

 

 

25

 

 

 

 

 

 

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

17

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

Число элементов

 

 

 

 

 

 

 

 

10

 

 

 

6

4

4

 

7

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

 

Интервалы

12) Постройте кумуляту интервального ряда распределения. Она

строится по столбцу Накопленная частота.

 

 

 

 

 

Кумулята

 

70

 

 

 

 

56

56

63

60

 

 

 

52

 

 

 

48

 

 

 

50

 

42

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

30

17

 

 

 

 

 

Накопленная

 

 

 

 

 

 

20

 

 

 

 

 

частота

 

 

 

 

 

 

10

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

 

 

 

 

Интервалы

 

 

13) Сделайте вывод об однородности совокупности. Для такого вывода нужно рассчитать коэффициент вариации, а для этого сначала рассчитать среднеквадратическое отклонение, для определения которого,

ранее нужно рассчитать дисперсию.

а) Расчёт дисперсии (среднего квадрата отклонений индивидуальных значений от средней величины по формуле

 

n

 

2

xi x 2 f i

1

 

 

n

 

 

f i

 

 

1

Например, для первого интервала числитель дисперсии рассчитывается

(1176,2- 2942,60)2*17=53045413

Дисперсия равна 4129771,1

б) Расчёт среднеквадратического отклонения (оно показывает, на сколько в среднем отклоняются конкретные варианты признака от его

среднего значения). Вычисляется как квадратный корень из дисперсии.

Среднеквадратическое отклонение равно 2032,2

в) Расчёт коэффициента вариации (она характеризует долю усредненного значения отклонений от средней величины). При этом совокупность считается однородной, если V не превышает 33%.

Коэффициент вариации рассчитывается по формуле v x 100%

V=2032,2/2942,6*100%=70%. Вывод – совокупность неоднородна.

14)Определите скошенность и величину асимметрии.

15)

Для характеристики асимметрии применяется нормированный

 

 

 

 

 

 

n

xi x 3 fi

 

 

 

 

3

 

 

 

момент третьего порядка:

As

 

i 1

 

.

 

 

n

 

 

 

 

3

 

 

 

 

 

 

 

 

 

fi 3

 

i 1

As=0, т. е. x Мо , если ряд распределения симметричен;

As >0, т.е. x Мо ,если скошенность ряда правосторонняя;

As <0, т.е. x Мо ,если скошенность ряда левосторонняя;

Если As < 0,5 (независимо от знака) то асимметрия считается незначительной.

Если As > 0,5 то асимметрия считается значительной.

Например, для первого интервала числитель асимметрии рассчитывается

(1176,2- 2942,60)3*17= -93701660477

As

719566Å 11

1,36

63* 2032,23

 

 

 

 

Асимметрия равна 1,36. Вывод: скошенность правосторонняя(>0) и

значительная(>0,5).

Оценка степени существенности этого показателя дается с помощью

средней квадратической ошибки, рассчитываемой по

формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

As

 

 

 

 

 

 

 

 

6 n 1

 

 

, где n — число наблюдений.

 

 

 

 

n 1 n

3

 

 

 

 

 

 

 

 

 

 

 

 

Если

 

 

As

 

 

 

 

 

3 , то

асимметрия

существенна и распределение

признака в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

As

 

 

 

 

 

 

 

 

 

генеральной совокупности не является симметричным.

 

Если

 

 

As

 

 

3 , то

асимметрия

несущественна, ее наличие

объясняется

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

As

 

 

 

 

 

 

 

 

 

влиянием случайных обстоятельств.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

As

 

 

 

 

 

 

 

 

 

 

6 (63 1)

 

0,3;

 

1,36

4,59 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(63 1) (63 3)

 

0,3

 

 

 

 

 

 

 

 

 

 

Т.е., > 2, асимметрия существенна.

16) Рассчитайте эксцесс и сделайте вывод о нормальности распределения. Под эксцессом понимается степень островершинности

(крутизны) распределения, при этом в качестве эталона берется нормальное распределение.

17)

Характеристикой

эксцесса

является нормированный момент

 

 

 

 

 

 

n

 

 

 

 

 

4

 

xi x 4 fi

четвертого порядка

Ex

 

i 1

 

3 .

 

n

 

 

 

 

 

4

 

 

 

 

 

 

 

 

fi 4

 

 

i 1

Для вариационного ряда нормального распределения Ех = 0.

Для более островершинных распределений, чем нормальное, Ех > 0, для более плосковершинных Ех < 0.

Например, для первого интервала числитель эксцесс рассчитывается (1176,2- 2942,60)4*17= 1,65519E+14.

Числ.эксцесса

 

1,65519E+14

 

1,09829E+13

 

48808620698

 

1,74119E+13

 

1,20002E+14

 

0

 

3,64637E+15

 

Ex 3,96034Е 15

3 0,7 .

63 2032,24

 

Вывод: Эксцесс равен 0,7. Распределение островершинное (>0).

Предельным значением отрицательного эксцесса является значение Ех=-2;

величина положительного эксцесса является величиной бесконечной. В

нормальном распределении 44 3 .

Средняя квадратическая ошибка эксцесса исчисляется по формуле

Ex

Если

24 n n 2 n 3 , где n — число наблюдений.

n 1 2 n 3 n 5

Ex 2 , то распределение можно считать нормальным.

Ex

 

 

 

 

 

 

24 63 (63 2) (63 3)

 

0,6 .

Ex

 

 

 

(63 1)2 (63 3) (63 5)

 

 

 

 

 

 

 

 

Ex

 

 

 

0,7

 

 

1,22 2 , т.е. распределение можно считать нормальным.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ex

 

 

0,6

 

 

 

 

 

Выборочное наблюдение — это способ несплошного статистического наблюдения, при котором обследуются не все единицы изучаемой

(генеральной) совокупности, а лишь часть ее (выборка), отобранная по определенным правилам и обеспечивающая получение данных,

характеризующих совокупность в целом.

Вся изучаемая совокупность называется генеральной совокупностью.

Часть генеральной совокупности, которая подвергается обследованию – называется выборочной совокупностью (выборкой). Для того, чтобы выборочная совокупность давала объективные результаты, она должна быть

репрезентативной (каждая единица генеральной совокупности должна иметь равную возможность попасть в выборку).

Некоторые единицы могут попадать в выборку дважды, трижды или даже большее число раз. Такой отбор в выборку называется повторным.

При бесповторном отборе попавшая в выборку единица подвергается обследованию и в дальнейшей процедуре отбора не участвует.

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике выборочных