Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УМК ЧЕЛНОКОВОЙ С.В. СТАТИСТИКА

.pdf
Скачиваний:
54
Добавлен:
12.02.2015
Размер:
2.32 Mб
Скачать

единиц совокупности (№ хозяйства). Дискретный вариационный ряд изображается в виде полигона, на оси абсцисс которого откладываются ранжированные значения варьирующего признака (например, число членов домохозяйства -1,2,3,4,5,6 и т.д.), а на оси ординат наносится шкала для выражения величины частот (частостей). Интервальный ряд изображается в виде столбиковой гистограммы, на оси абсцисс которой откладываются основания столбиков – интервалы значений варьирующего признака (например, число жителей сельского населенного пункта, чел. 1-10; 11-50; 51-100; 101-500 и т.д.), а на оси ординат – вы-

соты столбиков – частоты (частости). Интервальный ряд можно изобразить и в виде полигона, если середины вершин столбиков последовательно соединить ломаной линией.

При построении кумуляты интервального вариационного ряда на оси абсцисс откладываются варианты признака (например, заработная плата 1 работника, руб.), а по оси ординат накопленные частоты (число работников). Накопленные частоты показывают, сколько единиц совокупности или какая их доля не превышает данное значение, и вычисляются путем последовательного прибавления к частотам первой группы частот последующих групп ряда распределения. Если у графического изображения вариационного ряда в виде кумуляты оси поменять местами, то получится огива.

Эти графики наглядно показывают, как изменяется значение признака того или иного явления в данной совокупности.

5.2. Показатели вариации и способы их расчета

Для обобщающей характеристики совокупности средняя величина сама по себе недостаточна, поскольку два ряда распределения, имеющие одинаковую среднюю величину могут значительно отличаться друг от друга по степени колеблемости величины изучаемого признака. Поэтому для всестороннего анализа явлений необходимо рассмат-

ривать систему абсолютных и относительных показателей вариации.

В математической статистике наиболее широкое применение получили

5обобщающих показателей вариации:

1.Размах вариации (амплитуда вариации) R.

2.Среднее линейное отклонение d .

3.Дисперсия σ2.

4.Среднее квадратическое отклонение σ.

5.Коэффициент вариации V.

Размах вариации – это абсолютная разность между наибольшим и наименьшим значениями признака R = Χ max − Χ min . Этот показатель

51

указывает на общие размеры вариации. Он не дает представление о степени вариации внутри совокупности, так как вычисляется на основе двух крайних значений признака.

Среднее линейное отклонение – отражает все колебания варьи-

рующего признака, так как представляет собой среднюю арифметическую из абсолютных отклонений конкретных вариант от среднего значения признака. Для первичного ряда рассчитывается простое, а для

вариационного ряда взвешенное среднее линейное отклонение:

 

 

 

 

Χi

 

 

 

 

 

 

Χ i

 

fi

 

 

 

 

 

Χ

 

 

 

 

 

Χ

 

d =

 

(простое)

d =

(взвешенное)

 

 

n

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку у средней арифметической сумма отклонений значения признака от средней величины равна нулю, приходится все отклонения брать по модулю, на что указывают прямые скобки в числителе.

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины или, иначе, это сумма квадратов отклонений в расчете на одну единицу совокупности. Простое решение – возвести отклонения во вторую степень, чтобы иметь дело только с положительными величинами, привело к большим научным результатам. Дисперсия получила широкое распространение во всех областях знаний. В зависимости от исходных данных бывает простой и взвешенной:

 

 

 

∑(Χi

 

)2

 

 

 

 

∑(Χ i

 

)2 fi

 

 

 

 

Χ

 

 

 

 

 

σ

2

=

(простая)

σ

2

=

Χ

(взвешенная)

 

n

 

fi

 

 

 

 

 

 

 

 

Поскольку варианты признака выражены в первой степени, то и мера их вариации должна быть взята в первой степени. Для этого достаточно извлечь корень квадратный из дисперсии и получится среднее квадратическое отклонение σ

Среднее квадратическое отклонение показывает среднее отклонение признака от средней величины, бывает простым и взвешенным:

 

 

 

 

 

 

 

 

 

 

 

 

∑(Χi

 

)2

 

 

 

 

 

∑(Χi

 

)2 fi

 

 

Χ

 

σ =

(простое) σ =

Χ

(взвешенное)

n

 

 

 

fi

 

 

 

 

 

 

Все рассмотренные выше показатели вариации, за исключением дисперсии, являются абсолютными и имеют те же единицы измерения, что и признак. Но для целей сравнения колеблемости различных признаков в одной и той же совокупности или при сравнении колеблемости одного и того же признака в разных совокупностях возникает необходимость расчета относительных показателей вариации. Эти пока-

52

затели рассчитываются как отношение абсолютных показателей вариации к средней арифметической величине:

Коэффициент осцилляции VR = ΧR ×100%

Линейный коэффициент вариации Vd = Χd ×100% . Но наиболее

часто в практических расчетах применяется коэффициент вариации Vσ = σΧ ×100% . Он показывает тоже самое, что и среднее квадратиче-

ское отклонение, только в %.

Пример 1.Имеются следующие данные о валовом сборе и урожайности сахарной свеклы (фабричной) по группе хозяйств района:

Хозяйства

Валовой сбор

Урожайность с 1 га, ц

 

свеклы, ц

 

1

16500

165

2

22500

180

3

12000

150

4

19500

130

5

22000

200

Определите: 1) среднюю урожайность свеклы по пяти хозяйствам района; 2) размах вариации, среднее квадратическое отклонение и коэффициент вариации. Сделайте краткие выводы.

Решение.

1) Среднюю урожайность свеклы по пяти совхозам района определим по формуле средней гармонической взвешенной:

 

 

= W =

16500ц + 22500ц+12000ц+19500ц+ 22000ц

=

 

Χ

 

16500ц + 22500ц + 12000ц + 19500ц + 22000ц

 

 

W

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Χ

165ц/ га 180ц/ га

150ц/ га 130ц/ га 200ц/ га

 

 

 

 

 

 

92500ц

 

 

=

92500ц

= 164ц/ га

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100га+125га+ 80га+150га+110га 565га

 

2) Размах вариации R = Χmax − Χmin

= 200 −130 = 170(ц / га)

 

53

Среднее квадратическое отклонение:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ =

 

(Χ i

Χ

)2

fi

=

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(165 − 164 )2100 + (180 − 164 )2125 + (150 − 164 )2 80 +

 

 

=

 

+ (130 − 164 )2150 + (200 − 164 )2110

 

= 25,4(ц / га).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

565

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент вариации: V =

σ

 

×100 =

25,4

×100 = 15,49%

 

 

 

 

 

 

 

 

 

 

 

Χ

164

 

 

 

Вывод: средняя урожайность свеклы составила 164 ц/га. Колеблемость урожайности около средней величины невелика и составляет 25,4 ц/га или 15,49%, следовательно, совокупность хозяйств однородна по урожайности сахарной свеклы.

Среднее квадратическое отклонение и коэффициент вариации яв-

ляются мерилами надежности средних. Чем меньше σ и V, тем одно-

роднее изучаемая совокупность явлений и надежнее полученная средняя по всей совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Согласно математической статистике, изучающей законы нормального распределения, существует правило трех сигм в симметричных и близких к ним распределениях. В таких рядах распределения отклонения значений признака от средней величины не превосходят 3σ. В этом случае вероятность такого суждения составляет 0,997.

Среди множества варьирующих признаков, существуют такие признаки, которыми обладают одни единицы совокупности и не обладают другие. Такие признаки называются альтернативными. Примером может служить работа по специальности или не по специальности. Доля единиц, обладающих признаком, обозначается p, а доля единиц, не обладающих признаком - q. Очевидно, что p + q = 1. Дисперсия альтернативного признака вычисляется по формуле: σ p2 = pq . Корень

квадратный из этой дисперсии соответствует среднему квадратическому отклонению альтернативного признака: σ p = σ 2p = pq .

5.3. Виды дисперсий и правила их сложения

Дисперсия обладает рядом свойств:

1) Дисперсия постоянной величины равна нулю.

54

2)Если все варианты значений признака уменьшить на одно и то же произвольное число, то дисперсия не измениться: σ (2Χ− А) = σ Χ2 .

3)Если все варианты значения признака уменьшить в k раз, то дисперсия уменьшится в k2 раз, а среднее квадратическое отклонение в k раз:

σ 2Χ = σ Χ2 ¸ k 2

 

 

 

k

4) Дисперсия от средней всегда меньше дисперсии, исчисленной от любой произвольной величины А, то есть она имеет свойство ми-

нимальности:

σΧ2 σ А2 σ Χ2 = σ А2 - (C - А)2

Вслучае когда А приравнивается к нулю и, следовательно не вы-

числяются отклонения, формула принимает вид:

σ Χ2 = C2 - (C)2

На приведенных свойствах дисперсии основывается упрощенный расчет среднеквадратического отклонения по способу моментов или

отсчета от условного нуля: σ = iμ2 - μ12 , где первый момент исчисляется

 

 

C - А

× f

 

 

C - А

2

 

 

 

 

 

× f

μ1 =

 

i

 

, а второй μ2

=

 

i

 

.

 

f

 

 

f

 

 

 

 

 

 

 

 

 

Для оценки влияния факторов, определяющих колеблемость индивидуальных значений признака, используют прием разложения дисперсии.

Выделяют 3 вида дисперсий: общую, межгрупповую и внутри-

групповую (остаточную). Их расчет производится для первичного и вариационного рядов.

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:

 

 

 

∑(C -

 

о )2

 

 

 

∑(C -

 

 

о )2

f

 

 

 

C

 

 

 

σ

2

=

σ

2

=

C

общ

n

 

общ

f

 

 

 

 

 

 

 

 

 

 

 

(для первичного)

 

(для вариационного)

Межгрупповая дисперсия характеризует систематическую вариацию изучаемого признака, возникающую под влиянием признака – фактора. Чем больше удельный вес занимает эта дисперсия в общей, тем сильнее влияние факторного признака:

55

 

 

 

∑(

 

гр

 

о )2

 

 

 

 

(

 

гр

 

о )2

f

 

 

 

Χ

Χ

 

 

 

 

σ

2

=

σ

2

 

=

Χ

Χ

межгр

 

 

n

 

межгр

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

(для первичного)

 

 

 

(для вариационного)

Внутригрупповая, или остаточная, дисперсия характеризует ва-

риацию изучаемого признака, возникающую под влиянием случайных, неучтенных факторов и не зависящую от признака – фактора. Она рассчитывается как средняя арифметическая величина из внутригрупповых дисперсий:

 

 

 

 

 

 

 

 

 

 

σ

ост2

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

ост2 =

 

, где

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

(Χ i

 

 

гр )2

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(Χ i

 

 

гр )2

f

 

 

 

 

Χ

 

 

 

 

 

 

σ

2

 

=

 

 

 

σ

2

 

=

Χ

ост

i

n

 

 

 

 

ост

i

f

 

 

(для первичного)

 

 

 

 

(для вариационного)

 

Числители этих дисперсий, то есть суммы квадратов отклонений, носят название общей, межгрупповой и остаточной вариации и обозначаются буквой W с соответствующим подстрочным знаком.

Между тремя видами дисперсий существует определенное соотношение, которое называют правилом сложения дисперсий: общая дисперсия равна сумме межгрупповой и средней из внутригрупповых дисперсий:

σ общ2 = σ межгр2 + σ ост2 . Поскольку при расчете этих дисперсий используется один и тот же знаменатель – n, то из правила сложения дисперсий следует и правило сложения вариаций Wобщ = Wмежгр + Wост .

Зная любые две дисперсии или вариации можно вычислить или проверить правильность расчета третьей.

Отношение межгрупповой дисперсии к общей носит название эм-

пирического коэффициента детерминации: η 2 =

σ межгр2

=

Wмежгр

.

 

σ 2

 

W

общ

 

общ

 

 

Он показывает долю (удельный вес) вариации изучаемого признака, складывающейся под влиянием признака – фактора в общей вариации.

Корень квадратный из эмпирического коэффициента детермина-

ции носит название эмпирического корреляционного отношения, кото-

рое изменяется в пределах от 0 до 1, характеризует силу влияния признака – фактора на вариацию изучаемого признака и вычисляется по формуле:

56

η =

 

=

 

σ межгр2

 

=

Wмежгр

η 2

σ 2

W

 

 

 

 

 

 

 

 

 

 

общ

 

 

общ

Чем ближе η к нулю, тем слабее влияние признака – фактора, чем ближе к единице, тем сильнее это влияние.

5.4. Дисперсионный анализ

На сравнении дисперсий основан дисперсионный анализ, посредством которого устанавливается существенно или несущественно влияние признака – фактора на результат. Строится он по следующей схеме:

1)Определяются общая, межгрупповая и остаточная вариации, то есть соответствующие квадраты отклонений.

2)Для каждой из вариаций определяется число степеней свобо- ды, то есть число свободно варьирующих признаков при неизменной характеристике всей совокупности. Для общей вариации число степеней свободы равно N – 1, где N – число единиц совокупности (число наблюдений), равное произведению числа групп (m) на количество повторностей (n), то есть N = mn. Для межгрупповой вариации степень свободы равна m – 1, а для остаточной (N – 1) – ( m – 1) или N – m .

3)Определяются дисперсии на одну степень свободы путем деления вариаций на соответствующее число степеней свободы. Эти дисперсии называются общей, факторной и остаточной и обозначают-

ся уже не σ2, а S2:

S 2 =

Wобщ

S 2 =

Wмежгр

S 2 =

W

 

 

 

 

ост

N

− 1

m − 1

N m

общ

фактор

ост

 

 

 

 

 

4) Вычисляют фактический F-критерий как отношение факторной дисперсии к остаточной:

= Sфактор2

Fфакт Sост2

и сравнивают его с табличным, которое находят по таблице зная число

степеней свободы для каждой из дисперсий. Если Fфакт > Fтабл, то влияние факторного признака на результативный существенно, если

Fфакт < Fтабл, то это влияние несущественно.

Пример 2. Установите, применив дисперсионный анализ, доказывает ли опыт влияние дозы удобрений на сахаристость сахарной свеклы. Каков характер этой зависимости? Исходные данные представлены в таблице 1:

57

Таблица 1 – Исходные данные для дисперсионного анализа

 

Варианты

 

Сахаристость корнеплодов в % по повторностям опыта

 

 

опыта

по

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дозе

азот-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ных

удоб-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рений,

кг

 

 

1

 

2

 

 

 

3

 

4

 

5

 

 

 

6

 

 

на 1га

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.Контроль

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(без азота)

 

 

15,8

16,2

 

 

 

14,9

 

15,8

 

15,2

 

 

15,5

 

 

2. 60

 

 

 

 

16,5

15,1

 

 

 

17,2

 

15,2

 

15,3

 

 

15,8

 

 

3.100

 

 

 

 

16,3

16,0

 

 

 

15,4

 

15,1

 

17,2

 

 

14,9

 

 

4.150

 

 

 

 

14,8

16,1

 

 

 

15,2

 

15,2

 

15,0

 

 

16,0

 

 

5.200

 

 

 

 

15,3

14,9

 

 

 

14,7

 

15,3

 

14,8

 

 

15,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение: Рассчитаем среднюю сахаристость по группам и в целом по

 

всем наблюдениям. Расчеты представим в таблице 2:

 

 

 

 

 

 

Таблица 2 –

Расчетные данные для дисперсионного анализа

Варианты

Сахаристость корнеплодов в % по

Сумма

 

 

 

Средняя

опыта по

 

повторностям опыта

 

 

 

 

 

 

 

сахаристость

дозе азот-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в %

ных удоб-

 

1

 

2

3

 

4

 

 

5

 

6

 

 

 

 

 

 

 

 

рений,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

кг на 1га

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.Контроль

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(без азота)

15,8

 

16,2

14,9

15,8

 

15,2

15,5

93,4

 

15,57

 

2. 60

 

16,5

 

15,1

17,2

15,2

 

15,3

15,8

95,1

 

15,85

 

3.100

 

16,3

 

16,0

15,4

15,1

 

17,2

14,9

94,9

 

15,82

 

4.150

 

14,8

 

16,1

15,2

15,2

 

15,0

16,0

92,3

 

15,38

 

5.200

 

15,3

 

14,9

14,7

15,3

 

14,8

15,4

90,4

 

15,07

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итого

 

78,7

 

78,3

77,4

76,6

 

77,5

77,6

466,1

 

 

 

 

 

 

 

 

 

Χ0 = 15,54

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя сахаристость в % :

 

0 =

466,1

= 15,54

 

 

 

 

 

 

 

 

 

Χ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

Общая вариация признака:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Wобщ = ∑(Χi

 

0 )2 = (15,8 −15,54)2 + (16,2 −15,54)2 + ......

 

Χ

 

.... + (15,4 −15,54)2 = 12,77

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

58

Групповая вариация:

Wгр = (Cгр - C0 )2 × n = (15,57 -15,54)2 6 + (15,85 -15,54)2 6 +

+ (15,82 -15,54)2 6 + (15,38 -15,54)2 6 + (15,07 -15,54)2 6 = 2,5314,

где n - число повторностей.

Из правила сложения вариаций Wобщ = Wгр + Wост находим оста-

точную вариацию Wост = Wобщ -Wгр = 12,77 - 2,5314 = 10,2386

Отношение групповой вариации к общей носит название эмпириче-

ского коэффициента детерминации, который показывает долю ва-

риации изучаемого признака, складывающейся под влиянием признака

η 2 = Wгр = 2,5314 =

– фактора в общей вариации: 0,1982 , то

Wобщ 12,77

есть только 19,82% вариации сахаристости сахарной свеклы обусловлено влиянием азотных удобрений.

Рассчитаем дисперсии на одну степень свободы:

Sобщ2 =

Wобщ

=

12,77

 

= 0,44

 

 

 

 

 

 

 

 

N -1

30 -1

 

 

Sгр2 =

Wгр

 

=

 

2,5314

 

= 0,63

m -

 

5 -1

 

1

 

 

 

 

 

Sост2 =

Wост

 

=

10,2386

= 0,41, где N - число наблюдений, т -

 

 

 

 

 

N - m

30 - 5

 

число групп.

Вычисляем фактический F-критерий как отношение групповой дисперсии к остаточной:

F

=

S гр2

=

0,63

= 1,54

и сравниваем его с табличным, которое

 

 

S 2

 

факт

 

 

0,41

 

 

 

 

 

 

 

 

 

ост

 

 

 

 

находим по таблице зная число степеней свободы для большей и меньшей из этих дисперсий Fтабл (υ1 = 4;υ2 = 25) = 2,76 .

Вывод: так как Fфакт Fтабл , влияние дозы азотных удобрений на сахаристость сахарной свеклы несущественно.

59

ГЛАВА 6. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ

Цель: рассмотреть приемы систематизации и обобщения первичных данных.

Учебные вопросы:

6.1.Сущность и задачи статистической сводки

6.2.Группировка: понятие, виды, последовательность построения

6.3.Прием вторичной группировки

Изучив данную тему, студент должен:

-знать сущность статистической сводки, виды, задачи и последовательность построения статистических группировок, приемы вторичной группировки.

- уметь выбирать основание группировки, на основе первичного статистического материала строить статистические группировки, на основе имеющихся группировок производить перегруппировку данных. -владеть навыками применения статистических группировок для анализа социально экономических явлений и процессов.

При освоении темы необходимо:

-изучить главу 6 данного пособия; -изучить материал по данной теме из следующих источников библио-

графического списка: осн.1-4,7,8,10,11,13,15,16,18-22; доп. 36,39,43,46. -выполнить тесты по изучаемой теме; -ответить на следующие контрольные вопросы:

1.В чем заключается сводка статистических данных?

2.По каким признакам различается статистическая сводка?

3.Что такое статистическая группировка?

4.Какие виды статистических группировок Вы знаете?

5.В чем состоят особенности классификации?

6.От чего зависит решение вопроса об определении числа групп и границ интервалов между ними?

7.Что позволяет вычислить формула Стерджесса?

8.По какой формуле определяется величина равного интервала?

60