Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

общая теория статистики

.pdf
Скачиваний:
128
Добавлен:
01.06.2015
Размер:
1.42 Mб
Скачать

Коэффициент ввода ОПФ = стоимость введенных за год ОПФ / балансовая стоимость ОПФ на конец года.

Задание 11.

По данным выборочного обследования семей области получено следующее распределение семей по размеру совокупного дохода на члена семьи.

Размер совокупного дохода на члена семьи,

 

Число семей в % к итогу

руб.

 

 

 

1000

 

 

21,0

1500

 

 

20,0

2000

 

 

30,0

3000

 

 

19,0

4500

 

 

10,0

Итого:

 

 

100

Определите моду среднедушевого

дохода семьи.

Задание 12.

 

 

 

Имеются следующие данные

о распределении площади хозяйств

района по урожайности зерновых и зернобобовых культур:

 

 

 

Урожайность зерновых и

 

Посевная площадь в % к итогу

зернобобовых культур, ц с 1 га

 

 

10-14

 

 

18

14-18

 

 

20

18-22

 

 

25

22-26

 

 

23

26-28

 

 

13

28-30

 

 

1

Итого

 

 

100

Определите:

1) Среднее

 

значение урожайности зерновых и

зернобобовых культур; 2) Модальное и медианное значение урожайности;

Тема 1.5. Показатели вариации признака в совокупности

При изучении массовых явлений нельзя ограничиваться только средними величинами их признаков, нужно подвергать всестороннему анализу отклонения от средних, поскольку без этого нельзя увидеть весь процесс в его развитии. Для этого в статистике используются показатели вариации, характеризующие колеблемость признака. К ним относятся: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации.

134

Размах вариации есть разница между наибольшим и наименьшим значениями признака в ряду распределения.

R = х max – х min .

Среднее линейное отклонение представляет собой среднюю величину отклонений значений признака от их средней величины без учета знака, т.е. по модулю. Расчет производится по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi - x

 

 

 

 

 

 

d =

 

 

 

 

 

 

 

 

 

 

 

 

 

Простое:

 

n

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

´ fi

 

 

 

 

 

å

xi -

x

 

d =

 

 

 

 

 

 

 

 

 

 

 

Взвешенное:

 

 

 

å fi

.

 

 

 

 

 

 

 

Дисперсия, или средний квадрат отклонений вариантов признака от их средней величины. Существует несколько способов исчисления дисперсии в

зависимости от информационной базы.

 

1 метод вычисления

(квадрат отклонений отдельных вариант от

средней величины):

 

 

 

 

 

 

å(xi -

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)2

 

 

 

 

 

 

 

 

σ

2

=

x

 

простая

 

 

 

 

n

(14)

 

 

 

 

å(xi -

 

 

 

 

 

 

 

 

 

 

)2 ´ fi

 

 

 

 

 

σ

2

 

=

x

 

 

 

 

 

 

 

 

 

 

å fi

 

взвешенная

 

 

 

 

 

 

(15)

2 метод вычисления (разница среднего квадрата признака и квадрата

средней величины):

 

 

 

 

 

åx2 f

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

x

=

 

σ 2 =

 

2 - (

 

)2 ;

 

 

 

å f ;

 

x

x

 

 

 

3 метод вычисления (для альтернативного признака):

Пусть p – доля единиц в совокупности, обладающих признаком;

q – доля единиц, не обладающих признаком (1- p); дисперсия доли (или альтернативного признака) равна:

σ 2 = pq .

Среднее квадратическое отклонение представляет собой квадратный корень из дисперсии:

σ = σ 2

Коэффициент вариации представляет собой отношение среднего квадратического отклонения и средней величине признака. Он измеряется в виде коэффициентов или процентов.

V = σx ´100% .

135

( хi )

Расчет групповой, межгрупповой и общей дисперсии (по правилу сложения дисперсий).

Если совокупность расчета на группы по изучаемому признаку, то для изучения такой вариации достигается посредством вычисления и анализа различных видов дисперсии: общей, групповых (частных), средней из групповых и межгрупповой.

Общая дисперсия равна среднему квадрату отклонений отдельных

значений признака от общей средней ( х ). Общая дисперсия отражает вариацию признака за счет всех условий и причин, действующих в совокупности.

Групповая (частная или внутригрупповая) дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы от средней арифметической этой группы, эта дисперсия отражает вариацию, происходящую за счет условий и причин, действующих внутри группы.

 

 

 

å(xi -

 

 

)2

 

 

 

 

 

å(xi

-

 

)2 ´ fi

 

 

 

 

 

 

 

 

 

 

x

 

 

 

2

 

x

 

 

2

 

 

 

σ i

=

 

 

 

;

σ

i

=

 

 

 

 

 

.

 

 

n

 

 

å fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя из внутригрупповых дисперсий исчисляется как средняя

арифметическая, взвешенная из дисперсий групповых.

 

 

 

 

 

 

 

 

 

 

i2 =

 

åσ i2 fi

.

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å fi

 

 

 

 

 

Межгрупповая

дисперсия

 

 

(σ м

2 )

 

 

характеризует

вариацию

результативного признака, возникающую под влиянием фактора, положенного в основании группировки, равна среднему квадрату групповых

средних ( xi ) от общей средней ( x ).

σ м 2 = å(xi - x)2 ´ fi . å fi

Существует определение соотношение, связывающее три вида дисперсии: общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий.

σ 2 = σi2 + σ м2 .

Данное соотношение называют статистическом анализе используется долю межгрупповой дисперсии в

правилом сложения дисперсий. В показатель, представляющий собой, общей, называемый эмпирическим

коэффициентом детерминации (η 2 ):

η2 = σ м 2

σ2 .

Корень квадратный из эмпирического коэффициента детерминации называется эмпирическим корреляционным отношением (η ); которое

136

характеризует влияние положенного в основании группировки признака на вариацию результативного признака.

η =

 

σ м

2

 

σ 2 .

 

 

Эмпирическое корреляционное отношение изменяется от 0 до 1. Если η = 0 , то группировочный признак вообще не оказывает влияние на вариацию

результативного, а если η = 1, то вариация результативного признака происходит только под влиянием группировочного.

Теорема сложения дисперсий для дисперсии альтернативного признака.

σ р2 = р× (1- р)

 

 

; р =

 

рi ni

 

 

 

 

 

 

ni

 

 

 

 

 

общая дисперсия:

 

 

 

 

 

 

 

 

 

 

 

;

 

внутригрупповая дисперсия:

σ р2

 

= рi ×(1- рi )

;

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åσ

р2i × Пi

 

 

 

 

σ

2

=

 

 

 

 

р

 

åni

 

 

 

 

 

средняя из внутригрупповых:

i

 

 

 

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å(рi -

 

)2 × ni

 

межгрупповая дисперсия доли:

 

2

=

р

.

δi

 

 

åni

 

 

 

 

 

 

 

 

 

 

 

Примеры решения типовых заданий

Пример 1.

Покажем расчет дисперсии и коэффициента вариации в дискретных рядах распределения.

Условие: Имеются данные о выработке рабочих предприятия:

Произведено

Число

 

 

 

 

 

 

 

 

 

 

одним

C × f

 

 

 

 

 

 

 

 

 

рабочих

Χ −

 

 

(Χ −

 

 

(Χ −

 

 

 

 

Χ)2

Χ)2 f

Χ

рабочим,

( f )

 

 

 

 

 

 

 

 

 

 

штук (x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

7

56

-2

 

 

4

 

 

28

 

9

10

90

-1

 

 

1

 

 

10

 

10

15

150

0

 

 

0

 

 

0

 

11

12

132

1

 

 

1

 

 

12

 

12

6

72

2

 

 

4

 

 

24

 

ИТОГО

50

500

 

 

 

 

 

 

74

 

Решение:

Исчислим среднюю арифметическую взвешенную:

137

 

=

åC × f

=

500

= 10(штук)

C

50

 

 

å f

 

 

Значения отклонений от средней и их квадратов представлены в таблице. Определим дисперсию:

σ2 = å(C - C)2 × f = 74 = 1.48

åf 50

Среднее квадратическое отклонение будет равно:

σ = σ 2 = 1.48 = 1.216

Коэффициент вариации рассчитывается следующим образом:

V = σC ×100 = 1.21610 ×100 = 12.6%

Таким образом, дисперсия составила 1,48 штук, коэффициент вариации 12,6%, что свидетельствует об однородности совокупности, так как V ≤ 33% /

Пример 2.

Условие: Имеются данные об урожайности овса на опытных участках:

Номер

Урожайность овса, семена не

Номер

Урожайность овса, семена

прошедшие предпосевную

участка

прошедшие предпосевную

участка

обработку,

 

обработку,

 

ц с 1 га

 

ц с 1 га

1

13

7

18

2

14

8

19

3

15

9

22

4

17

10

20

5

16

11

24

6

15

12

23

Исчислим:

групповые дисперсии;

среднюю из групповых дисперсий;

межгрупповую дисперсию;

общую дисперсию.

Решение:

Для расчета групповых дисперсий исчислим среднюю по каждой группе:

 

 

 

=

90

= 15

 

 

 

2 =

126

= 21

 

 

X

1

;

 

X

 

 

 

 

 

 

 

 

6

 

6

.

 

Далее исчислим групповые дисперсии:

 

σ12

= (13 -15)2

+ (14 -15)2

+ (15 -15)2 + (17 -15)2 + (16 -15)2 + (15 -15)2

= 1.666 » 1.67

σ 22

= 4.66 .

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

Рассчитаем среднюю из внутригрупповых (частных) дисперсий:

138

 

 

2

 

σ i2 ´ fi

 

1.67 ´ 6 + 4.66´ 6

 

 

 

 

 

σ i

=

 

 

=

 

 

= 3,16

 

å fi

12

 

 

 

 

 

 

.

Исчислим межгрупповую дисперсию. Для этого предварительно определим общую среднюю:

=90 +126 =

x12 18 .

Затем рассчитаем межгрупповую дисперсию:

 

 

 

 

 

(

 

i -

 

)2

´ fi

 

(15 -18)2 ´ 6 + (21-18)2 ´ 6

 

108

 

σ м2

=

x

x

=

=

= 9

 

 

 

 

å fi

 

 

 

 

 

 

12

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

Исчислим общую дисперсию согласно правилу сложения дисперсий:

 

 

 

 

 

 

 

 

 

 

 

 

 

σ 2 =

 

i2 м2 = 3,16 + 9 = 12,16 .

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

Проверим полученный результат, исчислив общую дисперсию

обычным способом:

 

 

σ 2 = å(xi -

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

146

= 12.16 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

12

 

 

 

 

 

Определим

эмпирический

 

 

коэффициент

детерминации и

корреляционное отношение:

 

 

 

 

 

 

 

 

 

 

 

 

η

2

=

 

9

 

 

= 0.74 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

η = η 2

=

 

 

 

= 0.86 .

 

 

 

 

 

 

 

 

 

 

 

0.74

 

 

 

 

 

12.16

 

 

 

 

 

Таким образом, можно сделать вывод, что связь между урожайностью зерновых и предпосевной обработкой семенного материала достаточно высокая, вариация урожайности на 74% обусловлена влиянием этого фактора.

Задания для самостоятельного решения

Задание 1.

Имеются следующие данные о производительности труда рабочих:

Табельный номер рабочего

Произведено продукции, шт.

 

В дневную смену

В ночную смену

1

5

4

2

8

6

3

7

4

4

5

4

5

6

5

Исчислите: 1) частные дисперсии; 2) межгрупповую дисперсию; 3) общую дисперсию (по правилу сложения дисперсий и обычным способом).

Сделайте вывод, как влияет вид рабочей смены на производительность рабочих (коэффициент детерминации и корреляционное отношение).

139

Задание 2.

Имеются следующие данные о распределении рабочих по проценту допускаемого брака в процессе производства:

Процент брака

Число рабочих

Средний % брака

Среднее

 

 

квадратическое

 

 

 

отклонение

До 1

7

0,8

0,67

1-3

20

2,3

0,65

3-5

15

3,7

0,51

5-7

5

5,9

0,48

Свыше 7.

3

7,8

0,82

Исчислите общую дисперсию допускаемого рабочими брака продукции, применяя правило сложения дисперсий.

Задание 3.

Определите по нижеприведенным данным общую дисперсию цены на яблоки, а также степень однородности групп:

Канал сбыта

Средняя цена

Объем продаж,тонн

Групповая

яблок,руб/т

дисперсия цены

 

 

рынки

8

300

4.1

Розничная торговля

14

25

9.5

Задание 4.

С целью установления зависимости между урожайностью и сортом винограда в одном из хозяйств на основе выборки определили урожай на 10 кустах винограда:

Наименование

Число

Урожай винограда с каждого куста, кг

 

 

 

 

 

сорта винограда

проверенных

Куст №1

Куст №2

Куст №3

Куст №4

Куст №5

 

кустов

 

 

 

 

 

Сорт «А»

3

6

5

7

-

-

Сорт «Б»

5

7

6

8

5

9

Сорт «В»

2

9

7

-

-

-

Исчислите общую, межгрупповую и среднюю из внутригрупповых дисперсий. Определите связь между сортом и его урожайностью.

Задание 5.

Распределение стоимости продукции, предназначенной для экспортных поставок, представлено следующими данными:

 

Стоимость всей

В том числе стоимость экспортной

Цех

произведенной

продукции, тыс. руб.

 

продукции, тыс. руб.

 

 

1

340

110

2

290

140

3

180

180

итого

810

410

140

Определите: а) общую дисперсию доли экспортной продукции через правило сложения дисперсий; б) эмпирический коэффициент детерминации.

Тема 1.6. Методы анализа динамики социально-экономических явлений

В статистики под понятием ДИНАМИКА подразумевают, изменение показателей общественно-экономических явлений во времени. Для изучения данных изменений строятся хронологические (временные) ряды, которые называются – рядами динамики.

Ряд динамики – последовательно расположенные в хронологическом порядке показатели, характеризующие развитие явления во времени.

Ряд динамики характеризуется двумя параметрами:

1)моментами времени (конкретными датами) или периодами (годы, кварталы, недели и т.д.), к которым относятся статистические данные.

2)непосредственно статистическими данными – уровнями

динамического ряда (yi ).

Ряды динамики можно подразделить в зависимости:

1)от вида приводимых в них статистических показателей-

ряды динамики абсолютных величин;

ряды динамики средних величин;

ряды динамики относительных величин.

Ряды абсолютных величин являются исходными, начальными, а ряды средних и относительных величин – производными.

2)от времени, отображаемому в динамическом ряде:

моментные динамические ряды – уровни ряда выражают величину явления на определенный, конкретный момент времени (дату). Особенностью моментных рядов, является то, что суммировать их уровни не имеет смысла, так как суммирование будет включать одну и ту же величину несколько раз. В отличие от суммирования моментных уровней их разность имеет некоторый смысл;

интервальные динамические ряды – уровни ряда отражают размеры изучаемого явления, за какой то промежуток времени (интервал). В отличии от моментных уровней, имеет смысл рассматривать суммы уровней следующих друг за другом, так как это будет являться итогом за более продолжительный период времени.

3)по полноте времени отображаемого в рядах динамики:

полные ряды – их даты или периоды следуют друг за другом с равным интервалом;

141

неполные ряды – их даты или периоды не следуют друг за другом с равным интервалом.

Статистические характеристики (показатели) ряда динамики

При изучении явления во времени в статистики рассчитывают ряд показателей динамики, которые и будут характеризировать данное изменение. При этом анализу подвергаются уровни динамического ряда. Различают:

начальный уровень (( y1 ) или ( y0 ) ), который показывает величину первого члена динамического ряда;

конечный уровень ( yn ) , который показывает величину конечного члена динамического ряда;

средний уровень ряда ( y) .

Статистический анализ динамических рядов основан на сравнении уровней динамического ряда. При этом сравниваемый уровень ряда динамики называется текущим уровнем, а уровень по отношению к которому проводится сравнение – базисным уровнем. В свою очередь базисным уровнем может быть:

начальный уровень динамического ряда (либо любой другой, постоянно взятый за основу сравнения уровень). При сравнении с данным базисным уровнем текущего уровня получают базисные показатели динамики.

уровень предыдущий текущему уровню. При сравнении с данным базисным уровнем текущего уровня получают цепные показатели динамики

иногда за базу сравнения принимают средний уровень.

Показатели динамики

Абсолютный прирост(Ai ) или ( i ) рассчитывается как разность двух уровней динамического ряда, один из которых принят за базу сравнения.

Цепной абсолютный прирост рассчитывается по формуле:

Ai = yi - yi 1 .

Цепной абсолютный прирост называют скоростью роста Базисный абсолютный прирост

Ai = yi - yбаз .

Коэффициент роста (K p ) – отношение текущего уровня ряда динамики к уровню принятому за базу сравнения. Коэффициент роста, умноженный на

100, называется темпом роста в % р ) . Коэффициент роста показывает во сколько раз уровень текущего периода выше или ниже уровня базисного периода, темп роста – сколько процентов он составил по отношению к базисному уровню.

− цепной коэффициент роста рассчитывается как:

142

Ki = yyi i1 ;

− базисный коэффициент роста рассчитывается как:

Ki = yi . y1

Коэффициент (темп) прироста Кпр (Т пр ) показывает, на сколько частей (процентов) увеличился или уменьшился текущий уровень по сравнению с базисным, принятым за 1 (100%), то есть, сколько частей (процентов) составляет относительный прирост данного уровня по отношению к базисному уровню. Рассчитывается двумя способами:

Первый способ – как отношение абсолютного прироста к базисному уровню.

− цепной коэффициент прироста рассчитывается как:

Kпрi = yi y-i y1i 1 ;

− базисный коэффициент прироста рассчитывается как:

Kпрi = yi y-1y1 .

Второй способ – коэффициент (темп) роста минус 1 (100).

Kпр = K р −1 или Т пр = Т р −100 .

Абсолютное значение одного процента прироста показывает часть абсолютного прироста, которая обеспечила 1% относительного прироста. Рассчитывается двумя способами.

Первый способ – как отношение абсолютного прироста к темпу прироста за тот же период:

 

 

 

αi

=

Аi

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т прi%

 

 

 

 

 

А

 

А

 

 

 

 

 

А3

 

А

α1 =

1

; α2 =

2

 

; α3

=

 

; αn =

n

.

Тпр1%

 

Тпр3%

 

 

 

 

 

Тпр2%

 

 

 

 

Тпрn %

Второй способ – как 0,01 часть от предыдущего (базисного) уровня.

αi = 0,01yi 1 .

Средние показатели динамики.

Для обобщения характеристики динамики, рассчитанной по уровням динамического ряда, определяют средние показатели динамического ряда. Средние показатели динамического ряда подразделяются на:

1. Средние уровни ряда.

Для интервального ряда динамики с равными интервалами средний

уровень ряда y рассчитывается как средняя арифметическая простая исходных уровней:

143