Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика практикум - Т.В. Ивашина

.pdf
Скачиваний:
83
Добавлен:
24.05.2014
Размер:
352.38 Кб
Скачать

При симметричном распределении Еk = 0. Åñëè Åk > 0, распределение является островершинным; если Еk<0 — плосковершинным.

Критерии согласия. Количественная характеристика соответствия может быть получена с помощью особых статистических показателей — критериев согласия. Известны критерии согласия К.Пирсона (хи-квадрат), В.И.Романовского, Б.С.Ястремского и А.Н.Колмогорова.

Критерий согласия Пирсона ( χ 2 ) вычисляется по формуле

χ 2 =

( fÝ − fÒ ) 2

,

 

 

fT

ãäå fý è fò — эмпирические и теоретические частоты соответственно.

С помощью величины c2 по таблицам приложения определяется вероятность Р (c2). Входами в таблицу являются значения c2 и число степеней свободы g = n -1. На основе Р выносится суждение о существенности расхождения между эмпирическим и теоретическим распределениями. При Р > 0,5 считается, что эмпирическое и теоретическое распределения близки. При Р Î(0,2; 0,5) совпадение между ними удовлетворительное, в остальных случаях — недостаточное.

Для характеристики структуры вариационных рядов применяются показатели особого рода, которые можно назвать структурными средними.

Характеристики вариационного ряда. Мода — значение признака, наиболее часто встречающееся в исследуемой совокупности.

Медиана — значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.

Для дискретных вариационных рядов модой будет значе- ние варианта с наибольшей частотой. Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда.

Для интервальных вариационных рядов мода определя-

ется по формуле:

 

 

 

fMo

− fMo− 1

 

 

 

Mo = xMo + iMo

 

 

 

 

 

,

( f

Mo

f

Mo− 1

) + (

f

Mo

− f

)

 

 

 

 

 

 

 

 

Mo+ 1

3 1

ãäå x Mo — нижняя граница значения интервала, содержащего моду; i Mo — величина модального интервала; f Mo— частота модального интервала; f Mo-1— частота интервала, предшествующего модальному, f Mo+1- — частота интервала, следующего за модальным.

Медиана интервального ряда распределения определяется по формуле

1

f − SMe− 1

Me = xMe + iMe

2

 

 

,

 

 

 

 

 

 

fMe

ãäå x Me — нижняя граница значения интервала, содержащего медиану; i Me — величина медианного интервала; Sf — сумма частот; S Me-1 — сумма накопленных частот, предшествующих медианному интервалу; f Me — частота медианного интервала.

Аналогично с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Например, можно найти зна- чение признака у единиц, делящих ряд на четыре равные части, десять или сто частей. Эти величины называются квартили, децили и перцектили.

Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Различают квартиль нижний (Q1), отделяющий 1/4 часть совокупности с наименьшими значениями признака, и квартиль верхний (Q3), отсекающий 1/4 часть с наибольшими значениями признака. Это означает, что 25% единиц совокупности будут меньше по величине Q1; 25% единиц будут заключены между Q1 è Q2; 25% — между Q2 è Q3 и остальные 25% превосходят Q3. Средним квартилем Q2 является медиана. Для расчета квартилей по интервальному вариационному ряду используют формулы:

 

 

 

 

 

1

f

SQ

 

 

 

 

 

 

 

 

=

xQ +

 

 

4

 

 

1− 1

Q1

i

 

 

 

 

,

 

 

fQ

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

3

f

SQ

 

 

 

 

 

 

 

=

xQ +

 

4

 

 

3− 1

Q3

i

 

 

 

,

 

fQ

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

3 2

ãäå x Q1 нижняя граница интервала, содержавшего нижний квартиль (интервалопределяетсяпонакопленнойчастоте,первой превышающей 25%);

x Q3 — нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%);

S Q1-1 — накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;

S Q3-1 — то же для верхнего квартиля;

f Q1 частота интервала, содержащего нижний квартиль; f Q3 — то же для верхнего квартиля.

Задачи и упражнения

1. Распределение студентов одного из факультетов по возрасту характеризуется следующими данными:

Возраст

17

18

19

20

21

22

23

студентов,

 

 

 

 

 

 

 

ëåò

 

 

 

 

 

 

 

Число

20

80

90

110

130

170

90

студентов

 

 

 

 

 

 

 

Вычислите: а) размах вариации; б) среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; д) относительные показатели вариации возраста студентов.

2. Определите среднюю длину пробега автофургона торго- во-посреднической фирмы и вычислите все показатели вариации, если известны:

Длина пробега за один

Число рейс

ðåéñ, êì

квартал

30-50

20

50-70

25

70-90

14

90-110

18

110-130

9

130-150

6

Всего

92

3. Имеется следующий ряд распределения телеграмм, принятых отделением связи, по числу слов:

3 3

Количество слов в

Число телеграм

телеграмме

 

12

18

13

22

14

34

15

26

16

20

17

13

18

7

Всего

140

Рассчитайте абсолютные и относительные показатели вариации.

4. Средняя урожайность зерновых культур в двух районах за 1991 — 1995 гг. характеризуется следующими данными, ц/га:

 

1991 ã.

1992 ã.

1993 ã.

1994 ã.

 

 

 

 

 

1-й район

30

20

23

16

2-й район

25

34

30

28

 

 

 

 

 

Рассчитайте все показатели вариации. Определите, в каком районе урожайность зерновых культур более устойчива.

5. Имеются следующие данные выборочного обследования студентов одного из вузов:

Затраты времени на до-

Число студентов, %

рогу до института, ч

к итогу

Äî 0,5

7

0,5-1,0

18

1,0-1,5

32

1,5-2,0

37

Свыше 2,0

6

Всего

100

Рассчитайте абсолютные и относительные показатели вариации.

6.Средняя величина признака в совокупности равна 19, а средний квадрат индивидуальных значений этого признака —

397.Определите коэффициент вариации.

7.Дисперсия признака равна 9, средний квадрат индивидуальных его значений — 130. Чему равна средняя?

3 4

8.Средняя величина в совокупности равна 16, среднее квадратическое отклонение — 8. Определите средний квадрат индивидуальных значений этого признака.

9.Средний квадрат отклонений индивидуальных значе- ний признака от их средней величины равен 100, а средняя —

15.Определите, чему равен средний квадрат отклонений индивидуальных значений признака от величины, равной 10 и 25.

10.Если дисперсия равна 20 000 единицам, а коэффициент вариации — 30%, то каков будет средний квадрат отклонений индивидуальных значений признака от величины, равной 250 единицам?

11.По данным таблицы о распределении пряжи по крепости нити вычислите все виды дисперсий. Определите общую дисперсию по правилу сложения дисперсий.

I группа пряжи (менее крепкая)

II группа пряжи (более крепкая)

 

 

 

 

Крепость нити, г

Число проб

Крепость нити, г

Число проб

 

 

 

 

120-130

2

200-210

25

130-140

6

210-220

28

140-150

8

220-230

16

150-160

15

230-240

10

160-170

25

240-250

8

170-180

29

250-260

7

180-190

35

260-270

5

190-200

30

 

 

12. Товарооборот по предприятиям общественного питания на одного работника за квартал характеризуется следующими данными:

Предприятие

Доля предприятий в

Товарооборот в рас-

Дисперсия

 

общей численности

чете на одного работ-

оборота в г

 

работников, %

íèêà, óñë. ðóá.

 

 

 

 

 

Столовые

35

13

3,29

Кафе, закусочные

50

20

36,00

Рестораны

15

26

9,00

Определите все виды дисперсий товарооборота предприятий общественного питания.

13. Распределение основных фондов по малым предприятиям отрасли характеризуется следующими данными:

3 5

Группы предприятий по

Число пред-

Основные фонды в сред-

Группов

стоимости основных фон-

приятий

нем на предприятии, усл.

ïåð

äîâ, óñë. ðóá.

 

ðóá.

 

12-27

18

18

1,

27-42

40

32

1,

42-57

26

48

1,

57-72

12

69

1,

Рассчитайте коэффициент детерминации, эмпирическое корреляционное отношение. Сделайте выводы.

14. Распределение стоимости продукции, предназначенной для экспортных поставок, по цехам предприятия представлено следующими данными:

Öåõ

Стоимость всей произве-

В том числе стоимость экс-

 

денной продукции, тыс.

портной продукции, тыс.

 

ðóá.

ðóá.

1

340

110

2

290

140

3

180

180

Итого

810

410

Вычислите: а) среднюю из внутригрупповых, межгрупповую и общую дисперсию дисперсии доли экспортной продукции; б) коэффициент детерминации и эмпирическое корреляционное отношение.

15. Распределение магазинов по размеру товарооборота за октябрь 1996 г. характеризуется следующими данными:

Группы магазинов по

Число мага-

Группы магазинов по

Число мага

размеру товарооборота,

зинов

размеру товарооборота,

зинов

óñë. ðóá.

 

óñë. ðóá.

 

 

 

 

 

Äî 200

12

500-600

15

200-300

14

600-700

7

 

 

 

 

300-400

18

700-800

6

400-500

23

Свыше 800

4

 

 

 

 

Итого

 

 

100

 

 

 

 

Определите показатели асимметрии и эксцесса распределения магазинов по размеру товарооборота. Сделайте выводы.

16. Результаты экзамена по статистике в одной из студен- ческих групп представлены в таблице:

3 6

Экзаменационные

Отлично

Хорошо

Удовлетвори-

Неудовлетво-

оценки

(5)

(4)

тельно

рительно

 

 

 

(3)

(2)

Число оценок

6

15

4

2

 

 

 

 

 

Найдите модальный и медианные баллы успеваемости студентов.

17. С целью исследования качества деталей на предприятии проверена партия из 100 деталей. Результаты представлены в следующей таблице:

Группы

40-50

50-60

60-70

70-80

80-90

90-100

100-110

110-120

деталей по

 

 

 

 

 

 

 

 

âåñó, ã

 

 

 

 

 

 

 

 

Число де-

2

4

12

18

21

24

11

8

талей

 

 

 

 

 

 

 

 

Определите моду, медиану, квартили и децили.

ВЫБОРОчНОЕ НАБЛЮДЕНИЕ

Методические указания

Тема "Выборочное наблюдение" является одной из центральных в курсе теории статистики. Это обусловлено прежде всего взаимосвязью данной темы с другими темами, в особенности, со статистическим наблюдением, статистическими показателями, таблицами, графиками и др. Поэтому освоение теорети- ческого материала, умение правильно решать практические задачи по данной теме, грамотно интерпретировать полученные результаты служит необходимым условием успешного изуче- ния курса теории статистики в целом и связанных с ней наук.

Формирование набора задач обусловлено практическими вопросами, требующими своего решения при организации выборочного наблюдения и анализе его результатов. Такими вопросами являются определение способа выбора и процедуры выборки, вычисление ошибок выборки, построение доверительных интервалов выборочных характеристик, а также расчет необходимого объема выборки. Предложенные в данной теме задания охватывают все эти вопросы с учетом особенностей формирования выборочной совокупности.

3 7

Расчет ошибок позволяет решить одну из главных проблем организации выборочного наблюдения — оценить репрезентативность (представительность) выборочной совокупности. Различают среднюю и предельную ошибки выборки. Эти два вида ошибок связаны следующим соотношением:

∆ = tµ ,

ãäå D — предельная ошибка выборки; m — средняя ошибка выборки; t — коэффициент доверия, определяемый в зависимости от уровня вероятности.

Величина средней ошибки выборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Так, при случайном повторном отборе средняя ошибка определяется по формуле

 

 

µ

 

=

σ

n

,

 

 

 

 

 

 

 

 

 

 

µ =

σ 2

 

1−

 

n

 

при бесповторном:

n

 

 

 

 

,

 

 

 

 

 

N

 

ãäå s— выборочная (или генеральная) дисперсия; s2 — выборочное (или генеральное) среднее квадратическое отклонение; n — объем выборочной совокупности; N — объем генеральной совокупности.

Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:

x − ∆ ≤ x≤ +x ∆ ,

xx

ãäåx è x — генеральная и выборочная средние соответственно,

— предельная ошибка выборочной средней.

x

3 8

Наряду с определением ошибок выборки и пределов для генеральной средней эти же показатели могут быть определены для доли признака. В этом случае особенности расчета связаны с определением дисперсии доли, которая вычисляется так:

 

 

σ

2

=

(

) ,

 

m

w

w 1−

w

ãäå w =

— доля единиц, обладающих данным признаком в

 

n

выборочной совокупности, определяемая как отношение коли- чества соответствующих единиц к объему выборки.

Тогда, например, при собственно-случайном повторном отборе для определения предельной ошибки выборки используется следующая формула:

 

σ

2

 

(

)

w =

w

= t

w 1

w

t

n

n

.

 

 

 

 

Соответственно, при бесповторном отборе

 

σ

2

 

 

n

 

(

)

 

 

n

w =

w

1−

= t

w 1

w

1−

t

n

 

 

n

 

 

.

 

 

 

 

N

 

 

 

 

N

Пределы доли признака в генеральной совокупности р выглядят следующим образом:

w − ∆ w ≤ p≤ +w ∆ w.

Ошибки и пределы генеральных характеристик при других способах формирования выборочной совокупности определяются на основе соответствующих формул, отражающих особенности этих видов выборки. Например, в случае типической выборки показателем вариации является средняя из внутригрупповых дисперсий, при серийной выборке — межгрупповая (межсерийная) дисперсия и т.д. Кроме того, в последнем случае вместо объема выборочной совокупности n используется показатель числа серий r.

3 9

Следовательно, для типической выборки средняя ошибка вычисляется по формулам:

— при отборе, пропорциональном объему типических групп

 

µ

=

 

σ i2

(повторный отбор);

 

 

 

 

n

 

 

µ =

σ

2

 

1

n

(бесповторный отбор);

 

i

 

 

 

 

n

 

N

 

— при отборе, пропорциональном вариации признака (не пропорциональных объему групп):

 

µ

=

1

 

σ

i2 Ni2

(повторный отбор);

 

 

 

N

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

µ

= 1

σ

2

 

2

 

 

 

 

 

i

Ni

1

 

ni

(бесповторный отбор).

 

N

 

 

 

ni

 

 

Ni

 

При серийной выборке средняя ошибка определяется сле-

дующим

образом:

 

 

 

 

 

 

 

 

 

 

 

µ

=

 

δ

2

 

 

 

 

 

 

 

 

r (повторный отбор);

 

µ

=

δ

2

 

1

r

 

 

 

 

 

 

r

 

 

 

(бесповторный отбор),

 

 

 

 

 

 

R

 

 

 

 

где R — число серий в генеральной совокупности; σ 2 = (xi − x)2 r

4 0

Соседние файлы в предмете Экономика