Статистика практикум - Т.В. Ивашина
.pdfПри симметричном распределении Еk = 0. Åñëè Åk > 0, распределение является островершинным; если Еk<0 — плосковершинным.
Критерии согласия. Количественная характеристика соответствия может быть получена с помощью особых статистических показателей — критериев согласия. Известны критерии согласия К.Пирсона (хи-квадрат), В.И.Романовского, Б.С.Ястремского и А.Н.Колмогорова.
Критерий согласия Пирсона ( χ 2 ) вычисляется по формуле
χ 2 = ∑ |
( fÝ − fÒ ) 2 |
, |
|
||
|
fT |
ãäå fý è fò — эмпирические и теоретические частоты соответственно.
С помощью величины c2 по таблицам приложения определяется вероятность Р (c2). Входами в таблицу являются значения c2 и число степеней свободы g = n -1. На основе Р выносится суждение о существенности расхождения между эмпирическим и теоретическим распределениями. При Р > 0,5 считается, что эмпирическое и теоретическое распределения близки. При Р Î(0,2; 0,5) совпадение между ними удовлетворительное, в остальных случаях — недостаточное.
Для характеристики структуры вариационных рядов применяются показатели особого рода, которые можно назвать структурными средними.
Характеристики вариационного ряда. Мода — значение признака, наиболее часто встречающееся в исследуемой совокупности.
Медиана — значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.
Для дискретных вариационных рядов модой будет значе- ние варианта с наибольшей частотой. Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда.
Для интервальных вариационных рядов мода определя-
ется по формуле: |
|
|
|
fMo |
− fMo− 1 |
|
|
|
|||
Mo = xMo + iMo |
|
|
|
|
|
, |
|||||
( f |
Mo |
− |
f |
Mo− 1 |
) + ( |
f |
Mo |
− f |
) |
|
|
|
|
|
|
|
|
|
Mo+ 1 |
3 1
ãäå x Mo — нижняя граница значения интервала, содержащего моду; i Mo — величина модального интервала; f Mo— частота модального интервала; f Mo-1— частота интервала, предшествующего модальному, f Mo+1- — частота интервала, следующего за модальным.
Медиана интервального ряда распределения определяется по формуле
1 |
∑ |
f − SMe− 1 |
|||
Me = xMe + iMe |
2 |
||||
|
|
, |
|||
|
|
|
|||
|
|
|
fMe |
ãäå x Me — нижняя граница значения интервала, содержащего медиану; i Me — величина медианного интервала; Sf — сумма частот; S Me-1 — сумма накопленных частот, предшествующих медианному интервалу; f Me — частота медианного интервала.
Аналогично с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Например, можно найти зна- чение признака у единиц, делящих ряд на четыре равные части, десять или сто частей. Эти величины называются квартили, децили и перцектили.
Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Различают квартиль нижний (Q1), отделяющий 1/4 часть совокупности с наименьшими значениями признака, и квартиль верхний (Q3), отсекающий 1/4 часть с наибольшими значениями признака. Это означает, что 25% единиц совокупности будут меньше по величине Q1; 25% единиц будут заключены между Q1 è Q2; 25% — между Q2 è Q3 и остальные 25% превосходят Q3. Средним квартилем Q2 является медиана. Для расчета квартилей по интервальному вариационному ряду используют формулы:
|
|
|
|
|
1 |
∑ |
f |
− |
SQ |
|||
|
|
|
|
|
|
|
||||||
|
= |
xQ + |
|
|
4 |
|
|
1− 1 |
||||
Q1 |
i |
|
|
|
|
, |
||||||
|
|
fQ |
|
|
||||||||
|
|
1 |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
3 |
∑ |
f |
− |
SQ |
|||
|
|
|
|
|
|
|||||||
|
= |
xQ + |
|
4 |
|
|
3− 1 |
|||||
Q3 |
i |
|
|
|
, |
|||||||
|
fQ |
|
||||||||||
|
|
3 |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
3 2
ãäå x Q1 — нижняя граница интервала, содержавшего нижний квартиль (интервалопределяетсяпонакопленнойчастоте,первой превышающей 25%);
x Q3 — нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%);
S Q1-1 — накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;
S Q3-1 — то же для верхнего квартиля;
f Q1 — частота интервала, содержащего нижний квартиль; f Q3 — то же для верхнего квартиля.
Задачи и упражнения
1. Распределение студентов одного из факультетов по возрасту характеризуется следующими данными:
Возраст |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
студентов, |
|
|
|
|
|
|
|
ëåò |
|
|
|
|
|
|
|
Число |
20 |
80 |
90 |
110 |
130 |
170 |
90 |
студентов |
|
|
|
|
|
|
|
Вычислите: а) размах вариации; б) среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; д) относительные показатели вариации возраста студентов.
2. Определите среднюю длину пробега автофургона торго- во-посреднической фирмы и вычислите все показатели вариации, если известны:
Длина пробега за один |
Число рейс |
ðåéñ, êì |
квартал |
30-50 |
20 |
50-70 |
25 |
70-90 |
14 |
90-110 |
18 |
110-130 |
9 |
130-150 |
6 |
Всего |
92 |
3. Имеется следующий ряд распределения телеграмм, принятых отделением связи, по числу слов:
3 3
Количество слов в |
Число телеграм |
телеграмме |
|
12 |
18 |
13 |
22 |
14 |
34 |
15 |
26 |
16 |
20 |
17 |
13 |
18 |
7 |
Всего |
140 |
Рассчитайте абсолютные и относительные показатели вариации.
4. Средняя урожайность зерновых культур в двух районах за 1991 — 1995 гг. характеризуется следующими данными, ц/га:
|
1991 ã. |
1992 ã. |
1993 ã. |
1994 ã. |
|
|
|
|
|
1-й район |
30 |
20 |
23 |
16 |
2-й район |
25 |
34 |
30 |
28 |
|
|
|
|
|
Рассчитайте все показатели вариации. Определите, в каком районе урожайность зерновых культур более устойчива.
5. Имеются следующие данные выборочного обследования студентов одного из вузов:
Затраты времени на до- |
Число студентов, % |
рогу до института, ч |
к итогу |
Äî 0,5 |
7 |
0,5-1,0 |
18 |
1,0-1,5 |
32 |
1,5-2,0 |
37 |
Свыше 2,0 |
6 |
Всего |
100 |
Рассчитайте абсолютные и относительные показатели вариации.
6.Средняя величина признака в совокупности равна 19, а средний квадрат индивидуальных значений этого признака —
397.Определите коэффициент вариации.
7.Дисперсия признака равна 9, средний квадрат индивидуальных его значений — 130. Чему равна средняя?
3 4
8.Средняя величина в совокупности равна 16, среднее квадратическое отклонение — 8. Определите средний квадрат индивидуальных значений этого признака.
9.Средний квадрат отклонений индивидуальных значе- ний признака от их средней величины равен 100, а средняя —
15.Определите, чему равен средний квадрат отклонений индивидуальных значений признака от величины, равной 10 и 25.
10.Если дисперсия равна 20 000 единицам, а коэффициент вариации — 30%, то каков будет средний квадрат отклонений индивидуальных значений признака от величины, равной 250 единицам?
11.По данным таблицы о распределении пряжи по крепости нити вычислите все виды дисперсий. Определите общую дисперсию по правилу сложения дисперсий.
I группа пряжи (менее крепкая) |
II группа пряжи (более крепкая) |
||
|
|
|
|
Крепость нити, г |
Число проб |
Крепость нити, г |
Число проб |
|
|
|
|
120-130 |
2 |
200-210 |
25 |
130-140 |
6 |
210-220 |
28 |
140-150 |
8 |
220-230 |
16 |
150-160 |
15 |
230-240 |
10 |
160-170 |
25 |
240-250 |
8 |
170-180 |
29 |
250-260 |
7 |
180-190 |
35 |
260-270 |
5 |
190-200 |
30 |
|
|
12. Товарооборот по предприятиям общественного питания на одного работника за квартал характеризуется следующими данными:
Предприятие |
Доля предприятий в |
Товарооборот в рас- |
Дисперсия |
|
общей численности |
чете на одного работ- |
оборота в г |
|
работников, % |
íèêà, óñë. ðóá. |
|
|
|
|
|
Столовые |
35 |
13 |
3,29 |
Кафе, закусочные |
50 |
20 |
36,00 |
Рестораны |
15 |
26 |
9,00 |
Определите все виды дисперсий товарооборота предприятий общественного питания.
13. Распределение основных фондов по малым предприятиям отрасли характеризуется следующими данными:
3 5
Группы предприятий по |
Число пред- |
Основные фонды в сред- |
Группов |
стоимости основных фон- |
приятий |
нем на предприятии, усл. |
ïåð |
äîâ, óñë. ðóá. |
|
ðóá. |
|
12-27 |
18 |
18 |
1, |
27-42 |
40 |
32 |
1, |
42-57 |
26 |
48 |
1, |
57-72 |
12 |
69 |
1, |
Рассчитайте коэффициент детерминации, эмпирическое корреляционное отношение. Сделайте выводы.
14. Распределение стоимости продукции, предназначенной для экспортных поставок, по цехам предприятия представлено следующими данными:
Öåõ |
Стоимость всей произве- |
В том числе стоимость экс- |
|
денной продукции, тыс. |
портной продукции, тыс. |
|
ðóá. |
ðóá. |
1 |
340 |
110 |
2 |
290 |
140 |
3 |
180 |
180 |
Итого |
810 |
410 |
Вычислите: а) среднюю из внутригрупповых, межгрупповую и общую дисперсию дисперсии доли экспортной продукции; б) коэффициент детерминации и эмпирическое корреляционное отношение.
15. Распределение магазинов по размеру товарооборота за октябрь 1996 г. характеризуется следующими данными:
Группы магазинов по |
Число мага- |
Группы магазинов по |
Число мага |
размеру товарооборота, |
зинов |
размеру товарооборота, |
зинов |
óñë. ðóá. |
|
óñë. ðóá. |
|
|
|
|
|
Äî 200 |
12 |
500-600 |
15 |
200-300 |
14 |
600-700 |
7 |
|
|
|
|
300-400 |
18 |
700-800 |
6 |
400-500 |
23 |
Свыше 800 |
4 |
|
|
|
|
Итого |
|
|
100 |
|
|
|
|
Определите показатели асимметрии и эксцесса распределения магазинов по размеру товарооборота. Сделайте выводы.
16. Результаты экзамена по статистике в одной из студен- ческих групп представлены в таблице:
3 6
Экзаменационные |
Отлично |
Хорошо |
Удовлетвори- |
Неудовлетво- |
оценки |
(5) |
(4) |
тельно |
рительно |
|
|
|
(3) |
(2) |
Число оценок |
6 |
15 |
4 |
2 |
|
|
|
|
|
Найдите модальный и медианные баллы успеваемости студентов.
17. С целью исследования качества деталей на предприятии проверена партия из 100 деталей. Результаты представлены в следующей таблице:
Группы |
40-50 |
50-60 |
60-70 |
70-80 |
80-90 |
90-100 |
100-110 |
110-120 |
деталей по |
|
|
|
|
|
|
|
|
âåñó, ã |
|
|
|
|
|
|
|
|
Число де- |
2 |
4 |
12 |
18 |
21 |
24 |
11 |
8 |
талей |
|
|
|
|
|
|
|
|
Определите моду, медиану, квартили и децили.
ВЫБОРОчНОЕ НАБЛЮДЕНИЕ
Методические указания
Тема "Выборочное наблюдение" является одной из центральных в курсе теории статистики. Это обусловлено прежде всего взаимосвязью данной темы с другими темами, в особенности, со статистическим наблюдением, статистическими показателями, таблицами, графиками и др. Поэтому освоение теорети- ческого материала, умение правильно решать практические задачи по данной теме, грамотно интерпретировать полученные результаты служит необходимым условием успешного изуче- ния курса теории статистики в целом и связанных с ней наук.
Формирование набора задач обусловлено практическими вопросами, требующими своего решения при организации выборочного наблюдения и анализе его результатов. Такими вопросами являются определение способа выбора и процедуры выборки, вычисление ошибок выборки, построение доверительных интервалов выборочных характеристик, а также расчет необходимого объема выборки. Предложенные в данной теме задания охватывают все эти вопросы с учетом особенностей формирования выборочной совокупности.
3 7
Расчет ошибок позволяет решить одну из главных проблем организации выборочного наблюдения — оценить репрезентативность (представительность) выборочной совокупности. Различают среднюю и предельную ошибки выборки. Эти два вида ошибок связаны следующим соотношением:
∆ = tµ ,
ãäå D — предельная ошибка выборки; m — средняя ошибка выборки; t — коэффициент доверия, определяемый в зависимости от уровня вероятности.
Величина средней ошибки выборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Так, при случайном повторном отборе средняя ошибка определяется по формуле
|
|
µ |
|
= |
σ |
n |
, |
|
|
|
|
|
|
|
|
|
|
|
µ = |
σ 2 |
|
1− |
|
n |
|
|
при бесповторном: |
n |
|
|
|
|
, |
||
|
|
|
|
|
N |
|
ãäå s— выборочная (или генеральная) дисперсия; s2 — выборочное (или генеральное) среднее квадратическое отклонение; n — объем выборочной совокупности; N — объем генеральной совокупности.
Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:
x − ∆ ≤ x≤ +x ∆ ,
xx
ãäåx è x — генеральная и выборочная средние соответственно,
∆— предельная ошибка выборочной средней.
x
3 8
Наряду с определением ошибок выборки и пределов для генеральной средней эти же показатели могут быть определены для доли признака. В этом случае особенности расчета связаны с определением дисперсии доли, которая вычисляется так:
|
|
σ |
2 |
= |
( |
) , |
|
|
m |
w |
w 1− |
w |
|||
ãäå w = |
— доля единиц, обладающих данным признаком в |
||||||
|
n
выборочной совокупности, определяемая как отношение коли- чества соответствующих единиц к объему выборки.
Тогда, например, при собственно-случайном повторном отборе для определения предельной ошибки выборки используется следующая формула:
|
σ |
2 |
|
( |
− |
) |
∆ w = |
w |
= t |
w 1 |
w |
||
t |
n |
n |
. |
|||
|
|
|
|
Соответственно, при бесповторном отборе
|
σ |
2 |
|
|
n |
|
( |
− |
) |
|
|
n |
∆ w = |
w |
1− |
= t |
w 1 |
w |
1− |
||||||
t |
n |
|
|
n |
|
|
. |
|||||
|
|
|
|
N |
|
|
|
|
N |
Пределы доли признака в генеральной совокупности р выглядят следующим образом:
w − ∆ w ≤ p≤ +w ∆ w.
Ошибки и пределы генеральных характеристик при других способах формирования выборочной совокупности определяются на основе соответствующих формул, отражающих особенности этих видов выборки. Например, в случае типической выборки показателем вариации является средняя из внутригрупповых дисперсий, при серийной выборке — межгрупповая (межсерийная) дисперсия и т.д. Кроме того, в последнем случае вместо объема выборочной совокупности n используется показатель числа серий r.
3 9
Следовательно, для типической выборки средняя ошибка вычисляется по формулам:
— при отборе, пропорциональном объему типических групп
|
µ |
= |
|
σ i2 |
(повторный отбор); |
|
|
|
|
|
n |
|
|
µ = |
σ |
2 |
|
1− |
n |
(бесповторный отбор); |
|
i |
|
|
|||
|
|
n |
|
N |
|
— при отборе, пропорциональном вариации признака (не пропорциональных объему групп):
|
µ |
= |
1 |
|
∑ |
σ |
i2 Ni2 |
(повторный отбор); |
|||
|
|
|
N |
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
µ |
= 1 |
∑ |
σ |
2 |
|
2 |
|
|
|
|
|
i |
Ni |
1 |
− |
|
ni |
(бесповторный отбор). |
|||||
|
N |
|
|
|
ni |
|
|
Ni |
|
||
При серийной выборке средняя ошибка определяется сле- |
|||||||||||
дующим |
образом: |
|
|
|
|
|
|
|
|
||
|
|
|
µ |
= |
|
δ |
2 |
|
|
|
|
|
|
|
|
r (повторный отбор); |
|||||||
|
µ |
= |
δ |
2 |
|
1− |
r |
|
|
|
|
|
|
r |
|
|
|
(бесповторный отбор), |
|||||
|
|
|
|
|
|
R |
|
|
|
|
где R — число серий в генеральной совокупности; σ 2 = ∑ (xi − x)2 r
4 0