- •I. Выборочный метод. Вариационные ряды. Построение эмпирической функции распределения, гистограммы частот
- •II. Статистические характеристики вариационных рядов. M(X), d(X), σ(X), Mo, Me, показатели вариации. Асимметрия и эксцесс.
- •III. Вычисление групповых и общих средних, групповой, внутригрупповой, межгрупповой дисперсии и общей дисперсии
- •IV. Доверительный интервал и доверительная вероятность (интервальное оценивание)
- •V.Сравнение двух дисперсий нормальных генеральных совокупностей
- •VI. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки)
II. Статистические характеристики вариационных рядов. M(X), d(X), σ(X), Mo, Me, показатели вариации. Асимметрия и эксцесс.
Пусть для изучения генеральной совокупности относительно количественного признака извлечена выборка объема . Составлен интервальный вариационный ряд.
Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.
, (6)
где - представители интервалов (середины интервалов), - частоты соответствующих интервалов, - объем выборки.
Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Для взвешенных вариантов формула вычисления дисперсии имеет вид:
(7)
Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии:
. (8)
Среднее квадратическое отклонение – это абсолютная мера рассеяния вариантов ряда. Существует и относительная мера рассеяния – коэффициент вариации ( ).
Коэффициент вариации представляет собой процентное отношение среднего квадратического отклонения к средней выборочной:
(9)
Если коэффициент вариации признака, принимающего только положительные значения, высок (например, более 100%), то это говорит о неоднородности значений признака.
Медиана ( ) – значение признака ряда, относительного которого вариационный ряд делится на две равные по числу вариантов части.
Для расчета значения медианы в интервальном вариационном ряду вначале находят интервал, содержащий медиану. Медианному интервалу соответствует первая из накопленных частот, превышающая половину всего объема совокупности. Расчет медианного интервала производят по формуле:
, (10)
где - нижняя граница медианного интервала, - величина медианного интервала, - половина суммы всех частот, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала.
Мода ( )– это значение признака, наиболее часто встречающееся в вариационном ряду.
В случае, если интервальный вариационный ряд имеет равные интервалы, то модальный (содержащий моду) интервал определяется по наибольшей частоте. Мода внутри модального интервала находится по следующей формуле:
, (11)
где - нижняя граница модального интервала, - величина модального интервала, - частота модального интервала; - частота интервала, предшествующего модальному (предмодального интервала), - частота интервала, следующего за модальным (постмодального интервала).
Центральным эмпирическим моментом - го порядка называется среднее арифметическое -х степеней отклонений наблюдаемых значений случайной величины от их среднего арифметического ( ) и обозначается , т.е.
(12)
Вариационный ряд, в котором частоты вариантов, равноотстоящие от средней арифметической, равны между собой, называют симметричным, в противном случае – асимметричным, скошенным.
Необходимым, но не достаточным условием симметричности является равенство трех характеристик: средней арифметической, моды и медианы:
.
Если более длинная часть графика распределения расположена правее от вершины, то имеет место правосторонняя скошенность, а если левее - левосторонняя скошенность.
Для оценки отклонения эмпирического распределения от нормального используют различные характеристики, к числу которых относятся асимметрия и эксцесс.
Асимметрия эмпирического распределения определяется равенством
, (13)
где - центральный эмпирический момент третьего порядка.
Пределы значений асимметрии от до .
При распределение симметрично .
При , т.е. распределение имеет правостороннюю скошенность.
При , т.е. распределение имеет левостороннюю скошенность.
Эксцесс эмпирического распределения определяется равенством
, (14)
где - центральный эмпирический момент четвертого порядка.
Значения коэффициента эксцесса лежат на полусегменте .
Эксцесс является мерой «крутости» распределения (высоковершинности или низковершинности).
Если , то имеет место островершинность.
Если , то распределение имеет плоскую вершину.
Вариационный ряд, в котором частоты вариантов, равноотстоящие от средней арифметической, равны между собой, называют симметричным, в противном случае – асимметричным, скошенным.
Пример 2. Вычислить числовые характеристики случайной величины (Таблица №1), асимметрию и эксцесс.
Решение.
Найдем объем выборки - n, наибольшее значение случайной величины - , наименьшее значение - и шаг . Воспользуемся результатами расчетов Л.Р. №1 (Таб.№2).
Запишем интервальный ряд.
Найдем частоты, соответствующие каждому из полученных интервалов: Сервис \ Анализ данных \ Гистограмма и накопленные частоты.
Рассчитаем относительные частоты - .
Найдем середины интервалов - .
Найдем выборочную среднюю (формула (6)).
Вычислим выборочную дисперсию (смещенную оценку генеральной дисперсии) по формуле (7).
Вычислим выборочное среднее квадратическое отклонение (формула (8)).
Найдем центральные эмпирические моменты третьего - и четвертого - порядков:
(15)
(16)
Найдем асимметрию и эксцесс (формулы (11), (12), результаты указаны в расчетной таблице).
Найдем моду и медиану. Для расчета значения медианы в интервальном вариационном ряду вначале находим интервал, содержащий медиану. Таким интервалом является - , т.к. ему соответствует первая из накопленных частот (64), превышающая половину всего объема (50) совокупности. Расчет медианного интервала производим по формуле (10):
Для расчета моды определим сначала модальный (содержащий моду) интервал. В данном случае два интервала, которым соответствует наибольшая частота: и . Моду внутри модальных интервалов определяем по следующей формуле (11):
Таким образом .
Этапы решения задачи оформим в виде расчетной таблицы (Таблица № 5). Все расчеты выполним в табличном процессоре Excel.
Таблица №5
Интервалы |
Карман |
Частота (mi) |
Отнсительная частота (mi/n) |
Накопленная относительная частота |
Накопленная частота |
|
|
|
|
|
|
|
|
||
a0 |
0,21198 |
0,21198 |
0 |
0 |
0 |
0 |
|
|
|
|
|
|
|
|
|
a1 |
0,23802 |
0,23802 |
3 |
0,03 |
0,03 |
3 |
0,22500 |
0,00675 |
0,0089798 |
0,0002694 |
-0,0008509 |
-0,000025528 |
0,000080637 |
0,000002419 |
|
a2 |
0,26405 |
0,26405 |
13 |
0,13 |
0,16 |
16 |
0,25103 |
0,03263 |
0,0047236 |
0,0006141 |
-0,0003246 |
-0,000042204 |
0,000022312 |
0,000002901 |
|
a3 |
0,29008 |
0,29008 |
15 |
0,15 |
0,31 |
31 |
0,27707 |
0,04156 |
0,0018229 |
0,0002734 |
-0,0000778 |
-0,000011674 |
0,000003323 |
0,000000498 |
|
a4 |
0,31612 |
0,31612 |
15 |
0,15 |
0,46 |
46 |
0,30310 |
0,04547 |
0,0002776 |
0,0000416 |
-0,0000046 |
-0,000000694 |
0,000000077 |
0,000000012 |
|
a5 |
0,34215 |
0,34215 |
18 |
0,18 |
0,64 |
64 |
0,32913 |
0,05924 |
0,0000878 |
0,0000158 |
0,0000008 |
0,000000148 |
0,000000008 |
0,000000001 |
|
a6 |
0,36818 |
0,36818 |
18 |
0,18 |
0,82 |
82 |
0,35517 |
0,06393 |
0,0012536 |
0,0002256 |
0,0000444 |
0,000007989 |
0,000001571 |
0,000000283 |
|
a7 |
0,39422 |
0,39422 |
13 |
0,13 |
0,95 |
95 |
0,38120 |
0,04956 |
0,0037748 |
0,0004907 |
0,0002319 |
0,000030149 |
0,000014249 |
0,000001852 |
|
a8 |
0,42025 |
0,42025 |
4 |
0,04 |
0,99 |
99 |
0,40723 |
0,01629 |
0,0076514 |
0,0003061 |
0,0006693 |
0,000026772 |
0,000058545 |
0,000002342 |
|
a9 |
0,44628 |
0,44628 |
1 |
0,01 |
1 |
100 |
0,43327 |
0,00433 |
0,0128836 |
0,0001288 |
0,0014624 |
0,000014624 |
0,000165988 |
0,000001660 |
|
|
|
n= |
100 |
|
|
|
|
0,31976 |
|
0,0023656 |
|
-0,000000418 |
|
0,000011968 |
|
|
|
|
|
|
|
|
|
|
|
0,0486374 |
|
|
|
|
|
Статистические характеристики. Показатели вариации. |
|||||||||||||||
Выборочная средняя |
0,31976 |
||||||||||||||
Выборочная дисперсия |
0,0023656 |
||||||||||||||
Выборочное среднее квадратическое отклонение |
0,0486374 |
||||||||||||||
Центральный момент третьего порядка |
-0,000000418 |
||||||||||||||
Центральный момент четвертого порядка |
0,000000000 |
||||||||||||||
Асимметрия |
-0,00363626 |
||||||||||||||
Эксцесс |
-0,86135 |
||||||||||||||
Мода |
0,34215 |
||||||||||||||
Медиана |
0,32190 |
Задача 2. Вычислить числовые характеристики случайной величины (Таблица №4), асимметрию и эксцесс. Результаты оформить в виде расчетной таблицы Excel.