Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методические указания по математической статист...doc
Скачиваний:
32
Добавлен:
05.05.2019
Размер:
1.45 Mб
Скачать

II. Статистические характеристики вариационных рядов. M(X), d(X), σ(X), Mo, Me, показатели вариации. Асимметрия и эксцесс.

Пусть для изучения генеральной совокупности относительно количественного признака извлечена выборка объема . Составлен интервальный вариационный ряд.

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.

, (6)

где - представители интервалов (середины интервалов), - частоты соответствующих интервалов, - объем выборки.

Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Для взвешенных вариантов формула вычисления дисперсии имеет вид:

(7)

Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии:

. (8)

Среднее квадратическое отклонение – это абсолютная мера рассеяния вариантов ряда. Существует и относительная мера рассеяния – коэффициент вариации ( ).

Коэффициент вариации представляет собой процентное отношение среднего квадратического отклонения к средней выборочной:

(9)

Если коэффициент вариации признака, принимающего только положительные значения, высок (например, более 100%), то это говорит о неоднородности значений признака.

Медиана ( ) – значение признака ряда, относительного которого вариационный ряд делится на две равные по числу вариантов части.

Для расчета значения медианы в интервальном вариационном ряду вначале находят интервал, содержащий медиану. Медианному интервалу соответствует первая из накопленных частот, превышающая половину всего объема совокупности. Расчет медианного интервала производят по формуле:

, (10)

где - нижняя граница медианного интервала, - величина медианного интервала, - половина суммы всех частот, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала.

Мода ( )– это значение признака, наиболее часто встречающееся в вариационном ряду.

В случае, если интервальный вариационный ряд имеет равные интервалы, то модальный (содержащий моду) интервал определяется по наибольшей частоте. Мода внутри модального интервала находится по следующей формуле:

, (11)

где - нижняя граница модального интервала, - величина модального интервала, - частота модального интервала; - частота интервала, предшествующего модальному (предмодального интервала), - частота интервала, следующего за модальным (постмодального интервала).

Центральным эмпирическим моментом - го порядка называется среднее арифметическое -х степеней отклонений наблюдаемых значений случайной величины от их среднего арифметического ( ) и обозначается , т.е.

(12)

Вариационный ряд, в котором частоты вариантов, равноотстоящие от средней арифметической, равны между собой, называют симметричным, в противном случае – асимметричным, скошенным.

Необходимым, но не достаточным условием симметричности является равенство трех характеристик: средней арифметической, моды и медианы:

.

Если более длинная часть графика распределения расположена правее от вершины, то имеет место правосторонняя скошенность, а если левее - левосторонняя скошенность.

Для оценки отклонения эмпирического распределения от нормального используют различные характеристики, к числу которых относятся асимметрия и эксцесс.

Асимметрия эмпирического распределения определяется равенством

, (13)

где - центральный эмпирический момент третьего порядка.

Пределы значений асимметрии от до .

При распределение симметрично .

При , т.е. распределение имеет правостороннюю скошенность.

При , т.е. распределение имеет левостороннюю скошенность.

Эксцесс эмпирического распределения определяется равенством

, (14)

где - центральный эмпирический момент четвертого порядка.

Значения коэффициента эксцесса лежат на полусегменте .

Эксцесс является мерой «крутости» распределения (высоковершинности или низковершинности).

Если , то имеет место островершинность.

Если , то распределение имеет плоскую вершину.

Вариационный ряд, в котором частоты вариантов, равноотстоящие от средней арифметической, равны между собой, называют симметричным, в противном случае – асимметричным, скошенным.

Пример 2. Вычислить числовые характеристики случайной величины (Таблица №1), асимметрию и эксцесс.

Решение.

  1. Найдем объем выборки - n, наибольшее значение случайной величины - , наименьшее значение - и шаг . Воспользуемся результатами расчетов Л.Р. №1 (Таб.№2).

  2. Запишем интервальный ряд.

  3. Найдем частоты, соответствующие каждому из полученных интервалов: Сервис \ Анализ данных \ Гистограмма и накопленные частоты.

  4. Рассчитаем относительные частоты - .

  5. Найдем середины интервалов - .

  6. Найдем выборочную среднюю (формула (6)).

  7. Вычислим выборочную дисперсию (смещенную оценку генеральной дисперсии) по формуле (7).

  8. Вычислим выборочное среднее квадратическое отклонение (формула (8)).

    1. Найдем центральные эмпирические моменты третьего - и четвертого - порядков:

(15)

(16)

  1. Найдем асимметрию и эксцесс (формулы (11), (12), результаты указаны в расчетной таблице).

  2. Найдем моду и медиану. Для расчета значения медианы в интервальном вариационном ряду вначале находим интервал, содержащий медиану. Таким интервалом является - , т.к. ему соответствует первая из накопленных частот (64), превышающая половину всего объема (50) совокупности. Расчет медианного интервала производим по формуле (10):

Для расчета моды определим сначала модальный (содержащий моду) интервал. В данном случае два интервала, которым соответствует наибольшая частота: и . Моду внутри модальных интервалов определяем по следующей формуле (11):

Таким образом .

Этапы решения задачи оформим в виде расчетной таблицы (Таблица № 5). Все расчеты выполним в табличном процессоре Excel.

Таблица №5

Интервалы

Карман

Частота (mi)

Отнсительная частота

(mi/n)

Накопленная относительная частота

Накопленная частота

a0

0,21198

0,21198

0

0

0

0

 

 

 

a1

0,23802

0,23802

3

0,03

0,03

3

0,22500

0,00675

0,0089798

0,0002694

-0,0008509

-0,000025528

0,000080637

0,000002419

a2

0,26405

0,26405

13

0,13

0,16

16

0,25103

0,03263

0,0047236

0,0006141

-0,0003246

-0,000042204

0,000022312

0,000002901

a3

0,29008

0,29008

15

0,15

0,31

31

0,27707

0,04156

0,0018229

0,0002734

-0,0000778

-0,000011674

0,000003323

0,000000498

a4

0,31612

0,31612

15

0,15

0,46

46

0,30310

0,04547

0,0002776

0,0000416

-0,0000046

-0,000000694

0,000000077

0,000000012

a5

0,34215

0,34215

18

0,18

0,64

64

0,32913

0,05924

0,0000878

0,0000158

0,0000008

0,000000148

0,000000008

0,000000001

a6

0,36818

0,36818

18

0,18

0,82

82

0,35517

0,06393

0,0012536

0,0002256

0,0000444

0,000007989

0,000001571

0,000000283

a7

0,39422

0,39422

13

0,13

0,95

95

0,38120

0,04956

0,0037748

0,0004907

0,0002319

0,000030149

0,000014249

0,000001852

a8

0,42025

0,42025

4

0,04

0,99

99

0,40723

0,01629

0,0076514

0,0003061

0,0006693

0,000026772

0,000058545

0,000002342

a9

0,44628

0,44628

1

0,01

1

100

0,43327

0,00433

0,0128836

0,0001288

0,0014624

0,000014624

0,000165988

0,000001660

 

 

n=

100

 

 

 

0,31976

0,0023656

-0,000000418

0,000011968

0,0486374

Статистические характеристики. Показатели вариации.

Выборочная средняя

0,31976

Выборочная дисперсия

0,0023656

Выборочное среднее квадратическое отклонение

0,0486374

Центральный момент третьего порядка

-0,000000418

Центральный момент четвертого порядка

0,000000000

Асимметрия

-0,00363626

Эксцесс

-0,86135

Мода

0,34215

Медиана

0,32190

Задача 2. Вычислить числовые характеристики случайной величины (Таблица №4), асимметрию и эксцесс. Результаты оформить в виде расчетной таблицы Excel.