Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика учебник.doc
Скачиваний:
29
Добавлен:
05.11.2018
Размер:
13.86 Mб
Скачать

1.10.4. Симметричные распределения

Симметричным распределением называется распределение значений признака х, для которого среднее значение , мода и медиана совпадают. Поэтому показателем, характеризующим асимметричность распределения (нарушение симметрии) является коэффициент асимметрии As, вычисляемый по формуле

или (1.10.4)

где – среднее значение,

– мода,

– медиана,

– среднеквадратическое отклонение.

Для симметричных распределений Положительный коэффициент асимметрии указывает на наличие правосторонней асимметрии, при которой . Отрицательный коэффициент асимметрии свидетельствует о левосторонней асимметрии, при которой , а положительный коэффициент асимметрии свидетельствует о правосторонней асимметрии, при которой .

Более точно коэффициент асимметрии эмпирического распределения вычисляется по формуле

. (1.10.5)

На рис. 1.10.6 а и б изображены кривые соответственно с правосторонней и левосторонней асимметрией.

а) б)

Рис. 1.10.6. Кривые распределений

Оценка степени существенности коэффициента асимметрии производится с помощью средней квадратической ошибки, которая рассчитывается по формуле

где n – объем выборки. Если

то асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если

то асимметрия несущественна, ее наличие может быть объяснено влиянием случайных факторов.

Для симметричных эмпирических распределений рассчитывается показатель эксцесса Еx по формуле

(1.10.6)

В случае Еx>0 или Еx<0 распределение называется соответственно островершинным или плосковершинным. На рис. 1.10.7 а) и б) изображены кривые островершинного (Еx >0) и плосковершинного (Еx <0) распределений.

а) б)

Рис. 1.10.7. Кривые островершинного и плосковершинного распределений

Средняя квадратическая ошибка эксцесса рассчитывается по формуле

где n – объем выборки.

Если

то эксцесс существенен, а если

то эксцесс несущественен, его наличие может быть объяснено влиянием случайных факторов.

С помощью статистических функций СКОС и ЭКСЦЕСС в Excel вычисляются соответственно коэффициент асимметрии и эксцесс по несгруппированным значениям признака.

Рис. 1.10.8. Коэффициент асимметрии и эксцесс распределения

предприятий по товарной продукции

На рис. 1.10.8 изображен рабочий лист, на котором с помощью указанных функций вычислены коэффициент асимметрии и эксцесс распределения предприятий по товарной продукции, рассмотренного в примере 1.5.2. Эти коэффициенты указывают на левостороннюю асимметрию и плосковершинность распределения.

Упражнение 1.10.4. С помощью функций СКОС и ЭКСЦЕСС в Excel вычислите коэффициент асимметрии и эксцесс по данным примера 1.5.1. Сформулируйте выводы.

1.10.5. Нормальное распределение

В социально-экономических исследованиях часто встречаются распределения, зависящие от большого числа факторов. Для таких распределений теоретическим является нормальное распределение. Теоретической кривой нормального распределения (нормальной кривой) является график функции

, (1.10.7)

где нормированное стандартное отклонение;

– его среднее значение;

– среднеквадратическое отклонение;

и – математические постоянные.

На рис. 1.10.9 изображена нормальная кривая.

Рис. 1.10.9. Нормальная кривая (показано приблизительное

распределение площадей по кривой)

Значения функции (1.10.7) приведены в табл. П1 приложения 1.

Нормальная кривая обладает следующими свойствами:

  1. функция f(t) – четная, т. е. f(t) =f(t);

  2. функция f(t) определена на всей числовой оси и стремится к нулю при ;

  3. функция f(t) имеет максимум при t = 0;

  4. при t = ± 1 график функции f(t) имеет точки перегиба.

Из свойств функции f(t) следует:

  1. нормальная кривая симметрична относительно прямой с уравнением t=0, равносильным уравнению ;

  2. нормальная кривая асимптотически приближается к оси абсцисс;

  3. мода нормального распределения совпадает со средним значением ;

  4. при откло­нении х от по абсолютной величине на одно нормированное стандартное от­клонение нормальная кривая меняет направление выпуклости.

Эксцесс нормального распределения равен нулю. Поэтому, если эксцесс эмпирического распределения, теоретическим распределением которого является нормальное распределение, положителен (либо отрицателен), то эмпирическая кривая имеет более острую (либо более плоскую) вершину по сравнению с нормальной кривой. Этим объясняется название эксцессизлишек.

Интегрируя функцию (1.10.7), получим нормированную функцию Лапласа

, (1.10.8)

значения которой приведены в табл. П2.

С помощью функции (1.10.8) вычисляется вероятность того, что признак х, имеющий нормальное распределение, примет значение, принадлежащее интервалу :

. (1.10.9)

Из формулы (2.10.9) следует, что

.

Так как функция Лапласа – нечетная, то . Поэтому вероятность того, что отклонение нормально распределенного признака х от его среднего значения по абсолютной величине меньше заданного положительного числа вычисляется по формуле

. (1.10.10)

Полагая в формуле (1.10.10) , получим , т.е. вероятность того, что абсолютная величина отклонения значения признака х от его среднего значения превысит утроенное среднеквадратическое отклонение, очень мала (она равна 0,0027). Поэтому для эмпирических распределений, близких к нормальному распределению, применимо правило трех сигмзначения признака, большие по абсолютной величине 3, считаются аномальными и исключаются из рассмотрения.

Для проверки близости эмпирического распределения к нормальному распределению применяются правила, называемые критериями согласия.

Рассмотрим критерий согласия Пирсона, применяемый к эмпирическому распределению, представленному интервальным рядом с равными по длине интервалами:

1) вычисляются теоретические частоты – частоты, которые имел бы ряд, если бы его распределение было нормальным, по формуле

, (1.10.11)

где

l  длина интервалов,

 нормированные стандартные отклонения,

f(t) – функция (1.10.7);

2) интервалы с малочисленными теоретическими частотами (до 10) объединяются;

3) вычисляется число («хи-квадрат») по формуле

; (1.10.12)

4) в таблице П3 по числам (1.10.12) и , где число интервалов ряда с теоретическими частотами, находится вероятность р;

5) если вероятность p> 0,01, то имеющиеся расхождения между данными и теоретическими частотами следует считать несущественными, а эмпирическое распределение  близким к нормальному распределению.

Пример 1.10.2. Дано эмпирическое распределение (табл. 1.10.3).

Таблица 1.10.3