Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Л5-Исследование вариационного ряда для студенто...doc
Скачиваний:
5
Добавлен:
20.11.2019
Размер:
587.78 Кб
Скачать

7

Лекция № 5: «исследование формы вариационного ряда»

Учебные вопросы лекции:

1. Основные формы статистического распределения

2. Понятия о моментах статистического распределения

3. Асимметрия и эксцесс распределения (рассмотрим на практике).

  1. Основные формы статистического распределения

В вариационных рядах распределения существует определенная связь между изменением частот и значением варьирующего признака: частоты с ростом значения признака сначала увеличиваются, а затем после достижения какой-то максимальной величины в середине ряда уменьшаются. Значит, частоты в рядах изменяются закономерно в связи с изменением варьирующего признака. Такого рода закономерные изменения частот в вариационных рядах называются закономерностями распределения.

Анализ вариационных рядов предполагает выявление такой закономерности распределения, определение ее типа и построение теоретической кривой распределения, характеризующей данный тип распределения. Для обобщающей характеристики особенностей формы распределения применяются кривые распределения.

Кривая распределения выражает закономерность распределения единиц совокупности по величине варьирующего признака и представляет собой графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариант (гистограмма, полигон).

В интервальном вариационном ряду Отыскание кривой распределения возможно примерную картину распределения отображает гистограмма распределения, отражая зависимость между значениями признака xi и fi.. Гистограмма распределения изображает частоты определенного интервала.

Переход от гистограммы к кривой распределения осуществляется путем уменьшения величины интервала, а, следовательно, увеличения числа групп. В этом случае число столбиков безгранично возрастает, а их основание уменьшается, в итоге получается более точная картина распределения в форме кривой.

В дискретных рядах распределения переход кривой распределения не возможен. При анализе дискретного ряда ограничиваются выявлением закономерности между вариантами и частотами по полигону частот.

Различают эмпирические и теоретические кривые распределения:

Эмпирическая кривая распределения – это фактическая кривая распределения, полученная по данным наблюдения, в которой отражаются как общие, так и случайные условия, определяющие распределение.

Теоретическая кривая распределения – это кривая, выражающая функциональную связь между изменением варьирующего признака и изменением частот и характеризующая определенный тип распределения.

Различают следующие виды эмпирических кривых распределения:

1.одновершинные кривые, которые, как правило, характерны для однородных совокупностей:

  • симметричные;

  • несимметричные: умеренно-ассиметричные, крайне – ассиметричные; V-образные.

2. многовершинные кривые – характеризуют неоднородные совокупности распределения явлений, появление двух и более вершин приводит к необходимости перегруппировки данных с целью выявления более однородных групп.

Симметричным называется распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений средняя арифметическая, мода и медиана равны между собой.

Несимметричное распределение:

Умеренно-ассиметричное распределение – такой вид распределения, при котором малая часть частот находятся по одну сторону от центра распределения, а большая часть частот находится по другую сторону на одинаковом расстоянии.

В зависимости от того, какая ветвь кривой вытянута – правая или левая, различают правостороннюю положительную или левостороннюю отрицательную асимметрию (рис. 1).

Рисунок 1 – Правосторонняя и левосторонняя асимметрия

Крайне ассиметричными называются ряды распределения, у которых частоты постоянно возрастают или убывают.

При V-образном распределении частоты вначале убывают, а потом возрастают.

В практике статистического исследования встречаются различные виды теоретических распределений распределения: нормальное, логарифмическое, биноминальное, Пуассона и др. Каждое из теоретических распределений имеет специфику и свою область применения в различных отраслях знания.

Нормальное распределение, также известное, как распределение Гаусса, является одним из наиболее известных непрерывных распределений.

В качестве некого стандарта теоретического закона распределения выступает нормальный закон распределения, с которыми сравниваются другие распределения. Распределение признаков совокупности называется нормальным, если этот признак представляет собой результат воздействия множества факторов случайных и независимых или слабозависимых, и влияние каждого из них мало по сравнению с общим воздействием факторов.

Нормальный закон распределения используется для аппроксимации (выравнивания) эмпирических кривых распределения и сопоставления их с теоретическими.

Функция нормального распределения, т. е. простейшее каноническое уравнение нормальной кривой, выглядит следующим образом:

,

где F(x) – ордината кривой нормального распределения (частости);

е=2,7182 – основание натурального логарифма;

p=3,1415 – постоянное число:

Представленная функция является табулированной и может быть определена с помощью математико-статистической таблицы.

Из данной формулы видно, что ординаты (частоты) нормальной кривой являются функцией нормированного отклонения t.

Поэтому необходимо вычислить индивидуальное нормированное отклонение, которое используется для установления вероятности попадания значений признака в заданный интервал.

,

где – варианты;

– средняя величина;

– среднее квадратическое отклонение.

Таким образом, кривая распределения будет зависеть от средней величины и среднего квадратического отклонения (рис. 2).

При нормальном распределении вариационный ряд распределения укладывается в границы: ( ) и

Рисунок 2 – Кривая нормального распределения

Так как распределение зависит от уровня вариации, т.е. от значений среднеквадратического отклонения, то кривая распределения будет иметь различные вершины. Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения (рис. 3).

Рисунок 3 – Эксцесс распределения

Логарифмические нормальные распределения играют большую роль в математической статистике, так как встречаются очень часто в практике обработки наблюдений и легко преобразуются к нормальному распределению. Для экспериментатора было бы непростительно провести, например, регрессионный анализ по результатам наблюдений, распределенных логарифмически нормально, без их предварительного преобразования.

В начале ХХ века английским математиком Госсетом, известным под псевдонимом Стьюдент, было установлено, что при небольших объемах выборки несмотря на все условия для проявления закона нормального распределения, имеют место отклонения от последнего, причем тем больше, сем меньше выборка.

Распределение Стьюдента – это теоретическое выборочное распределение. При выборочном распределении понимается распределение частот (частостей или вероятностей) значений какого-либо выборочного показателя. Например, распределение, предоставляющее средние значения х из большого числа выборок одинакового объема, называют выборочным распределением средней. Величина нормированного отклонения вычисляется в этом случае по формуле:

,

где tкритерий Стьюдента;

– средняя j-й выборки;

– средняя генеральной совокупности;

– среднее квадратическое отклонение выборочной средней от средней величины генеральной совокупности.

Величина , определяемая как средняя ошибка выборки может быть вычилена по формуле:

,

где – среднее квадратическое отклонение признака х в генеральной совокупности.

Таким образом, значения t во многом зависят от объема выборки. Форма частот также изменяется. Форма распределения Стьюдента похожа на форму нормального распределения. Чем меньше объем выборки, тем более пологой становится форма кривой. При увеличении объема выборки распределение Стьюдента приближается к нормальному. Уже для n=50 расхождения между ними несущественны. Отличием является то, что хвосты распределения Стьюдента медленнее стремятся к нулю, чем хвосты нормального распределения.

t-распределение Стьюдента – это непрерывное одномерное распределение с одним параметром – количеством степеней свободы. С помощью t-распределения устанавливается соотношение между возможным расхождением значений средних в выборке в генеральной совокупности, с одной стороны, и с вероятностью такого события – с другой.

Есть и другие разделы статистики, в которых появляются случайные величины, распределенные по Стьюденту. Например, распределение Стьюдента используется при оценке значимости коэффициента корреляции Пирсона.

Биномиальное распределение B(n,p) – это распределение числа успехов в серии из n экспериментов, каждый из которых завершается успехом с вероятностью p. Важными предельными случаями биномиального распределения являются распределение Пуассона и нормальное распределение.

Если X – биномиальная случайная величина, то

Распределение Пуассона – это дискретное распределение, являющееся одним из важных предельных случаев биномиального распределения.

Если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии ( ), такой ряд выравнивается по кривой Пуассона.

Кривую Пуассона можно выразить отношением:

,

где F(x) – вероятность наступления отдельных значений х

– средняя арифметическая ряда.

При выравнивании эмпирических данных теоретические частоты можно определить по формуле

,

где f' – теоретические частоты;

N – общее число единиц ряда.

Сравнивая полученные величины теоретических частот f' c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики.

Распределение Пуассона широко используется для аппроксимации биноминального распределения, когда на то есть необходимые условия. Биноминальное распределение является дискретным, варьирующий признак принимает только два значения х1 и х2, частоты характеризуют вероятность появления различного числа значений в n испытаниях.

Классическим примером случайной величины, распределенной по Пуассону, является количество машин, проезжающих через какой-либо участок дороги за заданный период времен. Также можно отметить такие примеры, как количество звезд на участке неба заданной величины, количество ошибок в тексте заданной длины, количество телефонных звонков в call-центре или количество обращений к веб-серверу за заданный период времени.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]