Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мет.указания .doc
Скачиваний:
19
Добавлен:
10.11.2019
Размер:
896 Кб
Скачать

Тема 3. Ряды распределения

Ряд распределения это упорядоченная совокупность данных, в которой каждому значению признака (варианте или интервалу) соответствует определенное значение частоты или частости.

Варианта (Х)- это отдельные значения группировочного признака, которые он принимает в вариационном ряду.

Частота(f)-число, которое показывает, как часто встречается та или иная варианта в ряду распределения.

Занятие 1. Построение и графическое изображение рядов распределения

Цель занятия: освоить методику построения дискретного и интервального рядов распределения, их графическое изображение и назначение графиков.

Методические указания:

1. Построить ранжированный ряд распределения. Особенностью ранжированного ряда является то, что одинаковые по значению единицы совокупности повторяются в нем столько раз, сколько раз они встречаются в исходной совокупности.

2. Построить огиву распределения, характеризующую интенсивность нарастания признака. При ее построении на вертикальной оси откладываются значения признака х, а на горизонтальной - порядковый номер в ранжированном ряду. Пояснить характер нарастания признака.

3. Построить интервальный вариационный ряд распределения, придерживаясь следующей последовательности:

а) определить число интервалов по формуле Стерджесса:

n=1+3,322 lg N,

где:n- число интервалов;

N- численность анализируемой совокупности.

б) установить величину (шаг) интервала, используя формулу:

і= ,

где: Хmах - максимальное значение признака;

Хmin - минимальное значение признака;

n - число интервалов;

Ra - абсолютный размах вариации.

в) определить числовые границы интервалов для каждой группы:

1.от Хmin до Хmin + i

2.от Хmin +i до Хmin +2i

3.от Хmin +2i доХmin +3i

г) распределить единицы совокупности по выделенным группам, используя итоговую группировочную таблицу интервального вариационного ряда распределения.

Таблица 1

Название таблицы

Интервалы по_______,

ед.изм.

Частота,

f

Частости,

d

Накопленные частоты,

fn

Середина интервала,

х

х*f

Итого:

100,0

Х

Х

4. Изобразить интервальный ряд распределения графически.

Гистограмма - способ графического изображения интервальных рядов распределения. Строится в прямоугольной системе координат. По оси абсцисс откладываются отрезки, изображающие интервалы значений варьирующего признака. На этих отрезках, как на основаниях, строят прямоугольники, высота которых соответствует частотам.

5. На базе гистограммы построить полигон распределения, для этого необходимо середины верхних сторон прямоугольника соединить отрезками прямой.

Занятие 2. Расчет показателей центра распределения и показателей

вариации

Для большинства статистических распределений характерным является концентрация значений признаков х около некоторого центра распределения. Центр распределения характеризуется следующими показателями:

- средняя арифметическая;

- мода;

- медиана.

Цель занятия: освоить методику расчета показателей центра распределения и показателей вариации в рядах распределения.

Методические указания:

1.Средней величиной признака х некоторой статистической совокупности называется то уравненное значение признака, которое можно придать всем элементам совокупности, сохраняя неизменным ее определяющее свойство по данному признаку.

Средняя арифметическая выражается в 2 формах:

-простая:

Х =

-взвешенная:

Х=

__

где: Х - среднее значение признака по всей совокупности;

Х - середина интервала;

f - частоты или частости соответствующих групп;

n - число единиц в совокупности.

2. Мода - это варианта, которая встречается в совокупности наибольшее число раз.

Мода в дискретном ряду определяется визуально, т.е. модальной является та варианта, которая имеет наибольшую частоту.

Мода в интервальном ряду определяется по формуле:

где: Хо- нижняя граница модального интервала, т.е. интервала, имеющего наибольшую частоту;

i- величина( шаг) интервала;

fmo- частота модального интервала;

fmo-1- частота предмодального интервала;

fmo+1- частота послемодального интервала.

3. Медиана - это варианта, которая делит ряд распределения строго пополам.

Медиана в дискретном ряду находится следующим образом: двигаясь вниз по ряду накопленных частот находят такое ее значение, которое равно половине всех частот или первым содержит эту половину. Такая частота соответствует медианному значению.

В интервальном ряду медиана определяется по формуле:

Ме=Хо+i

где: Хо- нижняя граница медианного интервала;

i- шаг интервала;

Sme-1- сумма накопленных частот предмедианного интервала;

fme- частота медианного интервала.

__

Близость значений Хо, Мо и Ме указывает на близость изучаемого распределения к нормальному. В теоретически нормальном распределении эти средние совпадают Х= Мо= Ме.

Следующая группа характеристик ряда распределения - показатели вариации. Назначение показателей вариации - углубить анализ распределения и охарактеризовать степень варьирования единиц совокупности относительно центра распределения.

Таблица 2

Исходные и расчетные данные для определения показателей вариации

Интервалы по__________________

Частоты

f

Середина интервала

х

/ х- /*f

(х- )2*f

Итого:

1. Абсолютный размах вариации(Ra) характеризует пределы изменения варьирующего признака. Величина такого показателя целиком зависит от случайностей расположения крайних вариант ряда распределения:

Ra=Хмах-Хmin

где:Хмах - маскимальное значение признака;

Хmin - минимальное значение признака.

2. Среднее линейное отклонение (L) представляет собой отклонение вариант ряда в ту или иную сторону от средней арифметической:

L=

3. Дисперсия-средний квадрат отклонений индивидуальных значений признака от средней арифметической:

=

4. Среднее квадратическое отклонение:

=

5. Относительный размах вариации:

R(%)=

6.Коэффициент вариации линейный:

V =

7. Коэффициент вариации квадратический:

V =

Для распределения близкого к нормальному =1,25

Занятие 3-4. Расчет показателей формы распределения. Оценка статистических гипотез, расчет критерия согласия Пирсона «хи-квадрат»

Цель занятия: освоить методику расчета показателей асимметрии и эксцесса в рядах распределения, определения теоретических частот и расчет критерия согласия Пирсона «хи-квадрат»

Методические указания:

К числу характеристик ряда распределения относятся показатели, характеризующие его «скошенность» - асимметричность и «крутость» - островершинность и плосковершинность.

При исчислении показателей асимметрии и эксцесса необходимо рассчитать вспомогательную таблицу.

Таблица 3

Исходные и расчетные данные для определения моментов

Интервалы по

___________

Частота,

f

х-

(х- )3*f

(х- )4*f

Итого:

Х

Если численность групп убывает в одну сторону кривой быстрее, чем в другую (относительно вершины), то говорят, что имеет место асимметрия распределения. Для характеристики степени асимметрии по горизонтали применяется два показателя:

- коэффициент асимметрии:

Ка= ,

где: х - среднее значение признака;

Мо - мода;

- среднее квадратическое отклонение.

- степень асимметрии:

А = ,

где: М3- центральный момент третьего порядка

М3=

- среднее квадратическое отклонения, возведенное в третью степень.

Если Аs > 0, то асимметрия правосторонняя, если Аs < 0 – левосторонняя или отрицательная, если Аs = 0, то вариационный ряд принято считать симметричным (нормальное распределение).

Если Ка по абсолютной величине превосходит 0,5, распределение принято считать существенно асимметричным.

Эксцесс отклонение кривых от кривой нормального распределения по вертикали. Эксцесс можно измерить с помощью показателя:

Ех=

где: М4- центральный момент четвертого порядка

М4 =

- среднее квадратическое отклонение, возведенное в 4 степень

Если Ех> 0, то наблюдается остро вершинное распределение, если Ех < 0, то низко вершинное распределение, если Ех = 0 – нормальное распределение.

В разделе оценка статистических гипотез математическая статистика рассматривает вопрос о критериях согласия, при помощи которых проверяется гипотеза о соответствии или несоответствии того или иного теоретического закона распределения, принятого для отражения искомого эмпирического распределения.

Выдвинем гипотезу, что анализируемое распределение подчиняется закону нормального распределения и проверим ее, используя как графический метод, так и расчет критерия согласия Пирсона «хи-квадрат».

Нормальное распределение играет роль стандарта, с которым сравнивают изучаемую совокупность.

Признаки нормального распределения:

1.Особая схема распределения частот в рядах распределения- вначале их значения нарастают, а затем убывают.

2.Полигон, построенный на базе гистограммы, имеет одну вершину и ветви его располагаются симметрично относительно этой вершины.

3.Показатели центра совпадают или близки друг к другу

=Мо=Ме

4.Выполняется правило 3 (трех сигм).

5.Показатели асимметрии и эксцесса равны 0

Ка=Аs=Ех=0

6.Между эмпирическими и теоретическими частотами распределения расхождения носят случайный характер.

Кривая нормального распределения – это колоколообразная кривая, ветви которой располагаются симметрично относительно вершины и асимптотически по отношению к оси ОХ и описывается формулой:

У= где: t- нормальное отклонение

Значение (t)= -величина табулированная и находится в таблицах «Плотность нормального распределения (t)» или просто «Значение функции (t)» в соответствии с заданным уровнем t.

Тогда теоретические частоты можно определить по формуле:

=

Для определения теоретических частот необходимо рассчитать вспомогательную таблицу.

Таблица 4

Исходные и расчетные данные для определения теоретических частот

Интервалы по________

Середина интервала, х

f

х-

t=-

=

Итого:

х

х

х

х

Полученные теоретические частоты( ) нанести на график эмпирического распределения и оценить графически близость полигона и кривой нормального распределения.

Близость эмпирического и теоретического распределения можно оценить, используя критерий согласия Пирсона .

Критерий применяется в многочисленных интервалах, где fi>5.Если это условие не выполняется, то группы сливаются посредством слияния интервалов таким образом, чтобы вновь полученные имели численность единиц в каждой более 5.

Значение определяется по формуле:

=

и сравнивается с табличным .

Таблица 5

Исходные и расчетные данные для определения критерия согласия Пирсона

Интервалы по ______

f

f-

(f- )2

Итого:

х

х

Табличное значение критерия устанавливается в соответствии с заданным уровнем значимости и числом степеней свободы.

Число степеней свободы определяется по формуле:

У = n-3

где: у-число степеней свободы;

n-число интервалов(если имело место слияние, то после слияния интервалов).

Если фактическое не превышает табличное( ), то отклонения фактических частот от теоретических признаются случайными и можно считать, что эмпирическое распределение подчиняется закону нормального распределения. Если , то гипотеза о соответствии распределения отвергается.

Значение существенности .

Число степеней свободы

Уровни значимости

0.05

0.01

1

3.841

6.635

2

5.991

9.210

3

7.815

11.345

4

9.488

13.277

5

11.070

15.086

6

12.592

16.812