Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
статистика лекции александрова.doc
Скачиваний:
21
Добавлен:
02.05.2019
Размер:
1.59 Mб
Скачать

Тема 5. Анализ рядов распределения

Разделы темы:

  1. Основные характеристики закономерностей распределения. Расчет показателя центра распределения

  2. Измерение и оценка вариации

  3. Способы расчета дисперсии

  4. Характеристики форм распределения

    1. ЧТО ОТНОСИТСЯ К ОСНОВНЫМ ХАРАКТЕРИСТИКАМ ЗАКОНОМЕРНОСТЕЙ РАСПРЕДЕЛЕНИЯ?

-

Характеристика распределения

центр распределения;

- вариация;

- форма распределения.

5.2 ЧТО ОТНОСИТСЯ К ПОКАЗАТЕЛЯМ ЦЕНТРА РАСПРЕДЕЛЕНИЯ?

-

Показатели центра распределения

средняя;

- мода;

- медиана;

- квартили;

- децили.

5.3 Что называется модой в статистике?

-

Мода в статистике

наиболее часто встречающееся значение признака

-

Мода в дискретном вариационном ряду

тот вариант ряда, который имеет наибольшую частоту, т.е. повторяется чаще других.

Пример 5.1

По данным примера 4.7 модой будет являться выработка, равная 20 деталям, т.к. трое рабочих из десяти имели этот показатель.

-

Мода в интервальном вариационном ряду

ряду

определяется по формуле:

где – нижняя граница модального интервала

h – ширина модального интервала;

– соответственно частота модального, предмодального и послемодального интервалов.

Пример 5.2

По данным примера 4.9

Мо = 100 + 50*(20-10)/((20-10)+(20-17)) = 100 + 500/13 = 138,46 млн.грн.

Вывод: В данной группе заводов наиболее часто встречается объем товарной продукции в размере 138.46 млн.грн.

5.4 ЧТО НАЗЫВАЕТСЯ МЕДИАНОЙ В СТАТИСТИКЕ?

-

Медиана в статистике

значение признака у той единицы совокупности, которая расположена в середине ранжированного ряда.

-

Медиана в дискретном вариационном ряду

тот вариант, которому соответствует значение: , если f – нечетное число

, если f – четное число.

Пример 5.3

По данным примера 4.7 медианой будет являться значение пятой варианты (10/2=5), т.е. выработка равная 21 детали.

Медиана в интервальном вариационном ряду

-определяется по формукле:

,

где XМе – нижняя граница медианного интервала

h – ширина медианного интервала

- численность ряда, сумма частот;

Sme – частота, накопленная до медианного интервала;

fme - частота медианного интервала.

Пример 5.4

По данным примера 4.9 (табл. 4.4) медианным интервалом будет товарная продукция в пределах 100-150 млн.грн, т.к. судя по кумулятивным (накопленным) частотам 28-я варианта ((55+1) / 2 = 28) попадает именно в этот интервал.

млн.грн.

Вывод: половина предприятий выпускает товарной продукции на сумму менее 136.25 крб., а половина – более 136.25 млн.грн.

5.5 ЧТО ПРЕДСТАВЛЯЮТ СОБОЙ КВАРТИЛИ И ДЕЦИЛИ В СТАТИСТИКЕ?

-

Квартиль

одна из разновидностей структурных показателей изучаемой совокупности; - делят ряд по сумме частот на четыре равные части

-

Децили

делят ряд на 10 равных частей по сумме частот.

Нижний (первый) квартиль

-

Верхний (третий) квартиль

где – нижние границы соответствующих квартилей:

h – величина интервала;

, – накопленные частоты интервалов, предшествующих квартильным;

f – частоты соответствующих квартильных интервалов.

Вторым квартилем является медиана.

Пример 5.5

По данным примера 4.8 (табл 4.4)

млн.грн.

млн.грн.

Вывод: 25 % предприятий производят товарной продукции на сумму менее 101,87 млн. грн., а 75 % - более 101,87 млн. грн. 75 % предприятий производят товарной продукции на сумму менее 174,26 млн.грн., а 25 % - более 174,26 млн.грн.

    1. ЧТО ПРЕДСТАВЛЯЕТ СОБОЙ ВАРИАЦИЯ И КАКОВА ЗАДАЧА СТАТИСТИЧЕСКОГО ИЗУЧЕНИЯ ВАРИАЦИИ?

-

Вариация

колеблемость, изменение значений какого-либо признака; - это свойство статистической совокупности.

Обусловлена действием большого количества взаимосвязанных причин, среди которых есть:

-

Задача статического изучения вариации

дать числовое выражение колеблемости признаков для более глубокого и всестороннего познания сущности изучаемых объектов.

    1. КАКИЕ ПОКАЗАТЕЛИ ВАРИАЦИИ РАЗЛИЧАЮТ В СТАТИСТИКЕ?

-

Показатели вариации

размерах вариации;

- среднее линейное отклонение;

- дисперсия;

- среднее квадратическое отклонение;

- коэффициенты вариации;

    1. В ЧЕМ ЗАКЛЮЧАЕТСЯ СУЩНОСТЬ РАЗМАХА ВАРИАЦИИ

-

Размах вариации (R)

амплитуда колебания;

- ширина рассеяния;

- разность между экстремальными значениями вариационного ряда.

R = Xmax – Xmin

По данным примера табл 4.2 размах вариации равен 8 деталей ( 28 – 20 = 8).

Достоинство R

простота операций

-

Недостатки R

зависимость от крайних значений;

-- на его величину оказывает влияние случайность;

- не учитывает частоты в вариационном ряду;

- отсутствует связь со средней величиной.

    1. ЧТО ПРЕДСТАВЛЯЕТ СОБОЙ СРЕДНЕЕ ЛИНЕЙНОЕ ОТКЛОНЕНИЕ

-

Среднее линейное отклонение (Л)

средняя арифметическая из абсолютных значений отклонений отдельных вариантов от средней арифметической.

а

Формы среднего линейного отклонения

) взвешенное (для вариационного ряда по сгруппированным данным)

б) невзвешенное

    1. ЧТО ТАКОЕ ДИСПЕРСИЯ

-

Дисперсия

средний квадрат отклонений вариантов от их средней величины.

а

Формы дисперсии

) взвешенная б) невзвешенная

Среднеквадратическое отклонение

-

    1. ЧТО ПРЕДСТАВЛЯЕТ СОБОЙ КОЭФФИЦИЕНТ ВАРИАЦИИ?

-

Коэффициент вариации

это процентное отношение абсолютных характеристик вариации к характеристикам центра распределения.

    1. КАК РАССЧИТЫВАЮТСЯ КОЭФФИЦИЕНТЫ ВАРИАЦИИ?

-

Формулы для расчета

линейный ; - квадратический ; - осцилляции ;

    1. КАКАЯ СУЩЕСТВУЕТ ВЗАИМОСВЯЗЬ МЕЖДУ ПОКАЗАТЕЛЯМИ ВАРИАЦИЯМИ?

1

Нормальное распределение или близкое к нему

) 2) или

Л=0.8

    1. СПОСОБЫ РАСЧЕТА ДИСПЕРСИИ

1. Варианты небольшие и число случаев незначительно.

Дисперсия равна разности между средней квадратов вариантов и квадратом их средней.

Пример 5.6

По данным таблицы 6.2 рассчитать дисперсию

Выработка (х)

Число рабочих (f)

xf

x2f

20

21

24

26

28

3

2

2

2

1

60

42

48

52

28

1200

882

1152

1352

784

Итого:

10

230

5370

- средняя выработка:

- средняя квадратов вариантов:

- дисперсия:

Вывод: Средний квадрат отклонений выработки от ее средней величины равен 8.

2. Способ моментов, основанный на отсчете от условного нуля;

Пример 6.2

Используя данные примера 4.9 (табл. 4.4) рассчитать дисперсию

Товарная продукция

Число заводов f

X

До 50

50-100

100-150

150-200

200-250

3

10

20

17

5

25

75

125

175

225

-2

-1

0

1

2

-6

-10

0

17

10

12

10

0

17

20

Итого:

55

11

59

3. Дисперсия альтернативного признака - это произведение частей, отражающих структуру совокупности.

- доля единиц, обладающая данным признаком.

    1. КАКИЕ БЫВАЮТ ФОРМЫ РАСПРЕДЕЛЕНИЯ?

-

Формы распределения

одновершинные - двувершинные - многовершинные

    1. КАКИЕ БЫВАЮТ ВИДЫ ОДНОВЕРШИННЫХ РАСПРЕДЕЛЕНИЙ?

1

Виды одновершинных распределений

) симметричные; 2) асимметричные; 3) островершинные;

4) плосковершинные.

-

Симметричное распределение

равноотдаленные от центра значения признака имеют равные частоты; - характеристика центра имеет одинаковые значения ( );

-

Асимметричное распределение

вершина центра смещена - направление асимметрии – противоположно направлению смещения вершины.

As = 0 – нормальное распределение

As > 0 – правостороннее распределение со смещением влево

As < 0 – левостороннее распределение со смещением вправо

Вид распределения определяется на основе момента распределения

Момент распределения

- это средняя арифметическая К-й степени отклонений(х-А)к А – величина, от которой определяют отклонения

При - получаем центральные моменты.

Центральный момент 1-го порядка (М1)

- это средняя арифметическая.

Центральный момент 2-го порядка (М2)

- это средний квадрат отклонений значений признака от средней; - характеризует дисперсию (М2= 2)

-

Центральный момент 3-го порядка (М3)

характеризует асимметрию (скошенность)

-

Центральный момент 4-го порядка (М4)

характеризует эксцесс (островершинность)

Коэффициент асимметрии (Аs)

    1. КАК ОПРЕДЕЛЯЕТСЯ СУЩЕСТВЕННОСТЬ АСИММЕТРИИ?

-

Оценка степени существенности асимметрии

определяется с помощью средней квадратической ошибки ( ), которая зависит от объема наблюдений.

Если отношение , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным.

Если , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных факторов.

    1. ЧТО ХАРАКТЕРИЗУЕТ И КАК ОПРЕДЕЛЯЕТСЯ КОЭФФИЦИЕНТ ЭКСЦЕССА?

Коэффициент эксцесса (Ех)

- характеризует выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.

Определяется по формуле:

Если Ех =3 – нормальное распределение Ех >3 – островершинное распределение Ех < 3 – плосковершинное распределение

    1. КАК ОПРЕДЕЛЯЕТСЯ КВАДРАТИЧЕСКАЯ ОШИБКА ЄКСЦЕССА?

Квадратическая ошибка эксцесса

- определяется по формуле:

5.20 ЧТО СОБОЙ ПРЕДСТАВЛЯЮТ КРИВЫЕ РАСПРЕДЕЛЕНИЯ?

Теоретическая кривая распределения

- функция, описывающая закономерность соотношения вариантов и частот.

Плотность распределения:

где t – нормированные отклонения ,

- верхняя граница интервала

    1. В КАКИХ СЛУЧАЯХ ИСПОЛЬЗУЮТСЯ КРИТЕРИИ СОГЛАСИЯ?

-

Критерии согласия

для объективной оценки существенности отклонений теоретических и эмпирических частот ( f - )

Критерий согласия Пирсона ( 2) «хи - квадрат»

,

где f и - соответственно частоты эмпирического и теоретического распределений в і – ом интервале.

Рассчитанные значения сравниваются с табличными при соответствующем числе степеней свободы и заданном уровне значимости (а) (величина а принимается 0,05 или 0,01).

Если > , т.е. попадает в критическую область, то гипотеза о близости эмпирического распределения нормальному отвергается.

Если  , то это свидетельствует о близости эмпирического распределения нормальному.

    1. КАК ОЦЕНИТЬ БЛИЗОСТЬ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ КРИВОЙ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ?

-

Критерий

В.И. Романовского

определяется по формуле:

где k – число групп

Если данное отклонение больше 3, то расхождение частот эмпирического распределения и рассчитанных частот нормального распределения нельзя признать случайным и гипотезу о нормальном законе распределения следует отвергнуть.

Если <3, то возможно принять гипотезу о нормальном характере эмпирического распределения.