- •Тема 1. Предмет и метод статитстики.
- •Тема 2. Статистическое наблюдение
- •Виды сн
- •Тема 3. Сводка и группировка статистических данных. Статистические таблицы
- •Тема 4. Статистические показатели
- •Тема 5. Анализ рядов распределения
- •5.3 Что называется модой в статистике?
- •Тема 6. Выборочный метод
- •Тема 7. Статистическая проверка гипотез
- •Тема 8. Анализ таблиц взаимной сопряженности
- •Тема 9. Статистические методы анализа корреляционных связей
- •Тема 10. Анализ интенсивности динамики
- •Тема 11. Анализ тенденций развития
- •Тема 12. Индексы
- •Тема 13. Графический метод
Тема 5. Анализ рядов распределения
Разделы темы:
Основные характеристики закономерностей распределения. Расчет показателя центра распределения
Измерение и оценка вариации
Способы расчета дисперсии
Характеристики форм распределения
ЧТО ОТНОСИТСЯ К ОСНОВНЫМ ХАРАКТЕРИСТИКАМ ЗАКОНОМЕРНОСТЕЙ РАСПРЕДЕЛЕНИЯ?
-
Характеристика распределения
- вариация;
- форма распределения.
5.2 ЧТО ОТНОСИТСЯ К ПОКАЗАТЕЛЯМ ЦЕНТРА РАСПРЕДЕЛЕНИЯ?
-
Показатели центра распределения
- мода;
- медиана;
- квартили;
- децили.
5.3 Что называется модой в статистике?
-
Мода в статистике
-
Мода в дискретном вариационном ряду
Пример 5.1
По данным примера 4.7 модой будет являться выработка, равная 20 деталям, т.к. трое рабочих из десяти имели этот показатель.
-
Мода в интервальном вариационном ряду
ряду
где – нижняя граница модального интервала
h – ширина модального интервала;
– соответственно частота модального, предмодального и послемодального интервалов.
Пример 5.2
По данным примера 4.9
Мо = 100 + 50*(20-10)/((20-10)+(20-17)) = 100 + 500/13 = 138,46 млн.грн.
Вывод: В данной группе заводов наиболее часто встречается объем товарной продукции в размере 138.46 млн.грн.
5.4 ЧТО НАЗЫВАЕТСЯ МЕДИАНОЙ В СТАТИСТИКЕ?
-
Медиана в статистике
-
Медиана в дискретном вариационном ряду
, если f – четное число.
Пример 5.3
По данным примера 4.7 медианой будет являться значение пятой варианты (10/2=5), т.е. выработка равная 21 детали.
Медиана в интервальном вариационном
ряду
-определяется по формукле:
,
где XМе – нижняя граница медианного интервала
h – ширина медианного интервала
- численность ряда, сумма частот;
Sme – частота, накопленная до медианного интервала;
fme - частота медианного интервала.
Пример 5.4
По данным примера 4.9 (табл. 4.4) медианным интервалом будет товарная продукция в пределах 100-150 млн.грн, т.к. судя по кумулятивным (накопленным) частотам 28-я варианта ((55+1) / 2 = 28) попадает именно в этот интервал.
млн.грн.
Вывод: половина предприятий выпускает товарной продукции на сумму менее 136.25 крб., а половина – более 136.25 млн.грн.
5.5 ЧТО ПРЕДСТАВЛЯЮТ СОБОЙ КВАРТИЛИ И ДЕЦИЛИ В СТАТИСТИКЕ?
-
Квартиль
-
Децили
Нижний (первый) квартиль
Верхний (третий) квартиль
где – нижние границы соответствующих квартилей:
h – величина интервала;
, – накопленные частоты интервалов, предшествующих квартильным;
f – частоты соответствующих квартильных интервалов.
Вторым квартилем является медиана.
Пример 5.5
По данным примера 4.8 (табл 4.4)
млн.грн.
млн.грн.
Вывод: 25 % предприятий производят товарной продукции на сумму менее 101,87 млн. грн., а 75 % - более 101,87 млн. грн. 75 % предприятий производят товарной продукции на сумму менее 174,26 млн.грн., а 25 % - более 174,26 млн.грн.
ЧТО ПРЕДСТАВЛЯЕТ СОБОЙ ВАРИАЦИЯ И КАКОВА ЗАДАЧА СТАТИСТИЧЕСКОГО ИЗУЧЕНИЯ ВАРИАЦИИ?
-
Вариация
Обусловлена действием большого количества взаимосвязанных причин, среди которых есть:
-
Задача статического изучения вариации
КАКИЕ ПОКАЗАТЕЛИ ВАРИАЦИИ РАЗЛИЧАЮТ В СТАТИСТИКЕ?
-
Показатели вариации
- среднее линейное отклонение;
- дисперсия;
- среднее квадратическое отклонение;
- коэффициенты вариации;
В ЧЕМ ЗАКЛЮЧАЕТСЯ СУЩНОСТЬ РАЗМАХА ВАРИАЦИИ
-
Размах вариации (R)
- ширина рассеяния;
- разность между экстремальными значениями вариационного ряда.
R = Xmax – Xmin
По данным примера табл 4.2 размах вариации равен 8 деталей ( 28 – 20 = 8).
–
Достоинство R
-
Недостатки R
-- на его величину оказывает влияние случайность;
- не учитывает частоты в вариационном ряду;
- отсутствует связь со средней величиной.
ЧТО ПРЕДСТАВЛЯЕТ СОБОЙ СРЕДНЕЕ ЛИНЕЙНОЕ ОТКЛОНЕНИЕ
-
Среднее линейное отклонение (Л)
а
Формы среднего линейного отклонения
б) невзвешенное
ЧТО ТАКОЕ ДИСПЕРСИЯ
-
Дисперсия
а
Формы дисперсии
Среднеквадратическое отклонение
-
ЧТО ПРЕДСТАВЛЯЕТ СОБОЙ КОЭФФИЦИЕНТ ВАРИАЦИИ?
-
Коэффициент вариации
КАК РАССЧИТЫВАЮТСЯ КОЭФФИЦИЕНТЫ ВАРИАЦИИ?
-
Формулы для расчета
КАКАЯ СУЩЕСТВУЕТ ВЗАИМОСВЯЗЬ МЕЖДУ ПОКАЗАТЕЛЯМИ ВАРИАЦИЯМИ?
1
Нормальное распределение или близкое
к нему
Л=0.8
СПОСОБЫ РАСЧЕТА ДИСПЕРСИИ
1. Варианты небольшие и число случаев незначительно.
Дисперсия равна разности между средней квадратов вариантов и квадратом их средней.
Пример 5.6
По данным таблицы 6.2 рассчитать дисперсию
Выработка (х) |
Число рабочих (f) |
xf |
x2f |
20 21 24 26 28 |
3 2 2 2 1 |
60 42 48 52 28 |
1200 882 1152 1352 784 |
Итого: |
10 |
230 |
5370 |
- средняя выработка:
- средняя квадратов вариантов:
- дисперсия:
Вывод: Средний квадрат отклонений выработки от ее средней величины равен 8.
2. Способ моментов, основанный на отсчете от условного нуля;
Пример 6.2
Используя данные примера 4.9 (табл. 4.4) рассчитать дисперсию
Товарная продукция |
Число заводов f |
X |
|
|
|
До 50 50-100 100-150 150-200 200-250 |
3 10 20 17 5 |
25 75 125 175 225 |
-2 -1 0 1 2 |
-6 -10 0 17 10 |
12 10 0 17 20 |
Итого: |
55 |
|
|
11 |
59 |
3. Дисперсия альтернативного признака - это произведение частей, отражающих структуру совокупности.
- доля единиц, обладающая данным признаком.
КАКИЕ БЫВАЮТ ФОРМЫ РАСПРЕДЕЛЕНИЯ?
-
Формы распределения
КАКИЕ БЫВАЮТ ВИДЫ ОДНОВЕРШИННЫХ РАСПРЕДЕЛЕНИЙ?
1
Виды одновершинных распределений
4) плосковершинные.
-
Симметричное распределение
-
Асимметричное распределение
As = 0 – нормальное распределение
As > 0 – правостороннее распределение со смещением влево
As < 0 – левостороннее распределение со смещением вправо
Вид распределения определяется на основе момента распределения
Момент распределения
- это средняя арифметическая К-й степени отклонений(х-А)к А – величина, от которой определяют отклонения
При - получаем центральные моменты.
Центральный момент 1-го порядка (М1)
Центральный момент 2-го порядка (М2)
- это средний квадрат отклонений значений признака от средней; - характеризует дисперсию (М2= 2)
-
Центральный момент 3-го порядка (М3)
-
Центральный момент 4-го порядка (М4)
Коэффициент асимметрии (Аs)
КАК ОПРЕДЕЛЯЕТСЯ СУЩЕСТВЕННОСТЬ АСИММЕТРИИ?
-
Оценка степени существенности асимметрии
Если отношение , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным.
Если , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных факторов.
ЧТО ХАРАКТЕРИЗУЕТ И КАК ОПРЕДЕЛЯЕТСЯ КОЭФФИЦИЕНТ ЭКСЦЕССА?
Коэффициент эксцесса (Ех)
- характеризует выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.
Определяется по формуле:
Если Ех =3 – нормальное распределение Ех >3 – островершинное распределение Ех < 3 – плосковершинное распределение
КАК ОПРЕДЕЛЯЕТСЯ КВАДРАТИЧЕСКАЯ ОШИБКА ЄКСЦЕССА?
Квадратическая ошибка эксцесса
- определяется по формуле:
5.20 ЧТО СОБОЙ ПРЕДСТАВЛЯЮТ КРИВЫЕ РАСПРЕДЕЛЕНИЯ?
Теоретическая кривая распределения
- функция, описывающая закономерность соотношения вариантов и частот.
Плотность распределения:
где t – нормированные отклонения ,
- верхняя граница интервала
В КАКИХ СЛУЧАЯХ ИСПОЛЬЗУЮТСЯ КРИТЕРИИ СОГЛАСИЯ?
-
Критерии согласия
Критерий согласия Пирсона (
2)
«хи - квадрат»
,
где f и - соответственно частоты эмпирического и теоретического распределений в і – ом интервале.
Рассчитанные значения сравниваются с табличными при соответствующем числе степеней свободы и заданном уровне значимости (а) (величина а принимается 0,05 или 0,01).
Если > , т.е. попадает в критическую область, то гипотеза о близости эмпирического распределения нормальному отвергается.
Если , то это свидетельствует о близости эмпирического распределения нормальному.
КАК ОЦЕНИТЬ БЛИЗОСТЬ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ КРИВОЙ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ?
-
Критерий
В.И. Романовского
где k – число групп
Если данное отклонение больше 3, то расхождение частот эмпирического распределения и рассчитанных частот нормального распределения нельзя признать случайным и гипотезу о нормальном законе распределения следует отвергнуть.
Если <3, то возможно принять гипотезу о нормальном характере эмпирического распределения.