Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по статистике.docx
Скачиваний:
80
Добавлен:
13.03.2016
Размер:
824.25 Кб
Скачать

5.2 Характеристики вариационных рядов

Для проведения анализа вариационных рядов используются характеристики, которые делятся на следующие виды:

  • показатели центра распределения;

  • показатели вариации;

  • показатели формы распределения.

Показатели центра распределения.

К ним относятся средняя, мода и медиана.

Понятие и расчеты средних величин рассмотрено ранее в главе 4.

Мода – значение признака (варианта) наиболее часто встречающегося в изучаемой совокупности.

Медиана – значение признака (варианта), которое делит ряд пополам.

Рассмотрим определение моды и медиана в дискретном и интервально-вариационных рядах.

В дискретном ряду мода – это варианта, которая соответствует наибольшей частоте.

Медиана в дискретном ряду определяется следующим образом:

а) сначала определяется следующее соотношение - порядковый номер медианы:

б) далее рассчитываются накопленные частоты;

в) устанавливается первая накопленная частота, которая превышает половину объема ряда.

Пример 1. В одном из районов города было обследовано 100 семей. На основании обследования построен ряд распределения семей по количеству детей. Определить моду и медиану.

Таблица 5.1

Группа семей по числу детей, x

Число семей, m

Накопленные частоты

0

1

2

3

4

4

12

64

18

2

4

16

80

98

100

Итого

100

Наибольшая частота 64, ей соответствует значение варианты 2, значит, мода равна 2:

чел. детей

Вывод: большинство семей имеет 2 детей.

Для определения медианы определим накопленные частоты, их значения приведены в таблице 5.1.

Рассматривается соотношение:

Общее количество семей 100, следовательно, в середине ряда находится семья с порядковым номером 50,5. Первая накопленная частота, которая больше данного значения, равна 80 и соответствует варианте 2. Таким образом Ме=2 чел. Это означает, что половина семей имеет в своем составе до 2 детей, а половина – больше.

Расчет моды и медианы в интервально-вариационном ряду производится по формуле:

Мода определяется как:

где - нижняя граница модального интервала;

i – величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

–частота интервала, последующего за модальным.

Формула для определения медианы следующая:

где - нижняя граница модального интервала;

i – величина модального интервала;

- сумма частот до медианного интервала;

–частота медиального интервала.

Показатели вариации.

При изучении вариационных рядов рассчитываются показатели, характеризующие размер и интенсивность вариации.

Для характеристики размера вариации рассчитываются абсолютные показатели вариации:

  • размах вариации;

  • среднее линейное отклонение;

  • среднее квадратическое отклонение;

  • дисперсия.

Размах вариации определяется по формуле:

где - максимальное и минимальное значение признака в

совокупности.

Среднее линейное отклонение рассчитывается как:

Для определения среднего квадратического отклонения используется формула:

Данный показатель характеризует, насколько в среднем значения признака отклоняются от средней величины.

Дисперсия – это квадрат среднего квадратического отклонения:

Все рассмотренные показатели, исключая дисперсию измеряются в тех же единицах, что и варианта. Дисперсия единицы измерения не имеет.

Для оценки интенсивности вариации используется относительный показатель – коэффициент вариации, рассчитываемый по формуле:

Он показывает, во-первых, на сколько процентов в среднем значения признака отклоняются от среднего, а во-вторых, характеризует степень однородности совокупности.

Если коэффициент вариации 33%, то означает, что совокупность однородная, а средняя типична для данной совокупности, и ее можно использовать в дальнейших расчетах. В случае, если коэффициент получается33%, необходимо изучаемую совокупность разделить на группы и в каждой группе рассчитать свою среднюю.

Показатели асимметрии.

Асимметрия и эксцесс являются характеристиками формы распределения.

В практике статистического исследования приходится встречаться с различными распределениями. Идеальным (нормальным) распределением является такое, у которого распределение признака в совокупности симметричное, при этом мода и средняя совпадают.

Однако чаще всего встречается асимметрическое распределение. При правосторонней асимметрии, средняя арифметическая больше моды, а при левосторонней, наоборот.

Для оценки степени асимметричности применяют моментный и структурный коэффициент асимметрии.

Моментный коэффициент асимметрии определяется по формуле:

где - центральный момент третьего порядка. Определяется по

формуле:

Структурные показатели асимметрии характеризуют асимметричность только в центральной части распределения, т.е. основной массы единиц.

Наиболее часто применяют структурный коэффициент асимметрии, который определяется по формуле:

Если , асимметрия правосторонняя, если, асимметрия левосторонняя.

Формы распределения признаков в совокупности приведены на рис. 5.4.

левостороннее распределение

Рис. 5.4. Формы распределения признаков в совокупности

Другим свойством рядов распределения является эксцесс. Под эксцессом понимают островершинность или плосковершиннсоть распределения по сравнению с нормальным распределением, т. е. эксцесс – это отклонение вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.

Эксцесс оценивается с помощью показателя, представлено формулой:

где - центральный момент 4-го порядка, который определяется по

формуле:

Распределение островершинное обладает положительным эксцессом (, а плосковершинное – отрицательным эксцессом

На рис. 5.5 представлено нормальное, островершинное и плосковершинное распределение.

m

m

2

1

1

3

x

x

1 – нормальное распределение

2 – островершинное распределение

3 – плосковершинное распределение

Рис. 5.5. Формы распределения вариационного ряда

Пример 2. Для определения средней продолжительности представленных междугородних разговоров проведено выборочное наблюдение, в выборку попало 340 разговоров. Распределение этих разговоров по продолжительности представлено в виде вариационного ряда в таблице 5.1. Определить основные характеристики вариационного ряда. Ряд изобразить графически в виде гистограммы.

Таблица 5.2

Группа телефон-ных разговоров по продол-

житель-ности

(мин.)

Коли-

чество разгово-

ров m

Середина интервала x

xm

Накоплен-

ные частоты

До 3

3-5

5-7

7-9

9-11

11-13

Более 13

40

45

102

78

41

20

14

2

4

6

8

10

12

14

80

180

612

624

410

240

196

40

85

187

265

306

326

340

921,6

352,8

65,28

112,3

419,8

540,8

725,7

212,33

2766

41,8

161,7

4297

14623

37623

Итого

340

2342

80745,9

Решение:

1. Определяется средняя продолжительность междугородних разговоров:

2. Рассчитывается мода, при этом модальный интервал 5-7:

Это означает, что большинство разговоров имеет продолжительность 6,4 мин.

3. Определяется медиана, для этого определяются накопленные частоты.

Сначала находится следующее соотношение:

Сравнивая его с накопленными частотами, можно сказать, медиальный интервал будет равен 5-7 мин.

Медиана равна:

Таким образом, половина разговоров имеет продолжительность до 6,6 мин., а половина больше.

4. Размах колебаний будет равен:

при этом первый и последний интервал закрываются.

5. Среднее квадратическое отклонение составит:

6. Коэффициент вариации:

В среднем продолжительность каждого разговора отклоняется от среднего значения на 3 мин. или на 44%. Совокупность не однородная, так как 33%, а средняя не типична для данной совокупности.

7. Коэффициент асимметрии:

Так как , это означает, что распределения имеют форму правосторонней асимметрии.

Рассчитывается эксцесс, но сначала определяется момент 4-го порядка:

9. Эксцесс будет равен:

Это означает, что распределение плосковершинное. Графическое изображение ряда представлено на рис. 5.6.

m

10

50

x

5

10

15

Мо

Рис. 5.6. Гистограмма распределения телефонных разговоров по продолжительности