Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика Астахов.doc
Скачиваний:
20
Добавлен:
05.02.2016
Размер:
3.44 Mб
Скачать
                1. Тема 13

ОБОБЩАЮЩИЕ ПОКАЗАТЕЛИ ВАРИАЦИИ

После изучения этой темы вы сможете:

  1. обосновать показатели вариации, их значение, содер­жание и методику расчета;

  2. раскрыть значение и дисперсии, правило их сложе­ния;

  3. иметь представление о законах вариации и распределения;

  4. провести сравнительную оценку эмпирического и нормального рас­пределений на предмет их близости и характера расхождений.

Итак, мы познакомились с вариационными рядами распределения. Такие ряды показывают вариацию изучаемых явлений по определенному признаку, однако они не дают обобщающей ее характери­стики. Обобщающими показателями являются средние величины, но они нивелируют индивидуальные значения варьирующего признака и различия между ними. А именно они часто и представляют большой интерес с точки зрения наиболее полного раскрытия структуры и общего анализа изучаемой совокупности. Обобщающие показатели ва­риации разработаны, они могут быть подсчитаны и по вариационному ряду, и по первичному ряду - непосредственно по конкретным исходным данным или ранжированному ряду.

Рекомендуется пять таких обобщаю­щих показателей: размах вариации (R), среднее линейное, или абсолют­ное, отклонение (L), среднее квадратическое отклонение (), коэффици­ент вариации (V), дисперсия (), ассиметрия (AS), эксцесс (EX).

Важное значение этих показателей можно свести к тому, что они:

1. дополняют средние величины, за которыми скрываются индивиду­альные различия;

2. характеризуют степень однородности статистической совокупности по взятому признаку;

3. определяют границы вариации признака;

4. характеризуют взаимосвязь между признаками.

Размах вариации - абсолютная величина разности между макси­мальным и минимальным значениями (вариантами) взятого признака:

Он характеризует пределы изменения варьирующего признака и все­цело зависит от колебаний только двух крайних вариантов. Он совершенно не связан с частотами в вариационном ряду, т.е. с характером распре­деления, что может придать ему неустойчивый, случайный характер, тем не менее, размах вариации может сказать о многом, любое явление имеет свои пределы варьирования, максимальные значения - человек в 3 метра ростом, собака в 150 кг. или предприятие с доходом 0, 5 руб. в год говорят скорее всего об элементарной ошибке или о ненормальности явления.

3адание:

Что бы Вы предложили для более надежной характеристики размаха вариации? Приведите расчетный пример.

Более надежным показателем здесь может быть средний размах, ис­численный как средняя арифметическая из ряда размахов, полученных в результате равных серий наблюдений.

Среднее линейное отклонение представляет собой среднюю ариф­метическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической, при этом разности берутся по модулю, т.е. без учета знаков. Формулы следующие:

а) для первичного ряда б) для вариационного ряда

Этот показатель уже не зависит от случайных колебаний вариантов, учитывает всю сумму отклонений конкретных вариантов от среднего по­казателя. Показатель L - число именованное; его размерность соответст­вует размерности варьирующего признака.

Среднее квадратическое отклонение равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической:

а) для первичного ряда б) для вариационного ряда

Это отклонение является общепри­нятым показателем вариации, в самых различных областях науки и практики. При его определе­нии в расчет принимаются все отклонения значений варьирующего при­знака от среднего. Это также величина именованная. Среднее квадратическое отклонение, как и среднее линейное, показывает, на сколько в сред­нем отклоняются конкретные варианты от среднего их значения, но а более чутко реагирует на вариацию, и оно всегда больше среднего линей­ного отклонения. Зная его, можно по известному показателю определять неизвестный. Для альтернативных признаков формула среднего квадратического отклонения следующая где р - доля единиц в совокупно­сти, обладающих определенным признаком; q- доля единиц, не обла­дающих этим признаком.

Коэффициент вариации является уже относительным показателем и применяется для сравнения вариации разных признаков. В нем именован­ный показатель вариации (среднее линейное или среднее квадратическое отклонение) соотносится со средней арифметической или заменяющей ее величиной (например, модой). Но обычно это , или чаще Исчисленный по среднему линейному отклонению показатель называют линейным коэффициентом вариации. В количественном отношении коэффициент V представляет собой своеобразную долю сред­него отклонения в средней арифметической величине и выражается в процентах. Его универсальность проявляется в том, что он устраняет не­сопоставимость различных единиц измерения признака и различных ве­личин средних арифметических. Коэффициент вариации очень широко применяется в экономических исследованиях особенно в анализе хозяйственной деятельности и эконометрике. Причем для различных типичных экономических процессов существуют принятые «нормальные» коэффициенты вариации.

Задание:

Вам предлагается дать более развернутую сравнительную характери­стику рассмотренных обобщающих показателей вариации и их применение в практике вашего предприятия или образцов вашего статистического наблюдение.

Среди обобщающих показателей вариации особое место в статистике занимает дисперсия. Дисперсия - средний квадрат отклонений индивидуальных значений признака от средней арифметической:

Несмотря на прямую связь со средним квадратическим отклонением, дисперсия имеет самостоятельное значение. Для ее исчисления удобно пользоваться следующей формулой:

Если дисперсия взвешивается (подсчитывается по частотам), то при­меняется формула

Дисперсия альтернативного признака равна: σ2 = pq. Предельное ее значение равно 0,25, оно получается при р = 0,5.

Выделяют дисперсию общую, внутригрупповую и межгрупповую. Общая дисперсия 2) характеризует вариацию признака под влиянием всех факторов, вызвавших эту вариацию (формула ее приводилась выше). Внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:

где - групповая средняя, , - число единиц в группе.

Средняя из внутригрупповых дисперсий Заметим, что эта средняя отражает случайную вариацию, т.е. ту часть вариации, кото­рая происходила под влиянием всех прочих факторов, за исключением фактора группировки.

Межгрупповая дисперсия, или дисперсия групповых средних вокруг общей средней, измеряет вариацию изучаемого признака под влиянием признака-фактора (группировочного признака) и подсчитывается по формуле:

где х, и n, - средние и численности по отдельным группам.

Математическая статистика доказывает, что между общей дисперси­ей, средней из внутригрупповых дисперсий и межгрупповой существует такая связь:

т.е. общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии. Это правило (закон) сложения дисперсий, логика которого проста: общая дисперсия, возникающая под влиянием всех факторов, должна быть равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет фак­тора группировки. Зная любые два вида дисперсий, всегда можно найти или проверить правильность расчета третьего вида дисперсии.

Изучение вариации имеет особый смысл в пределах однородной группы (за ними следуют уже качественные изменения). Известное значе­ние имеет также изучение случайной вариации. Бельгийский статистик А. Кетле обнаружил, что вариация некоторых массовых явлений подчиня­ется закону распределения ошибок (открыт К. Гауссом и П. Лапласом), или закону нормального распределения (термин К. Пирсона). Кривая, отобра­жающая это распределение, имеет вид колокола, и она симметрична. Оче­видно и равенство здесь средней арифметической, моды и медианы между собой. Колеблемость индивидуальных значений признака находится в пределах х±3ст (точнее, в этих пределах лежат 997 единиц из 1000, или 99,7% всех единиц совокупности). Это закон вариации индивидуальных значений признака или "правило трех сигм". Правда, в быстроизменяющихся общественных явлениях нормальное распределение в чистом виде встречается крайне редко, но исследовать явление на нормальность целесообразно. Кроме того многие распределения можно условно разбить а несколько нормальных.

Выведен и другой закон - закон ва­риации средних величин, по которому вариация этих величин меньше ва­риации индивидуальных значений признака. Средние значения признака изменяются в пределах

где п - число единиц.

Для анализа эмпирического распределения и выяснения того, в какой мере оно обусловлено действием внутренних причин, производится вы­равнивание фактического распределения признака по кривой нормального распределения. При этом используется то обстоятельство, что нормальное распределение полностью определяется двумя параметрами. Вначале по фактическому распределению вычисляются нормированные отклонения

.

Затем находятся соответствующие им теоретические частоты нормального распределения (они определяются по спе­циальным таблицам), которые и сравниваются с эмпирическими частотами. По сумме их различий можно судить о степени близости эмпириче­ского распределения к теоретическому. Для объективного суждения о степени их близости (соответствия) используется ряд особых критериев, называемых критериями согласия или соответствия. К ним относятся критерии Пирсона, Ястремского, Романовского, Колмогорова (они доста­точно подробно излагаются в учебниках по математической статистики).

Так, критерий Пирсона (% ) вычисляется по формуле:

где fэ и fT — эмпирические и теоретические частоты соответственно. С помощью х2 по специальным таблицам определяется вероятность т\у}).

Критерии согласия дают общую оценку степени близости эмпириче­ского распределения к теоретическому, однако не содержат информации о характере расхождений между ними. Поэтому в анализе вариационных рядов применяются также специальные показатели, позволяющие охарак­теризовать эти расхождения. Речь идет о коэффициентах асимметрии и эксцесса. С их помощью определяются направление и величина смещения (скошенности влево или вправо) и "крутости" или плотности значения признака вокруг значения средних фактического распределе­ния, построенного по эмпирическим данным, по отношению к оси сим­метрии нормального распределения. Коэффициент асимметрии а) называется стандартизованным моментом третьего порядка.

где куб среднего квадратического отклонения.

Этот коэффициент имеет безразмерный характер, что и позволяет ис­пользовать его для сопоставления различных распределений. Если нор­мальное распределение характеризуется, как уже отмечалось, равенством средней арифметической, моды и медианы, то в эмпирическом эти вели­чины обычно разнятся между собой. При левосторонней асимметрии Мо> Me > Xсредняя при правостороннейобратные соотношения. Это позво­ляет применять более простой показатель асимметрии, который называется коэффициентом К. Пирсона.

При левосторонней асимметрии эти показатели отрицательны, при правосторонней - положительны.

Анализ вариационного ряда предусматривает также определение экс­цесса (Ех), т.е. степени "крутости" эмпирического распределения по отно­шению к нормальному. В качестве характеристики эксцесса используется центральный момент четвертого порядка µ4, равный Показателъ Ех определется по формуле:

Его количественное значение положительно при островершинности изучаемого распределения по отношению к нормальному то есть это указывает на наличие слабоварьирующего по данному признаку ядра, при отрицательном значении такого ядра нет, а распределение считается плосковершинным.

Степень существенности асимметрии и эксцесса можно оценить с помощью среднего квадратического отклонения ошибки асимметрии и эксцесса.

Средняя квадратическая ошибка коэффициента асимметрии зависит от числа единиц совокупности – n

σas = 6(n-1)/(n+1)(n+3)      

Если отношение коэффициента асимметрии взятого по модулю делеленное на среднеквадратическую ошибку асимметрии больше трех - асимметрия существенна и показатели вариации сомнительны.

Аналогично анализируется эксцесс.

Средняя квадратическая ошибка коэффициента эксцесса зависит от числа единиц совокупности – n

σех = 24(n-2)(n-3)/(n-1)(n+3)(n+5)      

Если отношение коэффициента эксцесса взятого по модулю деленное на среднеквадратическую ошибку эксцесса больше трех – эксцесс существенен и показатели вариации сомнительны.

При использовании компьютера расчет показателей вариации удобно осуществлять при помощи специальных статистических пакетов таких как Stadia, Statistika и ряда других. Кроме того у любого пользователя имеющего компьютер работающий с операционной системой Windows наверняка установлен MS EXCEL, а у пользователей Linux Offiсe Open имеющие широкие возможности для статистической обработки с использованием стандартных функций. Для обработки вариационного ряда достаточно вызвать мастер функций, выбрать функции статистические и в меню вы найдете всё необходимое для расчета показателей вариации.

В частности СТАНДОТКЛОН - считает стандартное отклонение, СТАНДОТКЛОНА – учитывает логические и текстовые значения при расчете стандартного отклонения, ДИСП – рассчитывает дисперсию по выборке, ДИСПА – рассчитывает дисперсию с учетом текстовых и логических значений в выборке, ДИСПР – вычисляют дисперсию по генеральной совокупности, ДИСПРА – вычисляет дисперсию с учетом текстовых и логических значений в генеральной совокупности и так далее. Единственное, что нужно учесть так это странности перевода, так например, расчет асимметрии переведен как функция под названием «скос». Видимо переводчики посчитали, что слово асимметрия непонятно русскоязычному населению и выбрали очень старинное исконно русское слово – скос. Получилось смешно, но надо сказать, образно.

Второй метод быстрого получения необходимой информации связан с приложением к MS EXCEL, который называется «Пакет анализа». Активизируется он выполнением команд Сервис – Надстройки – Описательная статистика. После чего под значком Сервис в главном меню появляется команда «анализ данных». Выполнив эту команду вы можете получить за несколько секунд развернутую информацию почти по всем показателям вариации.

Диалоговое окно описательной статистики будет выглядеть так

Рисунок 12

А результат анализа вариации численности населения по данным переписи населения 2002 года по группам населения с интервалом в пять лет будет иметь следующий вид:

Таблица 4

Столбец1

Среднее

8058

Стандартная ошибка

843,1564

Медиана

8909,5

Мода

#Н/Д

Стандартное отклонение

3577,21

Дисперсия выборки

12796430

Эксцесс

-0,62137

Асимметричность

-0,56216

Интервал

11709

Минимум

1091

Максимум

12800

Сумма

145044

Счет

18

Наибольший(1)

12800

Наименьший(1)

1091

Уровень надежности(95,0%)

1778,905

При этом гистограмма будет выглядеть так:

График 8

Где ряд 1 численность населения в тысячах человек (шкала ординат).

Единственно, что здесь отсутствует это коэффициент вариации, но его можно легко рассчитать в любой клетке электронной таблицы так же как существенность ассиметрии и эксцесса..

3адание:

Для проверки усвоенного материала Вам предлагается написать формулы асимметрии, средней гармонической взвешенной, межгрупповой дисперсии, медианы, среднего линейного отклонения, со­отношения средней арифметической, моды и медианы при правосторон­ней асимметрии.

Контрольное задание:

В рамках выполняемого Вами Контрольного задания из Темы 5 на примере вариационного ряда распределения рабочих по часовой выработ­ке и данных самого Контрольного задания рассчитайте обобщающие показатели вариации, включая дисперсии, и приведите не­обходимые комментарии. Сделайте выводы о нормальности распределения рабочих по часовой выработке.

Контрольное задание:

Проанализируйте вариацию численности населения по данным анализа и гистограммы.