Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
статистика.docx
Скачиваний:
45
Добавлен:
20.05.2015
Размер:
2.36 Mб
Скачать

23. Математические свойства дисперсии. Упрощенные способы расчета дисперсии

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):  ,,  среднее квадратическое отклонение (σ):(простое среднеквадратическое отклонение),(взвешенное среднеквадратическое отклонение).  Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности. Оно выражается в тех же единицах, что и признак.

Расчет дисперсии может быть упрощен. В случае равных интервалов в вариационном ряду распределения используется способ отсчета от условного нуля (способ моментов). Для его понимания необходимо знать следующие свойства дисперсии:  Свойство 1. Дисперсия постоянной величины равна нулю.  Свойство 2. Уменьшение всех значений признака на одну и ту же величину A не меняет величины дисперсии Значит, средний квадрат отклонений можно вычислить не по заданным значениям признака, а по отклонениям их от какого-либо постоянного числа.  Свойство 3. Уменьшение всех значений признака в K раз уменьшает дисперсию в K2 раз, а среднее квадратическое отклонение в K раз Значит, все значения признака можно разделить на какое-то постоянное число, например, на величину интервала ряда, исчислить среднее квадратическое отклонение, а затем умножить его на постоянное число: .  Свойство 4. Если вычислить средний квадрат отклонений от любой величины A, в той или иной степени отличающейся от средней арифметической (), то он всегда будет больше среднего квадрата отклонений, вычисленного от средней арифметической Средний квадрат отклонений при этом будет больше на величину ( – A)2 :  .  Значит, дисперсия от средней величины всегда меньше дисперсий, вычисленных от любых других величин, т.е. она имеет свойство минимальности.  На этих математических свойствах дисперсии основываются способы, которые позволяют упростить ее вычисление. Например, расчет дисперсии по способу моментов или способу отсчета от условного нуля применяется в вариационных рядах с равными интервалами. Расчет производится по формуле:  ,  где K – ширина интервала;  A – условный нуль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;– момент второго порядка.  Между средним линейным и средним квадратическим отклонениями существует примерное соотношениеесли фактическое распределение близко к нормальному.  В условиях нормального распределения существует следующая зависимость между величиной среднего квадратического отклонения и количеством наблюдений:  1) в пределах ± 1σ располагается 68,3 % количества наблюдений;  2) в пределах ± 2σ – 95,4 %;  3) в пределах ± 3σ – 99,7 %;  В действительности, на практике почти не встречаются отклонения, которые превышают ±3σ. Отклонение 3σ может считаться максимально возможным. Это положение называют «правилом трех сигм».

24 Дисперсия альтернативного признака.

21 Дисперсия альтернативного признака. Альтернативный признак – это признак, характеризующий обладание или не обладание чем-то ( см.п.1.2.). В статистике при изучении вариации альтернативных признаков наличия изучаемого признака обозначаются «1», а его отсутствие – «0». Доля единиц совокупности, обладающих изучаемым признаком – «p” , а не обладающих им “q”, следовательно, p + q = 1 Дисперсия альтернативного признака равна произведению доли на дополняющее эту долю до единицы число. Корень квадратный из этого показателя соответствует среднему квадратическому отклонению альтернативного признака. Показатели вариации альтернативных признаков широко используются в статистике, в частности при проектировании выборочного наблюдения, обработке данных социологических обследований, статистическом контроле качества продукции, в ряде других случаев.

25 Выборочное наблюдение, значение и условия применения.

22 Выборочное наблюдение, значение и условия применения. статистическое наблюдение, при котором исследованию подвергают не все элементы изучаемой совокупности (называемой при этом «генеральной»), а только некоторую, определённым образом отобранную их часть. Отобранная часть элементов совокупности (выборка) будет представлять всю совокупность с приемлемой точностью при двух условиях: она должна быть достаточно многочисленной, чтобы в ней могли проявиться закономерности, существующие в генеральной совокупности; элементы выборки должны быть отобраны объективно, независимо от воли исследователя, так чтобы каждый из них имел одинаковые шансы быть отобранным или же чтобы шансы эти были известны исследователю. Эти условия устанавливаются математической теорией выборочного метода. Она основана на ряде важнейших теорем теории вероятностей, составляющих так называемый закон больших чисел (см. Больших чисел закон). Лишь при соблюдении этих условий возникает объективная возможность оценить точность Выборочное наблюдение на основании самих выборочных данных. Точность Выборочное наблюдение измеряется с помощью средней ошибки выборки, величина которой прямо пропорциональна степени вариации изучаемых признаков и обратно пропорциональна объёму выборки. Выборочное наблюдение можно произвести быстрее сплошного, с меньшими затратами и получить результаты, по точности мало уступающие результатам сплошного наблюдения, а с учётом же возможности более тщательного наблюдения — даже нередко превосходящие их.

26 Ошибки выборочного наблюдения.

23 Ошибки выборочного наблюдения. Между признаками выборочной совокупности и признаками генеральной совокупности, как правило, существует некоторое расхождение, которое называют ошибкой статистического наблюдения. При массовом наблюдении ошибки неизбежны, но возникают они в результате действия различных причин. Величина возможной ошибки выборочного признака слагается из ошибок регистрации и ошибок репрезентативности. Ошибки регистрации, или технические ошибки, связаны с недостаточной квалификацией наблюдателей, неточностью подсчетов, несовершенством приборов и т. п. Под ошибкой репрезентативности (представительства) понимают расхождение между выборочной характеристикой и предполагаемой характеристикой генеральной совокупности. Ошибки репрезентативности бывают случайными и систематическими. Систематические ошибки связаны с нарушением установленных правил отбора. Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности . В результате первой причины выборка легко может оказаться смещенной, так как при отборе каждой единицы допускается ошибка, всегда направленная в одну и ту же сторону. Эта ошибка получила название ошибки смещения. Ее размер может превышать величину случайной ошибки. Особенность ошибки смещения состоит в том, что, представляя собой постоянную часть ошибки репрезентативности, она увеличивается с увеличением объема выборки. Случайная же ошибка с увеличением объема выборки уменьшается. Кроме того, величину случайной ошибки можно определить, тогда, как размер ошибки смещения непосредственно практически определить очень сложно, а иногда и невозможно. Поэтому важно знать причины, вызывающие ошибку смещения, и предусмотреть мероприятия по ее устранению.

27 Методы определения ошибки выборки для средней и для частости, при различных способах и методах отбора.

24 Методы определения ошибки выборки для средней и для частости, при различных способах и методах отбора. -Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности. Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.

28 Определение численности выборки.

25 Определение численности выборки. Определение необходимого объема выборки – это важная задача, с которой сталкивается исследователь, организующий выборочное наблюдение. При этом ему, как правило, известно: какие характеристики генеральной совокупности он хотел бы оценить, какую величину ошибки он считал бы несущественной, какой метод выбора данных он использует. Известно также расположение генеральной совокупности и часто (но не всегда) количество элементов в ней. Расчет численности выборки основывается на статистическом подходе обработки данных и за ним стоит множество вычислений, но для простоты, ниже мы представим формулу, следуя которой можно достичь хороших результатов.