- •Тема 2 статистические распределения и их основные характеристики
- •1. Цель работы
- •2. Краткие теоретические сведения.
- •2.2. Показатели вариации
- •2.3. Показатели формы распределения
- •3. Вычисление основных статистических характеристик и изучение формы распределения в системе statistica
- •3.1. Вычисление основных статистических характеристик
- •3.2. Изучение формы распределения
- •3.3. Проверка гипотез о равенстве средних для нормальных распределений.
Тема 2 статистические распределения и их основные характеристики
1. Цель работы
Вычисление сводных статистических характеристик данных в системе Statistica. Изучение формы распределения данных. Оценка статистической значимости различий средних значений различных выборок с помощью средств системы Statistica.
2. Краткие теоретические сведения.
2.1. Средние величины
Общие черты, закономерности, присущие данной совокупности тенденции отражает, погашая влияние индивидуальных (случайных) факторов, средняя величина. Она является обобщающей характеристикой варьирующего признака качественно однородной совокупности.
Все виды средних величин, используемые в статистических исследованиях, подразделяются на 2 категории: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и т.д.) и структурные (мода, медиана).
Средняя арифметическая простая применяется в случаях, когда данные не сгруппированы.
(1)
(Если данные представлены в виде рядов распределения или группировок, то средняя исчисляется иначе).
Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия, находится "истинное" (неизвестное) среднее генеральной совокупности. Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p=0.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее генеральной совокупности. Ширина доверительного интервала зависит от объема или размера выборки, а также от разброса данных. Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки. Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. При увеличении объема выборки качество оценки улучшается и без предположения нормальности выборки.
Мода – величина признака, наиболее часто повторяющаяся в изучаемой совокупности
Медиана – варианта, расположенная в середине вариационного ряда. Если дискретный ряд распределения имеет нечетное число членов, то медианой будет варианта, находящаяся в середине вариационного ряда, если четное – медианой будет среднее из двух вариант, находящихся в середине ряда.
К структурным характеристикам переменной относятся также квартили.
Квартили. Нижняя квартиль переменной - это такое значение переменной, ниже которого попадают 25% значений переменной. Аналогично, верхняя квартиль - это такое значение переменной, ниже которого попадают 75% значений переменной.
Квартильный размах переменных равен разности значений верхней и нижней квартили. Таким образом, это тот диапазон вокруг медианы, который содержит 50% наблюдений.
2.2. Показатели вариации
Для характеристики совокупностей и исчисленных средних величин важно знать, какая вариация признака скрывается за средними. Для этого служат показатели вариации.
Размах вариации. Этот показатель прост в вычислении и указывает на общие размеры вариации, но он не дает представления о степени колеблемости внутри совокупности
R = xmax - xmin (2)
Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической. Дисперсия вычисляется по формуле:
(3)
Среднеквадратическое отклонение (стандартное отклонение) – это обобщающая характеристика абсолютных размеров вариации признака в совокупности.
(4)