Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР Стат 2.doc
Скачиваний:
1
Добавлен:
04.09.2019
Размер:
396.29 Кб
Скачать

Тема 2 статистические распределения и их основные характеристики

1. Цель работы

Вычисление сводных статистических характеристик данных в системе Statistica. Изучение формы распределения данных. Оценка статистической значимости различий средних значений различных выборок с помощью средств системы Statistica.

2. Краткие теоретические сведения.

2.1. Средние величины

Общие черты, закономерности, присущие данной совокупности тенденции отражает, погашая влияние индивидуальных (случайных) факторов, средняя величина. Она является обобщающей характеристикой варьирующего признака качественно однородной совокупности.

Все виды средних величин, используемые в статистических исследованиях, подразделяются на 2 категории: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и т.д.) и структурные (мода, медиана).

Средняя арифметическая простая применяется в случаях, когда данные не сгруппированы.

(1)

(Если данные представлены в виде рядов распределения или группировок, то средняя исчисляется иначе).

Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия, находится "истинное" (неизвестное) среднее генеральной совокупности. Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p=0.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее генеральной совокупности. Ширина доверительного интервала зависит от объема или размера выборки, а также от разброса данных. Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки. Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. При увеличении объема выборки качество оценки улучшается и без предположения нормальности выборки.

Мода – величина признака, наиболее часто повторяющаяся в изучаемой совокупности

Медиана – варианта, расположенная в середине вариационного ряда. Если дискретный ряд распределения имеет нечетное число членов, то медианой будет варианта, находящаяся в середине вариационного ряда, если четное – медианой будет среднее из двух вариант, находящихся в середине ряда.

К структурным характеристикам переменной относятся также квартили.

Квартили. Нижняя квартиль переменной - это такое значение переменной, ниже которого попадают 25% значений переменной. Аналогично, верхняя квартиль - это такое значение переменной, ниже которого попадают 75% значений переменной.

Квартильный размах переменных равен разности значений верхней и нижней квартили. Таким образом, это тот диапазон вокруг медианы, который содержит 50% наблюдений.

2.2. Показатели вариации

Для характеристики совокупностей и исчисленных средних величин важно знать, какая вариация признака скрывается за средними. Для этого служат показатели вариации.

Размах вариации. Этот показатель прост в вычислении и указывает на общие размеры вариации, но он не дает представления о степени колеблемости внутри совокупности

R = xmax - xmin (2)

Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической. Дисперсия  вычисляется по формуле:

(3)

Среднеквадратическое отклонение (стандартное отклонение) – это обобщающая характеристика абсолютных размеров вариации признака в совокупности.

(4)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]