Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Отчёты по лабораторным Ларионова.docx
Скачиваний:
17
Добавлен:
28.09.2019
Размер:
1.12 Mб
Скачать

Задание 2. Расчет статистических характеристик

Цель: Получить описательную статистику числовых переменных.

Чтобы получить описательную статистику числовых переменных, определим следующие характеристики на основе результатов опроса респондентов о психическом состоянии для переменной alter (возраст): среднее значение, стандартную ошибку среднего значения, медиану, моду, стандартное отклонение, дисперсию, коэффициент асимметрии, эксцесс, размах, минимум и максимум. Результаты расчетов всех этих показателей отражены в таблице 5.3.

Среднее значение — это арифметическое среднее измеренных значений; оно определяется как сумма значений, деленная на их количество. Респонденты опроса о психическом состоянии и социальном положении имеют средний возраст 22,24 года.

Стандартная ошибка среднего значения определяется как стандартное отклонение, деленное на квадратный корень из объема выборки. Стандартная ошибка позволяет задать доверительный интервал для среднего значения. В диапазоне удвоенной стандартной ошибки по обе стороны от среднего значения с вероятностью примерно 95 % находится среднее значение генеральной совокупности. С вероятностью примерно 99 % она лежит в диапазоне утроенной стандартной ошибки. В нашем случае этот показатель составил 0,213.

Медиана — это точка на шкале измеренных значений, выше и ниже которой лежит по половине всех измеренных значений. Медиана составила 22, т.е. 22 года.

Мода — это значение, которое наиболее часто встречается в выборке. Оно составило 21 год.

Стандартное отклонение — это мера разброса измеренных величин; оно равно квадратному корню из дисперсии и равно 2,189.

Дисперсия — это квадрат стандартного отклонения и, следовательно, эта характеристика также является мерой разброса измеренных величин. Она определяется как сумма квадратов отклонений всех измеренных значений от их среднеарифметического значения, деленная на количество измерений минус 1. Таким образом, дисперсия равна 4,791.

Коэффициент асимметрии — это мера отклонения распределения частоты от симметричного распределения, то есть такого, у которого на одинаковом удалении от среднего значения по обе стороны выборки данных располагается одинаковое количество значений. В данном случае вершина асимметричного распределения сдвинута к меньшим значениям (0,235), это значит, что асимметрия положительна.

Коэффициент вариации или эксцесс указывает, является ли распределение пологим (при большом значении коэффициента) или крутым. Коэффициент вариации равен нулю, если наблюдения подчиняются нормальному распределению. Поэтому для проверки на нормальное распределение можно применять еще одно правило: Если коэффициент вариации незначительно отличается от нуля(1,042), и это значит, что данные взяты из нормально распределенной генеральной совокупности.

Размах — это разница между наибольшим значением (максимумом) и наименьшим значением (минимумом). Он составил 11.

Минимум - наименьшее значение, равное 1,т.е. возрасту, менее 18 лет.

Максимум - наибольшее значение, т.е.29 лет.

Таблица 5.3 – Результаты описательной статистики числовых переменных о возрасте респондентов на основе опроса о психическом состоянии

Alter

N

Валидные

106

Пропущенные

2

Среднее

22,24

Стд. ошибка среднего

,213

Медиана

22,00

Мода

21

Стд.отклонение

2,189

Дисперсия

4,791

Асимметрия

,859

Стд. ошибка асимметрии

,235

Эксцесс

1,042

Стд. ошибка эксцесса

,465

Размах

11

Минимум

18

Максимум

29

Сумма

2357

Процентили

25

21,00

50

22,00

75

23,00

Аналогично на основе данных о результатах опроса респондентов насчет продукции “Савушкин продукт”, а именно для переменной Возраст со следующими вариантами ответов:

1 – до 25;

2 – 25-35;

3 – 36-45;

4 – 46-55;

5 – более 56 была также получена описательная статистика необходимых переменных. Результаты расчетов показаны в таблице 5.4.

Таким образом, наибольшее количество респондентов – в возрасте до 25 лет (11,8%), 10,9% опрошенным – от 46 до 55 лет, 7,6% - в возрасте от 26 до 35 лет.

Среднее значение равно 2,66 или 35 – 36 лет. Точный показатель среднего возраста респондентов рассчитать не удалось, т.к. в качестве ответов предлагались определенные возрастные отрезки.

Стандартная ошибка среднего составила 0,19296. Это говорит о том, что среднее значение получилось достаточно точным.

Медиана составила 3,т.е. 36 – 45 лет.

Мода т.е. значение, которое наиболее часто встречается в выборке - 1 - возраст до 25 лет.

Стандартное отклонение - равно 1,36442, а дисперсия равна 1,862.

В данном случае вершина асимметричного распределения сдвинута к меньшим значениям (0,337), это значит, что асимметрия положительна.

Коэффициент вариации незначительно отличается от нуля и равен 1,104, что значит, что данные взяты из нормально распределенной генеральной совокупности.

Размах - составил 4, причем минимум равен 1,т.е. возрасту, менее 25 лет, а максимум - 5 – возраст более 55 лет.

Таблица 5.4 - Результаты описательной статистики числовых переменных о возрасте респондентов на основе опроса о “Савушкин продукт”