- •Введение
- •Литература
- •Элементы теории вероятностей
- •Случайное событие и вероятность
- •Определение вероятности
- •Принцип практической невозможности маловероятных событий
- •Формулы комбинаторики
- •Условная вероятность
- •Независимые события
- •Свойства вероятности
- •Формула полной вероятности
- •Формула Байеса
- •Случайная величина
- •Свойства математического ожидания
- •Дисперсия дискретной с.В.
- •Свойства дисперсии
- •Закон больших чисел.
- •Функция распределения случайной величины
- •Свойства функции распределения
- •Односторонние и двухсторонние значения вероятностей
- •Нормальное распределение
- •Взаимосвязи случайных величин Парная корреляция
- •Элементы математической статистики
- •Генеральная и выборочная совокупность
- •Основные шкалы измерений
- •Точечные оценки параметров распределения
- •Проверка статистических гипотез
- •Исследование зависимости между двумя характеристиками
- •Лабораторная работа Задание 1. Нахождение выборочных характеристик
- •Задача 1.1.
- •Задача 1.2.
- •Задача 1.3.
- •Задача 1.4.
- •Задача 1.5.
- •Задача 1.6.
- •Задание 2 Построение гистограммы выборки
- •Задача 2.1
- •Задание 3 Проверка статистических гипотез
- •Одновыборочный критерий Стьюдента
- •Двухвыборочный критерий Стьюдента
- •Критерий согласия хи-квадрат
- •Задание 4. Интервальные оценки
- •Задача 4.1.
- •Задача 4.2.
- •Анализ значения коэффициента корреляции
- •Построение линий регрессии
- •Преподавателю и студенту было предложено расположить 15 профессий в порядке их восстребованности на рынке. В результате получилась следующая таблица:
- •Оглавление
Задача 4.2.
Построить 95%(второй вариант - 90%) доверительные интервалы для задач 1.1-1.6 задания 1.
Задание 5. Исследование статистической зависимости между двумя характеристиками
Анализ значения коэффициента корреляции
Задача 5.1. Проверить поведение коэффициента корреляции для данных, связанных зависимостью различного типа.
На рабочий лист (столбец В) перенести данные о росте 101 человека (Задача 1.1). Обозначим эти данные через . Продублировать данные столбца В в столбец С (обозначим эти данные через Y), D и E. Отсортировать данные столбца D по возрастанию (обозначим эти данные через Z), а данные столбца E (обозначим эти данные через R) - по убыванию. В столбце F вычислить квадраты соответствующих значений столбца В (обозначим эти данные через ).
Найти коэффициенты корреляции
между и ,
между и ,
между и ,
между и ,
между и
Сравнить найденные коэффициенты корреляции и объяснить полученные результаты
Построение линий регрессии
Задача 5.2.
По выборке из двумерного нормального распределения проверить гипотезу независимости компонент наблюдаемого случайного вектора (Х,У). Найти коэффициент корреляции и построить линии регрессии одного из признаков по другому признаку. Найти наилучший прогноз признака У при фиксированном Х=90
Х |
33 |
40 |
36 |
60 |
55 |
80 |
95 |
70 |
48 |
53 |
95 |
75 |
63 |
112 |
70 |
У |
13,8 |
13,8 |
14 |
22,5 |
24 |
28 |
32 |
20,9 |
22 |
21,5 |
32 |
35 |
24 |
37,9 |
27,5 |
Порядок вычислений
Перенести данные из таблицы на рабочий лист Excel, расположив их в двух столбцах A(данные столбца Х) и B(данные столбца У).
Упорядочить данные по столбцу Х
Посчитать средние значения, стандартные отклонения и число наблюдений для каждого признака (ниже в таблице приведены адреса ячеек, куда необходимо записать данные)
Вычислить коэффициент корреляции (ячейка G5). Использовать функцию
=КОРРЕЛ(диапазон данных для Х; диапазон данных для У)
Проверить значимость найденного коэффициента корреляции. Найти статистику Стьюдента для коэффициента корреляции ( , где - объем выборки, - коэффициент корреляции) и записать результат в ячейку G6 (Использовать функцию =КОРЕНЬ(F4-2)*G5/ КОРЕНЬ(1-G5*G5))
Вычислить критический уровень значимости для двусторонней альтернативы (коэффициент корреляции отличен от нуля) (ячейка G7). Использовать функцию =СТЬЮДРАСП(ABS(G6),F4-2,2). Последний аргумент – число хвостов для двусторонней альтернативы
Сделать вывод о значимости гипотезы независимости (равенства коэффициента корреляции нулю) (ячейка G8)
Вычислить коэффициенты регрессии Х на У (уравнение )
=G5*F3/G3 (ячейка F12, ) - коэффициент наклона прямой регрессии
=F2-F12*G2 (ячейка G12, ) - свободный член
Вычислить коэффициенты регрессии У на Х (уравнение )
=G5*G3/F3 (ячейка F13) - коэффициент наклона прямой регрессии
=G2-F13*F2 (ячейка G13) - свободный член
Используя прямую регрессии У на Х, вычислить прогноз признака У по значению признака Х=90
Построение графиков линии регрессии
В ячейках С2 и D2 вычислить значение функции регрессии (значение переменной У по значению переменной Х)
=$F$13*A2+$G$13 - регрессия У на Х (уравнение
)
=(A2-$G$12)/$F$12 - регрессия Х на У (уравнение
)
Скопировать ячейки С2 и D2 параллельно данным столбца А
Написать уравнения регрессии X на Y (ячейка F15)
Написать уравнение регрессии Y на X (ячейка F16)
Выделить данные в столбцах A,B,C,D и вызвать мастер построения диаграмм.
Выбрать тип диаграммы «Точечная диаграмма со значениями, соединенными сглаживающими линиями»
После двух нажатий кнопки «Далее» выбрать закладку «Легенда» и удалить из графика легенду
Нажать на кнопку «Готово»
Привести вид полученного графика в соответствие с приведенным выше стандартом:
Убрать маркеры линии регрессии
Написать наименование осей
Характеристика |
Адрес ячейки для Х |
Адрес ячейки для У |
Среднее значение |
F2 |
G2 |
Стандартное отклонение |
F3 |
G3 |
Число наблюдений |
F4 |
G4 |
Коэффициент корреляции |
|
G5 |
Преобразование Стьюдента |
|
G6 |
Уровень значимости |
|
G7 |
Гипотезу независимости следует |
принять/отвергнуть |
G8 |
|
|
|
Линии регрессии |
|
|
|
Коэффициент |
Своб. Член |
Х на У |
F12 |
G12 |
У на Х |
F13 |
G13 |
|
Уравнения регрессии |
|
Х на У |
|
|
У на Х |
|
|
При Х=90 прогноз значения У |
|
|
Ниже приводится иллюстрация результатов расчета и графика линий регрессии:
График линий регрессии
Задача 5.3.
Имеются данные по 15 регионам, связывающие капиталовложения в млн. рублей и количеством автотранспортных происшествий
Порядковый номер региона |
Капиталовложения в млн. руб |
Количество автотранспортных происшествий |
1 |
100 |
4480 |
2 |
98 |
4500 |
3 |
120 |
4290 |
4 |
125 |
4100 |
5 |
137 |
3400 |
6 |
128 |
3600 |
7 |
115 |
4430 |
8 |
132 |
4700 |
9 |
98 |
3700 |
10 |
147 |
4200 |
11 |
112 |
3730 |
12 |
89 |
3600 |
13 |
77 |
3500 |
14 |
120 |
4100 |
15 |
132 |
3820 |
Найти коэффициент корреляции и построить линии регрессии одного из признаков по другому признаку.
Задача 5.4.
Имеются данные по 15 студентам, связывающие количество пропущенных занятий в часах и средний балл, полученный студентом по итогам сессии
Порядковый номер студента |
Количество пропущенных занятий в часах |
Средний балл по всем предметам |
1 |
35 |
3,85 |
2 |
14 |
4,5 |
3 |
48 |
3,2 |
4 |
26 |
3,9 |
5 |
6 |
5 |
6 |
38 |
3,7 |
7 |
56 |
3 |
8 |
32 |
3,5 |
9 |
12 |
4 |
10 |
44 |
4 |
11 |
26 |
4,2 |
12 |
8 |
3,4 |
13 |
16 |
3,5 |
14 |
14 |
4,1 |
15 |
32 |
3,82 |
Найти коэффициент корреляции и построить линии регрессии одного из признаков по другому признаку.
Задача 5.5.