Контрольная работа по многомерным статистическим методам
Номер варианта N – порядок в журнале.
1. Проверить 5 массивов данных на наличие грубых ошибок.
Каждый массив данных представляет собой значения некоторого признака для 15 наблюдений.
Для своего варианта добавить N к каждому числу в массивах.
Массив 1 |
Массив 2 |
Массив 3 |
Массив 4 |
Массив 5 |
7,81 |
53,12 |
49 |
103,85 |
-0,4 |
7,77 |
55,65 |
1 |
103,91 |
0,4 |
4,17 |
0,67 |
3 |
104,29 |
1,17 |
6,01 |
56,87 |
1 |
104,53 |
1,1 |
7,61 |
53,81 |
1 |
104,54 |
3,46 |
4,2 |
52,36 |
7 |
105,27 |
1,64 |
9,18 |
56,43 |
3 |
105,47 |
0,38 |
6,96 |
54,04 |
2 |
105,61 |
0,64 |
7,59 |
52,16 |
4 |
1945,54 |
-2,61 |
9,83 |
55,92 |
57 |
107,03 |
-1,32 |
4,33 |
51,54 |
2 |
107,23 |
0,24 |
9,63 |
54,62 |
1 |
107,25 |
2,15 |
4,77 |
54,04 |
1 |
107,3 |
1,23 |
853 |
53,45 |
1 |
107,63 |
-1,42 |
5,66 |
56,29 |
2 |
107,91 |
1,9 |
2. Провести корреляционный анализ данных из массивов п.1, скорректированных следующим образом:
В случае обнаружения грубой ошибки в каком-либо из массивов удаляется вся строка, содержащая эту грубую ошибку.
Например: грубая ошибка – наблюдение №10 в исходном массиве 2. Тогда из всех массивов удаляются наблюдения №10, т.е. полностью удаляется 10-ая строка.
Все скорректированные массивы должны содержать одинаковое число наблюдений.
3. Провести регрессионный анализ для данных из скорректированных в п.2 массивов. Независимые переменные – массивы 1-3, зависимая переменная – массив 5.
Вид регрессии выбрать самостоятельно.
4. Провести иерархический кластерный анализ по данным о развитии регионов РФ. Необходимо применить 2 различные метрики и 2 разных метода объединения в кластеры, полученные два разбиения сравнить с помощью одного из функционалов качества. Сделать выводы, построить дендрограмму для наилучшего разбиения.
№ п/п |
Регион |
Индекс ожидаемой продол–ти жизни при рождении |
Индекс уровня образования |
Индекс уровня безработицы |
|
Тюменская область |
0,71 |
0,91 |
0,86 |
|
Самарская область |
0,71 |
0,88 |
0,91 |
|
Мурманская область |
0,73 |
0,92 |
0,79 |
|
Республика Татарстан |
0,73 |
0,85 |
0,89 |
|
Республика Коми |
0,69 |
0,90 |
0,82 |
|
Республика Якутия |
0,67 |
0,91 |
0,86 |
|
Магаданская область |
0,69 |
0,96 |
0,82 |
|
Хабаровский край |
0,66 |
0,91 |
0,88 |
|
Пермская область |
0,69 |
0,84 |
0,87 |
|
Белгородская область |
0,74 |
0,81 |
0,89 |
|
Липецкая область |
0,72 |
0,81 |
0,89 |
|
Московская область |
0,70 |
0,88 |
0,90 |
|
Камчатская область |
0,66 |
0,94 |
0,82 |
|
Нижегородская область |
0,70 |
0,82 |
0,91 |
|
Ульяновская область |
0,72 |
0,82 |
0,89 |
|
Красноярский край |
0,65 |
0,86 |
0,84 |
|
Ярославская область |
0,70 |
0,83 |
0,89 |
|
Томская область |
0,69 |
0,86 |
0,85 |
|
Иркутская область |
0,65 |
0,88 |
0,86 |
|
Вологодская область |
0,69 |
0,82 |
0,87 |
|
Кемеровская область |
0,66 |
0,84 |
0,88 |
|
Ростовская область |
0,71 |
0,86 |
0,84 |
|
Тульская область |
0,68 |
0,83 |
0,88 |
|
Респ. Башкортостан |
0,71 |
0,84 |
0,87 |
|
Воронежская область |
0,73 |
0,81 |
0,91 |
|
Челябинская область |
0,71 |
0,85 |
0,88 |
|
Свердловская область |
0,69 |
0,86 |
0,90 |
|
Курская область |
0,70 |
0,81 |
0,90 |
|
Калужская область |
0,69 |
0,85 |
0,90 |
|
Омская область |
0,72 |
0,83 |
0,85 |
|
Республика Карелия |
0,68 |
0,85 |
0,83 |
|
Орловская область |
0,71 |
0,83 |
0,87 |
|
Оренбургская область |
0,70 |
0,84 |
0,87 |
|
Новгородская область |
0,67 |
0,80 |
0,85 |
|
Рязанская область |
0,70 |
0,82 |
0,93 |
|
Краснодарский край |
0,71 |
0,84 |
0,84 |
|
Удмуртская Республика |
0,71 |
0,86 |
0,87 |
|
Владимирская область |
0,69 |
0,84 |
0,88 |
|
Волгоградская область |
0,71 |
0,86 |
0,85 |
Варианты заданий:
Вариант |
Номера регионов |
Вариант |
Номера регионов |
Вариант |
Номера регионов |
1 |
1-6 |
9 |
9-14 |
17 |
17-22 |
2 |
2-7 |
10 |
10-15 |
18 |
18-23 |
3 |
3-8 |
11 |
11-16 |
19 |
19-24 |
4 |
4-9 |
12 |
12-17 |
20 |
20-25 |
5 |
5-10 |
13 |
13-18 |
21 |
21-26 |
6 |
6-11 |
14 |
14-19 |
22 |
22-27 |
7 |
7-12 |
15 |
15-20 |
23 |
23-28 |
8 |
8-13 |
16 |
16-21 |
24 |
24-29 |