Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
регрес.rtf
Скачиваний:
18
Добавлен:
30.05.2015
Размер:
1.56 Mб
Скачать

2. Пакет Анализ данных Microsoft Excel

Анализ данных - область информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных (в широком смысле) данных.

Ms Excel представляет широкие возможности для проведения анализа данных, находящихся в списке. К средствам анализа относятся:

  • Обработка списка с помощью различных формул и функций;

  • Построение диаграмм и использование карт Ms Excel;

  • Проверка данных рабочих листов и рабочих книг на наличие ошибок;

  • Структуризация рабочих листов;

  • Автоматическое подведение итогов (включая мастер частичных сумм);

  • Консолидация данных;

  • Сводные таблицы;

  • Специальные средства анализа выборочных записей и данных – подбор параметра, поиск решения, сценарии и др [3].

В состав Microsoft Excel входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения сложных статистических и инженерных задач. Для проведения анализа данных с помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. Другие средства позволяют представить результаты анализа в графическом виде.

Статистические данные приводятся в виде длинных и сложных статистических таблиц, поэтому бывает весьма трудно обнаружить в них имеющиеся неточности и ошибки.

Графическое же представление статистических данных помогает легко и быстро выявить ничем не оправданные пики и впадины, явно не соответствующие изображаемым статистическим данным, аномалии и отклонения.

Графическое представление статистических данных является не только средством иллюстрации статистических данных и контроля их правильности и достоверности. Благодаря своим свойствам оно является важным средством толкования и анализа статистических данных, а в некоторых случаях - единственным и незаменимым способом их обобщения и познания.

Регрессия является инструментом пакета анализа данных Microsoft Excel. Линейный регрессионный анализ заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных [4].

3. Пример регрессионного анализа данных

Имеется матрица данных следующего вида

y

X1

X2

X3

X4

X5

1

10,9

1,59

0,26

2,05

0,32

0,14

2

9,6

0,34

0,28

0,46

0,59

0,66

3

10,2

2,53

0,31

2,46

0,30

0,31

4

11,1

4,63

0,40

6,44

0,43

0,59

5

10,8

2,16

0,26

2,16

0,39

0,16

6

9,8

2,16

0,30

2,69

0,32

0,17

7

13,7

0,68

0,29

0,73

0,42

0,23

8

8,8

0,35

0,26

0,42

0,21

0,08

9

8,1

0,52

0,24

0,49

0,20

0,08

10

14,7

3,42

0,31

3,02

1,37

0,73

11

10,9

1,78

0,30

3,19

0,73

0,17

12

11,9

2,40

0,32

3,30

0,25

0,14

13

13,3

9,36

0,40

11,51

0,39

0,38

14

10,9

1,72

0,28

2,26

0,82

0,17

15

8,2

0,59

0,29

0,60

0,13

0,35

16

8,4

0,28

0,26

0,30

0,09

0,15

17

9,4

1,64

0,29

1,44

0,20

0,08

18

9,6

0,09

0,22

0,05

0,43

0,20

19

14,3

0,08

0,25

0,03

0,73

0,20

20

9,9

1,36

0,26

0,17

0,99

0,42

Требуется:

  • построить уравнения линейной регрессии, последовательно увеличивая число факторных переменных от одной до пяти;

  • определить качество полученных уравнений регрессии и их статистическую значимость;

  • оценить статистическую значимость параметров регрессии;

  • построить графики остатков для полученных регрессий;

  • рассчитать нормированные коэффициенты j для наилучшего уравнения регрессии

Для выполнения задания используется регрессионный метод пакета «Анализ данных» MS Excel.