Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка по МО (МУ по КР общая).doc
Скачиваний:
5
Добавлен:
19.11.2019
Размер:
15.29 Mб
Скачать

Задание 3 Корреляционно-регрессионный анализ зависимости между двумя переменными

Корреляционно-регрессионный анализ зависимости между двумя переменными состоит из пяти этапов:

  1. Проведение эксперимента.

  2. Предварительная обработка результатов эксперимента и составление корреляционной таблицы.

  3. Расчет коэффициента корреляции и корреляционного отношения.

  4. Проверка гипотезы равенства коэффициента корреляции корреляционному отношению.

  5. Анализ модели.

1. Проведение эксперимента.

Отберем партию заготовок (50 штук) и пронумеруем их. На всех заготовках проставим клеймо с номером. Выполним первую операцию - обработаем заготовки на зубофрезерном станке. Измерим (название измеряемой величины) на универсальном зубоизмерительном приборе фирмы «Карл Кцейс» с помощью оправки и индикаторной головки с ценой деления 0,001 мм. Затем партию заготовок обработали на чистовой операции шевингование-прикатывание. После чистовой обработки проводится измерение (название измеряемой величины) на том же приборе. После второй операции измерение должно происходить в строгой последовательности согласно маркировке. По результатам измерений составляется таблица 1.

Таблица 1 – Результаты измерения колебания длины общей нормали

п/п

п/п

п/п

п/п

п/п

1

11

21

31

41

2

12

22

32

42

3

13

23

33

43

4

14

24

34

44

5

15

25

35

45

6

16

26

36

46

7

17

27

37

47

8

18

28

38

48

9

19

29

39

49

10

20

30

40

50

2. Предварительная обработка результатов эксперимента.

Используя таблицу 1, результаты измерений разбиваем на интервалы. Для этого находим минимальное и максимальное значения величин параметров после первой операции ( ) и после второй операции ( ). Определим размах варьирования:

Задаемся числом интервалов . Для количества наблюдений .

Определим цену интервалов

принимаем

Полученные величины интервалов и больше цены деления средств измерения (1 мкм), что удовлетворяет установленным требованиям.

интервала

Интервал

Середина

интервала

Интервал

Середина

Подсчитаем частоту попадания размеров по каждому интервалу в соответствии с таблицей 2.

Исходными данными для таблицы 2 являются результаты таблицы 1. В том случае, когда значение или лежит на границе интервала, штриховая отметка заносится в клетку, соответствующую началу интервала.

3. Расчет коэффициента корреляции и корреляционного отношения.

Для расчета коэффициента корреляции предварительно вычисляются следующие величины:

– математическое ожидание значений и

– среднее квадратическое отклонение (СКО) от средней

– коэффициент ковариации

Тогда коэффициент корреляции будет равен

.

Корреляционное отношение вычисляется по формуле

где – СКО частной средней от общей средней , равное

Для упрощения вычислений составляется корреляционная таблица 3, исходными данными для которой являются данные таблицы 2. В таблице 3 за новое начало отсчета приняты для интервал …. мкм, для интервал … мкм. Введены новые переменные и , с помощью которых можно существенно облегчить процедуру вычисления. Переход к новым переменным осуществляется по формулам:

где – новые начала отсчета (рекомендуется принимать средние интервалов).

Новые значения интервалов отличаются один от другого на .

Таблица 3 отличается от таблицы 2 тремя графами и шестью строками. Порядок заполнения таблицы следующий. В графе подсчитываются суммарные значения частот по интервалам . Умножая эти значения графы на соответствующие значения интервалов , получаем данные для заполнения клеток . Данные для заполнения клеток графы получены путем перемножения данных предыдущей графы на соответствующий интервал .

Аналогично заполняются клетки строк . В каждой клетке четвертой строки сумма записывается как сумма произведений частот на соответствующие значения . Пятая строка ( ) получена перемножением предыдущей строки на соответствующий интервал . Значения строки получены путем деления строки на значение строки .

Пользуясь данными таблицы 3, по приведенным выше формулам вычисляем последовательно статистические характеристики .

Вычислим корреляционное отношение . Предварительно вычислим величину с помощью таблицы 4.

Таблица 4

50

4. Проверка гипотезы равенства коэффициента корреляции корреляционному отношению и вывод уравнения регрессии.

Если коэффициент корреляции по абсолютной величине равен корреляционному отношению, то между переменными существует только линейная связь. Практически между и всегда будет различие. Для оценки существенности расхождения между ними применяют следующий метод.

Определяется величина – критерий согласия Фишера:

где – объем выборки,

– число интервалов признака в корреляционной таблице,

– число определяемых параметров в уравнении регрессии (для линейной зависимости ).

Рассчитанное по формуле значение сравнивается с табличным [Приложение Б], которое, в свою очередь, выбирается в зависимости от числа степеней свободы и .

Если , то можно считать, что , то есть зависимость между исследуемыми параметрами точно линейная и может быть записана:

.

Полученное уравнение описывает влияние (название измеряемой величины) после зубофрезерования на (название измеряемой величины) после шевингования-прикатывания.

5. Анализ модели.

5.1 Проверка адекватности модели.

После вывода уравнения регрессии необходимо оценить его пригодность, т.е. нужно ответить на вопрос, можно ли с помощью полученной модели прогнозировать изменение выходного параметра в зависимости от поведения входного. Такая проверка модели называется «проверкой адекватности модели». Для раскрытия смысла этой проверки дадим графическую интерпретацию результатов эксперимента. Построим корреляционное поле.

На корреляционном поле число точек в каждой клетке соответствует значению частот, указанных в таблице 2. По данным этой же таблицы на рисунке нанесены также точки, соответствующие значениям частных средних в каждом интервале. Соединив эти точки отрезками, получим эмпирическую линию регрессии, а по уравнению регрессии построим теоретическую линию регрессии.

Оценка адекватности модели заключается в сравнении общей дисперсии исследуемого признака с дисперсией, обусловленной полученным уравнением регрессии и характеризующей отклонение эмпирической линии регрессии от теоретической.

Для сравнения дисперсий используется критерий Фишера . Модель можно считать адекватной, если вычисленное значение будет меньше табличного .

Оценим адекватность уравнения регрессии .

Чтобы оценить адекватность данной модели, необходимо знать общую и межинтервальную дисперсии.

Для расчета межинтервальной дисперсии составим таблицу 5.

Таблица 5

Значения графы получены путем подстановки соответствующих значений в уравнение регрессии .

Подсчитав сумму последней графы, определим

.

Тогда расчетное значение критерия Фишера

Если , то можно сделать вывод, что полученная модель неадекватна, т.е. с помощью уравнения регрессии нельзя прогнозировать (название измеряемой величины) после чистовой операции шевингования-прикатывания в зависимости от полученного значения (название измеряемой величины) после предварительной обработки зубофрезерования.

5.2 Оценка значимости коэффициента корреляции.

Приближенный метод

Если в результате обработки результатов эксперимента получено небольшое значение , возникает вопрос, не случайно ли значение значимо отличается от нуля.

Можно считать, что значимо отличается от нуля и связь между исследуемыми факторами реальна, если выполняется условие

где – число опытов.

В противном случае прямолинейная корреляционная связь не обнаруживается.

Следовательно, величина коэффициента корреляции незначима, т.е. связь между факторами отсутствует.

Уточненный метод

Приближенный метод может оказаться недостаточным при небольшом числе наблюдений (обычно при ). В этом случае для оценки значимости коэффициента корреляции предварительно вычисляется

Рассеяние параметра

.

Полученное значение сравнивается с табличным [Приложение В.1], которое выбирается в зависимости от числа степеней свободы и уровня доверительной вероятности :

.

Если, условие значимости коэффициента корреляции не выполняется, то корреляционная связь между параметрами отсутствует.

5.3 Построение доверительных границ для линии регрессии.

Статистические характеристики, полученные в результате обработки экспериментальных данных, являются оценками теоретических параметров, а не самими теоретическими параметрами.

Например,

– оценка математического ожидания ,

– оценка дисперсии .

Уравнение регрессии является оценочным по отношению к теоретическому уравнению , которое точно установить нельзя, но можно построить доверительную область, в которой лежит линия истинной регрессии. Чтобы построить эту область, определим доверительные границы для математического ожидания исследуемой выходной величины и теоретического коэффициента регрессии .

Доверительные границы для математического ожидания исследуемой выходной величины :

Для коэффициента регрессии доверительные границы можно определить с помощью неравенства:

Рассмотрим методику построения доверительной области для теоретической линии регрессии .

Величину найдем с помощью функции Лапласа. Для этого зададимся доверительной вероятностью . Исходя их соотношения, что , по таблице найдем . Вычислим величину

Следовательно, доверительные границы для математического ожидания исследуемой выходной величины :

Чтобы найти доверительные границы коэффициента регрессии , вычислим СКО

;

.

Порядок построения доверительных границ следующий. Сначала на график наносится точка с координатами и , затем точки и с координатами и . Через точку проводятся две линии, тангенс угла которых . Тем же образом проводятся две линии и через точку . Ломаные, проведенные через и , ограничивают область доверительных границ истинной линии регрессии.

5.4 Дисперсионный анализ результатов моделирования.

Количественную оценку влияния точности предварительной обработки на точность окончательной обработки можно установить с помощью дисперсионного анализа.

Отклонения точек корреляционного поля от линии регрессии можно оценить величиной дисперсии , которую представляют в виде суммы двух дисперсий:

Первая из них является количественной оценкой величины отклонения точек, представляющих собой конкретные значения величины отдельных деталей , от эмпирической линии регрессии. Дисперсия есть следствие влияния на .

Наличие дисперсии объясняется тем, что на выходной параметр кроме фактора влияют и другие факторы, которые не были учтены в модели.

Первое и второе слагаемые правой части уравнения определяются по формулам:

Тогда

.

Таким образом, формула позволяет проверить рассчитанную ранее дисперсию .

Приняв за 100%, получим

;

.

На основе дисперсионного анализа можно сделать следующий вывод: на величину выходного параметра окажет влияние входной параметр на …% и на …% факторы, которые не учтены в модели.

Общие выводы по заданию:

1. Установлено, что между величинами (обозначение измеренной величины) и (обозначение измеренной величины) отсутствует корреляционная связь.

2. Проверка адекватности модели показала невозможность прогнозирования значения выходного параметра по величине входного.

3. Дисперсионный анализ позволил не только качественно, но и количественно оценить степень влияния входной величины на выходную.