Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УПП (Модуль 1).DOC
Скачиваний:
20
Добавлен:
18.11.2019
Размер:
3.07 Mб
Скачать

Коэффициент детерминации как характеристика силы вязи между показателями исследуемого технологического объекта

Пусть имеется парная регрессия и корреляция y = f(x):

.

Теоретический и выборочный коэффициент корреляции случайных величин X и Y задаются выражениями

,

. (3.18)

Для векторов X = (X1X2, …, XN) и Y = (Y1Y2, …, YN) часто используют выборочный коэффициент корреляции, определяющий косинусу угла между ними, как показано на рисунке 1,

(3.19)

Рис. 1. Геометрическое представление выборочного коэффициента корреляции

Данный коэффициент совпадает с рассмотренным выше выборочным коэффициентом корреляции для N выборок случайных величин X и Y, у которых áXñ = áYñ = 0.

Коэффициент корреляции в некоторой степени описывает меру связи между случайными величинами X и Y. Величина связи изменяется в пределах 1 £ rXY £ 1.

Однако данная мера связи не вполне корректно выявляет «силу» связи. Так, например, из рисунка 1 видно, что случайные величины X и Y, а также X и Z имеют одинаковые коэффициенты корреляции rXY = rXZ, хотя векторы X и Y «ближе» друг к другу, чем векторы X и Z.

Более правильно «силу» связи описывает модифицированный коэффициент корреляции

.

Отсюда видно, что при удалении Y от X в направлении Z, что говорит об ослаблении связи случайных величин X и Y. Это не описывается коэффициентом rXY.

Оценка качества уравнения регрессии f-критерием Фишера

I. Пусть имеется парная регрессия и корреляция y = f(x):

.

F-тест ‑ оценивание качества уравнения регрессии – состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы

, (3.20)

где n ‑ число единиц совокупности, m ‑ число параметров при переменных х.

Fтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости  ‑ вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно  принимается равной 0,05 или 0,01.

Если Fтабл < Fфакт, то Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл > Fфакт, то гипотеза Н0 не отклоняется и признается статистическая незначимость, надёжность уравнения регрессии.

II. Пусть имеется модель множественной регрессии и корреляции

y = f(x1x2, …, xn).

Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:

. (3.21)

Частный F-критерий оценивает статистическую значимость присутствия каждого из факторов в уравнении. В общем виде для фактора хi частный F-критерий определяется как

. (3.22)

Оценка статистической значимости коэффициентов регрессии и корреляции t-критерием Стьюдента

I. Пусть имеется парная регрессия и корреляция y = f(x):

.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерий Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:

, , . (3.23)

Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

,

, (3.24)

.

Сравнивая фактическое и критическое (табличное) значения t-статистики ‑ tфакт и tтабл, ‑ принимается или отвергается гипотеза Н0.

Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством

. (3.25)

Если tтабл < tфакт, то гипотеза Н0 отклоняется, т.е. a, b, rxy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х.

Если tтабл > tфакт, то гипотеза Н0 не отклоняется и признаётся случайная природа формирования a, b и rxy.

II. Пусть имеется модель множественной регрессии и корреляции

y = f(x1x2, …, xn).

Оценка значимости коэффициентов чистой регрессии с помощью t-критерия Стьюдента сводится к вычислению значения:

, (3.26)

где ‑ средняя квадратичная ошибка коэффициента регрессии bi, которая может быть определена формулой

, (3.27)

где у – среднее квадратичное отклонение для признака у;

хi – среднее квадратичное отклонение для фактора xi;

– коэффициент детерминации для уравнения множественной регрессии;

– коэффициент детерминации для зависимости фактора xi со всеми другими факторами уравнения множественной регрессии;

n – m ‑ 1 – число степеней свободы для остаточной суммы квадратов отклонений.

Рассмотрим применение данных критериев на примере конкретной технологической задачи.