- •Кафедра информационных технологий
- •Москва – 2007
- •Содержание
- •Введение
- •Постановка задачи
- •Решение задачи
- •Глава 2. Оптимизация технологий рецептурных смесей
- •2.1. Оптимизация технологии составления многокомпонентных рецептурных смесей
- •1. Формирование математической модели
- •2. Формирование компьютерной модели
- •3. Поиск решения
- •2.2. Моделирование двух- и трёхкомпонентной рецептурной смеси
- •1. Модель показателя активной кислотности (pH)
- •2. Модель водосвязывающей способности (всс)
- •Глава 3. Регрессионно-факторный анализ в исследовании адекватности эмпирических зависимостей
- •3.1. Идентификация параметров эмпирических зависимостей технологических моделей
- •3.2. Адекватность эмпирических зависимостей
- •Критерий поворотных точек для определения случайности остаточной компоненты
- •Определение автокорреляции остатков критерием Дарбина-Уотсона
- •Независимость распределения остаточной компоненты по r/s-критерию
- •3.3. Оценка статистической значимости регрессионных моделей технологических объектов
- •Коэффициент детерминации как характеристика силы вязи между показателями исследуемого технологического объекта
- •Оценка качества уравнения регрессии f-критерием Фишера
- •Оценка статистической значимости коэффициентов регрессии и корреляции t-критерием Стьюдента
- •Постановка задачи
- •Зависимость щёлочности и показателя активной кислотности рН от объёмной доли спирта
- •Решение задачи
- •Глава 4. Спектральные методы оценки нечетких потребительских свойств пищевого сырья и готовых продуктов
- •4.1. Сверхразрешение при различии спектральных распределений Постановка задачи
- •Решение задачи
- •4.2. Сравнительный анализ технологий. Моделирование связи показателей технологий
- •Список литературы
Коэффициент детерминации как характеристика силы вязи между показателями исследуемого технологического объекта
Пусть имеется парная регрессия и корреляция y = f(x):
.
Теоретический и выборочный коэффициент корреляции случайных величин X и Y задаются выражениями
,
. (3.18)
Для векторов X = (X1, X2, …, XN) и Y = (Y1, Y2, …, YN) часто используют выборочный коэффициент корреляции, определяющий косинусу угла между ними, как показано на рисунке 1,
(3.19)
Рис. 1. Геометрическое представление выборочного коэффициента корреляции
Данный коэффициент совпадает с рассмотренным выше выборочным коэффициентом корреляции для N выборок случайных величин X и Y, у которых áXñ = áYñ = 0.
Коэффициент корреляции в некоторой степени описывает меру связи между случайными величинами X и Y. Величина связи изменяется в пределах 1 £ rXY £ 1.
Однако данная мера связи не вполне корректно выявляет «силу» связи. Так, например, из рисунка 1 видно, что случайные величины X и Y, а также X и Z имеют одинаковые коэффициенты корреляции rXY = rXZ, хотя векторы X и Y «ближе» друг к другу, чем векторы X и Z.
Более правильно «силу» связи описывает модифицированный коэффициент корреляции
.
Отсюда видно, что при удалении Y от X в направлении Z, что говорит об ослаблении связи случайных величин X и Y. Это не описывается коэффициентом rXY.
Оценка качества уравнения регрессии f-критерием Фишера
I. Пусть имеется парная регрессия и корреляция y = f(x):
.
F-тест ‑ оценивание качества уравнения регрессии – состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы
, (3.20)
где n ‑ число единиц совокупности, m ‑ число параметров при переменных х.
Fтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости ‑ вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно принимается равной 0,05 или 0,01.
Если Fтабл < Fфакт, то Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл > Fфакт, то гипотеза Н0 не отклоняется и признается статистическая незначимость, надёжность уравнения регрессии.
II. Пусть имеется модель множественной регрессии и корреляции
y = f(x1, x2, …, xn).
Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:
. (3.21)
Частный F-критерий оценивает статистическую значимость присутствия каждого из факторов в уравнении. В общем виде для фактора хi частный F-критерий определяется как
. (3.22)
Оценка статистической значимости коэффициентов регрессии и корреляции t-критерием Стьюдента
I. Пусть имеется парная регрессия и корреляция y = f(x):
.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерий Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
, , . (3.23)
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
,
, (3.24)
.
Сравнивая фактическое и критическое (табличное) значения t-статистики ‑ tфакт и tтабл, ‑ принимается или отвергается гипотеза Н0.
Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством
. (3.25)
Если tтабл < tфакт, то гипотеза Н0 отклоняется, т.е. a, b, rxy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х.
Если tтабл > tфакт, то гипотеза Н0 не отклоняется и признаётся случайная природа формирования a, b и rxy.
II. Пусть имеется модель множественной регрессии и корреляции
y = f(x1, x2, …, xn).
Оценка значимости коэффициентов чистой регрессии с помощью t-критерия Стьюдента сводится к вычислению значения:
, (3.26)
где ‑ средняя квадратичная ошибка коэффициента регрессии bi, которая может быть определена формулой
, (3.27)
где у – среднее квадратичное отклонение для признака у;
хi – среднее квадратичное отклонение для фактора xi;
– коэффициент детерминации для уравнения множественной регрессии;
– коэффициент детерминации для зависимости фактора xi со всеми другими факторами уравнения множественной регрессии;
n – m ‑ 1 – число степеней свободы для остаточной суммы квадратов отклонений.
Рассмотрим применение данных критериев на примере конкретной технологической задачи.