Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

4599

.pdf
Скачиваний:
1
Добавлен:
08.01.2021
Размер:
1.2 Mб
Скачать

шероховатостью поверхностей, уравновешенностью механизмов и т.п. Потребительское качество может оцениваться различными показателями, важнейшими из которых являются наработка изделия, срок службы, вероятность безотказной работы, производительность и т. д.

Показатели производственного и потребительского качества являются по своей природе случайными величинами, между которыми имеется корреляционная связь.

Задача заключается в определении количественных характеристик, оценивающих тесноту корреляционной связи и построении уравнения регрессии, отражающего зависимость показателя потребительского качества от одного или нескольких показателей производственного качества.

Исходной информацией служат результаты опытов, в которых для партии N изделий фиксировались значения показателей производственного качества X и показателя потребительского качества Y.

Задачей является построение и анализ регрессионного уравнения Y = f(X). Рассмотрим простой случай – построение линейного уравнения Y = b0 + b1 X. Обработка исходной статистической информации производится с

помощью аппарата корреляционного и регрессионного анализа. Но для правомерности использования этого математического аппарата необходимо выполнение некоторых условий.

4.3.3. Условия использования математического аппарата

Для применения аппарата корреляционного и регрессионного анализа необходимо, чтобы исходные статистические данные удовлетворяли следующим требованиям:

результаты наблюдений как величины X, так и величины Y в процессе проведения эксперимента должны быть случайными и независимыми;

случайные величины X и Y должны быть распределены по нормальному

закону;

случайные величины X1, X2, …, Xi, Xk должны быть линейно взаимонезависимы (для случая множественной регрессии).

4.3.3.1. Проверка случайности и независимости наблюдений

11

Имеются результаты замеров случайной величины X для партии изделий объемом N, записанные в порядке их получения в процессе проведения наблюдений.

Результаты этих наблюдений считаются случайными и независимыми друг от друга величинами, если результат наблюдения на любом шаге (в любом опыте) не зависит от результатов ранее проведенных наблюдений и сам, в свою очередь, не оказывает влияния на результаты последующих наблюдений.

Для проверки этого условия используется критерий серий. Вычисления проводятся в следующем порядке.

1) Результаты наблюдений, ранее записанные в порядке их получения во время проведения опытов, теперь записываются в порядке их возрастания, т. е. составляется вариационный ряд: X1 X2 … Xm … XN.

2) Для полученного вариационного ряда величины X определяется медианное значение

, если N нечетное,

, если N четное,

то есть определяется середина вариационного ряда.

3)Каждое значение величины X из ряда, записанного в том порядке, в котором значения X получались при проведении наблюдений, сравнивается с медианой Xmed. Если сравниваемое значение X < Xmed, то ставится знак “–”, а если X > Xmed, то ставится знак “+” (случай X = Xmed игнорируется). Последовательность одинаковых знаков, стоящих рядом, называется серией. В результате ряд числовых значений величины X, полученный в порядке проведения наблюдений, преобразуется в ряд, состоящий из знаков “+” или “–”.

4)Определяется количество серий V.

5)Определяется размер наиболее длинной серии .

6)Проверяется гипотеза о независимости и случайности результатов наблюдений. Величина X считается случайной и наблюдения независимыми, если выполняются следующие два условия:

V 0, 5 N 1 Z N 1 ;

12

 

 

 

3, 32 lg N 1 ,

 

 

 

 

 

 

 

 

 

где Z – нормированная случайная величина, которая выбирается по таблице

функций Лапласа для уровня значимости (табл. 1).

 

 

 

 

 

 

 

 

 

Таблица 1

 

 

Значения Z для различных уровней значимости

 

 

 

 

 

 

 

 

 

 

0,1

 

0,05

0,02

 

0,01

0,001

 

 

 

 

 

 

 

 

Z

1,64

 

1,96

2,33

 

2,58

3,29

 

 

 

 

 

 

 

 

4.3.3.2. Проверка условия распределения случайных величин X и Y по нормальному закону

Для проверки этого условия используется критерий W. Эти вычисления проводятся для X и Y.

1)Выборка значений величины X выстраивается снова в вариационный ряд. (см п. 4.3.3.1, 1).

2)Вычисляется величина SX2 :

 

N

2

N

X m

SX2 X m2

m 1

 

.

 

 

m 1

 

N

Примечание. Расчет суммы и самой величины SX2 должен проводиться с точностью 5…6 знаков после запятой.

3) Вычисляется величина BX:

BX AN X N X1 AN 1 X N 1 X2 AN l 1 X N l 1 Xl

l

X N m 1 Xm

 

AN m 1

 

m 1

 

 

,

 

 

где l

N

, если N – четное; l

N 1

 

, если N – нечетное;

 

 

2

 

 

 

2

 

 

Xl, XN

– значения соответственно первого и последнего члена

вариационного ряда величины X.

 

Значения AN–m+1

берутся из табл. 2.

 

 

 

 

 

 

 

 

Таблица 2

Коэффициенты AN–m+1

и критические значения W-статистики для уровня значимости

 

 

 

 

 

 

u = N – m + 1

 

 

 

 

Объем выборки N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13

 

 

3

4

8

9

10

11

 

 

 

 

 

 

 

 

 

1

0,707

0,687

0,605

0,589

0,574

0,560

 

 

 

 

 

 

 

 

 

2

 

0,168

0,316

0,324

0,329

0,332

 

 

 

 

 

 

 

 

 

3

 

 

0,174

0,198

0,214

0,226

 

 

 

 

 

 

 

 

 

4

 

 

0,056

0,095

0,122

0,143

 

 

 

 

 

 

 

 

 

5

 

 

 

 

0,040

0,070

 

 

 

 

 

 

 

 

Wкр

= 0,05

0,767

0,748

0,818

0,829

0,842

0,850

 

 

 

 

 

 

 

 

 

= 0,10

0,789

0,792

0,851

0,859

0,869

0,878

 

 

 

 

 

 

 

 

Продолжение табл. 2

u = N – m + 1

 

 

Объем выборки N

 

 

 

 

 

 

 

 

 

 

 

 

 

12

13

 

14

 

15

16

 

 

 

 

 

 

 

 

 

 

1

0,548

0,536

 

0,525

 

0,515

0,506

 

 

 

 

 

 

 

 

 

 

2

0,333

0,333

 

0,332

 

0,331

0,329

 

 

 

 

 

 

 

 

 

 

3

0,235

0,241

 

0,246

 

0,250

0,252

 

 

 

 

 

 

 

 

 

 

4

0,159

0,171

 

0,180

 

0,188

0,194

 

 

 

 

 

 

 

 

 

 

5

0,092

0,110

 

0,124

 

0,135

0,145

 

 

 

 

 

 

 

 

 

 

6

0,030

0,054

 

0,073

 

0,088

0,101

 

 

 

 

 

 

 

 

 

 

7

 

 

 

0,024

 

0,043

0,059

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

0,020

 

 

 

 

 

 

 

 

 

Wкр

= 0,05

0,859

0,866

 

0,874

 

0,881

0,887

 

 

 

 

 

 

 

 

 

 

= 0,10

0,883

0,889

 

0,895

 

0,901

0,905

 

 

 

 

 

 

 

 

 

4) Вычисляется значение W-статистики для X:

B2 WX S X2 .

X

5) Проверка гипотезы о нормальном распределении случайной величины X:

Расчетное значение WX сравнивается с критическим, которое определяется по табл. 2 для уровня значимости и объема выборки N.

Если WX > Wкр, то гипотеза о нормальном законе распределения случайной величины X не отвергается.

Такие же вычисления проводятся и для Y.

14

4.3.4. Построение уравнения регрессии

4.3.4.1. Исходная гипотеза Выдвигается гипотеза о том, что зависимость показателя

потребительского качества Y от показателя производственного качества X может быть описана линейной математической моделью Y = b0 + b1 X.

Рассмотрим решение задачи построения такого уравнения регрессии.

4.3.4.2. Вычисление характеристик распределения X и Y

1) Вычисления средних значений:

 

 

1

N

 

 

1

N

X

Xu ;

Y

 

Yu .

N

N

 

 

u 1

u 1

2) Вычисление выборочных дисперсий и средних квадратических отклонений X и Y:

 

 

1

 

 

 

N

 

 

 

 

 

S 2 X

 

 

 

 

Xu X

2

;

 

 

 

 

 

 

 

N 1

 

 

 

 

u 1

 

 

 

 

 

 

1

 

 

 

N

 

 

 

 

 

 

S 2 Y

 

 

 

Yu Y

2

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

u 1

 

 

 

 

S X

 

; S Y

 

,

S 2 X

S 2 Y

где X , Y – средние значения X и Y;

Xu, Yu – значения случайных величин X и Y в u-ом опыте; S 2 X , S 2 Y – выборочные дисперсии X и Y;

S[X], S[Y] – выборочные средние квадратические отклонения X и Y.

4.3.4.3. Определение оценок коэффициентов уравнения регрессии

 

N

 

 

 

 

 

 

 

 

 

X n

 

Yn

 

 

X

Y

b

n 1

 

 

 

;

 

N

 

1

 

 

 

 

 

 

 

 

 

X n

 

 

2

 

 

X

n 1

b0 Y b1 X .

15

4.3.4.4. Вычисление оценки остаточной дисперсии

 

 

 

 

1

N

ˆ

2

 

 

2

 

 

 

 

Sост Y

fост

Yu

Yu

,

 

 

 

 

u 1

 

 

где Yu,

ˆ

– соответственно

фактическое (опытное) и расчетное значение

Yu

параметра Y в u-ом опыте;

fост – число степеней свободы остаточной дисперсии, fост = N – V,

V – число коэффициентов в уравнении регрессии (в нашем случае V = 2).

ˆ

ˆ

= b0 + b1·Xu.

Значения Yu

вычисляются для всех Xu с помощью уравнения Yu

4.3.4.5. Определение точности коэффициентов уравнения регрессии Точность оценок коэффициентов уравнения регрессии характеризуется

их средними квадратическими отклонениями:

S b0 N1 Sост2 Y ;

 

 

 

 

 

 

 

 

S b

 

1

 

 

S 2

Y ,

 

 

 

 

X

1

 

N S 2

ост

 

 

 

 

 

 

 

где S[b0], S[b1] – средние квадратические отклонения оценок коэффициентов уравнения регрессии b0, b1;

Sост2 Y – оценка остаточной дисперсии Y (см. п. 4.3.4.4);

S 2 X – выборочная дисперсия X (см. п. 4.3.4.2, 2);

N – число опытов.

4.3.4.6. Проверка статистической значимости оценок коэффициентов уравнения регрессии

16

Проверка гипотезы о значимости оценок коэффициентов уравнения регрессии осуществляется с помощью t-критерия Стьюдента:

b

t S b .

Критическое значение t-критерия определяется по табл. 18 при уровне значимости и числе степеней свободы f = N – 1.

Если t > t , f, то гипотеза о значимости коэффициента b не отвергается.

 

 

 

 

 

Таблица 3

 

Значения квантилей t , f -распределения Стьюдента

 

 

 

 

 

 

 

Число степеней

 

 

Уровень значимости

 

 

 

 

 

 

 

свободы f

 

0,025

0,05

 

0,10

 

 

 

 

 

 

2

 

4,303

2,920

 

1,886

 

 

 

 

 

 

4

 

2,776

2,132

 

1,533

 

 

 

 

 

 

6

 

2,447

1,943

 

1,440

 

 

 

 

 

 

8

 

2,306

1,860

 

1,397

 

 

 

 

 

 

10

 

2,228

1,813

 

1,372

 

 

 

 

 

 

12

 

2,179

1,782

 

1,356

 

 

 

 

 

 

14

 

2,145

1,761

 

1,345

 

 

 

 

 

 

16

 

2,120

1,746

 

1,337

 

 

 

 

 

 

18

 

2,101

1,743

 

1,330

 

 

 

 

 

 

4.3.4.7. Проверка адекватности уравнения регрессии Проверка осуществляется с помощью F-критерия Фишера.

S 2 Y ,

F п

Sост2 Y

где Sп2 Y , Sост2 Y – оценки соответственно полной дисперсии (п. 4.3.4.2, 2) и

остаточной дисперсии (п. 4.3.4.4);

17

 

 

N

Sп2 Y S 2 Y

1

Yu

 

2 .

Y

fп

 

u 1

Число степеней свободы fп = N – 1.

Если F > F , fп, fост , то гипотеза об адекватности уравнения регрессии не

отвергается. F , fп, fост определяется по табл. 4 для уровня значимости

= 0,05 и чисел степеней свободы fп и fост.

4.3.4.8. Оценка точности корреляционной связи Оценка тесноты связи производится с помощью коэффициента парной корреляции между фактором X и параметром Y:

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r X , Y

Xu X

Yu Y

 

 

 

S X

 

–1 r 1.

 

 

 

u 1

 

 

 

 

 

 

 

 

b

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(N 1) S X S Y

 

1

 

S Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4

 

 

 

Значения квантилей F-распределения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число

 

 

 

 

 

 

Число степеней свободы fп

 

 

 

степеней

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

свободы fост

3

5

6

 

 

8

 

 

 

10

12

15

 

20

3

9,3

9,014

8,941

 

8,845

 

 

8,786

8,745

8,703

 

8,660

 

 

 

 

 

 

 

 

 

 

 

 

 

4

6,6

6,256

6,163

 

6,041

 

 

5,964

5,912

5,858

 

5,803

 

 

 

 

 

 

 

 

 

 

 

 

 

5

5,4

5,050

4,950

 

4,819

 

 

4,735

4,678

4,619

 

4,558

 

 

 

 

 

 

 

 

 

 

 

 

 

6

4,8

4,387

4,284

 

4,147

 

 

4,060

4,000

3,938

 

3,874

 

 

 

 

 

 

 

 

 

 

 

 

 

7

4,4

3,972

3,866

 

3,726

 

 

3,637

3,575

3,511

 

3,445

 

 

 

 

 

 

 

 

 

 

 

 

 

8

4,1

3,688

3,581

 

3,438

 

 

3,347

3,284

3,218

 

3,150

 

 

 

 

 

 

 

 

 

 

 

 

 

9

3,0

3,482

3,374

 

3,230

 

 

3,137

3,073

3,006

 

2,937

 

 

 

 

 

 

 

 

 

 

 

 

 

10

3,7

3,326

3,217

 

3,072

 

 

2,978

2,913

2,845

 

2,774

 

 

 

 

 

 

 

 

 

 

 

 

 

12

3,5

3,106

2,996

 

2,849

 

 

2,753

2,687

2,617

 

2,544

 

 

 

 

 

 

 

 

 

 

 

 

 

14

3,3

2,958

2,848

 

2,699

 

 

2,602

2,534

2,463

 

2,388

 

 

 

 

 

 

 

 

 

 

 

 

 

16

3,2

2,852

2,741

 

2,641

 

 

2,494

2,425

2,352

 

2,276

 

 

 

 

 

 

 

 

 

 

 

 

 

18

3,2

2,773

2,661

 

2,510

 

 

2,412

2,342

2,269

 

2,191

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18

 

 

 

 

 

 

 

 

 

4.3.4.9. Оценка точности выборочного коэффициента парной корреляции

S r 1 r2 X , Y ,

N 1

где S[r] – среднее квадратическое отклонение выборочного коэффициента парной корреляции;

N – число опытов.

4.4.10. Оценка статистической значимости выборочного коэффициента парной корреляции

Для проверки гипотезы о статистической значимости выборочного коэффициента парной корреляции используется t-критерий Стьюдента:

t r

 

r X , Y

 

.

 

 

 

 

 

 

S r

 

Если t > t , f, то гипотеза о значимости выборочного коэффициента парной корреляции не отвергается. Критическое значение t-статистики определяется по табл. 3 для уровня значимости и числа степеней свободы: f = N – 2.

4.4.11. Вычисление коэффициента детерминации

Коэффициент детерминации D = r2[X, Y] показывает долю изменчивости параметра Y, которая определяется изменением фактора X. Считается, что уравнение регрессии достаточно полно описывает изучаемый объект, если коэффициент детерминации D > 0,5 0,6.

4.3.5. Дополнительные меры по устранению неадекватности уравнения регрессии

4.3.5.1. Причины неадекватности уравнения регрессии В ряде случаев полученное уравнение регрессии оказывается

неадекватным, то есть не описывает с заданной точностью зависимость Y от X. Причины неадекватности могут быть следующими:

– малый объем наблюдений N;

19

неверно выбранный вид уравнения регрессии;

сильное действие мешающих, не учитываемых факторов и др.

Если делается предположение, что причиной неадекватности уравнения регрессии является недостаточный объем наблюдений, то необходимо увеличить объем исходной информации путем проведения дополнительных экспериментов.

Для дополнительных опытных данных следует провести проверку выполнения условий случайности и независимости наблюдений и нормальности закона распределения (п.п. 4.3.3.1.; 4.3.3.2.).

Кроме этого, необходимо проверить условие однородности основой и дополнительной информации.

4.3.5.2. Проверка условия однородности распределения X и Y основной и дополнительной выборок

Основная и дополнительная выборки считаются однородными, если подчиняются одному и тому же закону распределения и выборочные оценки характеристик распределений статистически однородны. Для этого проводятся

расчеты:

 

 

 

 

 

 

1) Определение средних

арифметических значений X и Y для

дополнительной выборки:

 

 

 

 

 

 

 

 

 

 

 

 

1

 

nД

 

 

 

 

 

 

 

X nД ;

X Д

nД

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

Д

 

 

 

 

 

 

1

 

nД

 

 

 

YД

 

 

YnД ,

 

nД

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

Д

где nд – число дополнительных опытов;

XuД , YuД – значения X и Y в u-ом опыте дополнительной выборки, uд = 1, 2 ... nд.

2)Вычисление выборочных дисперсий и средних квадратических отклонений S2[Xд], S2[Yд] и S[Xд], S[Yд]:

S 2 XД

 

 

nД

X n

 

Д 2 ;

1

 

 

 

 

X

nД 1

 

nД 1

Д

 

 

 

 

 

 

 

 

 

 

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]