Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Технология системных реконструкций

.pdf
Скачиваний:
2
Добавлен:
13.06.2023
Размер:
2.12 Mб
Скачать

Технология системных реконструкций

 

 

 

 

 

 

 

Число заказов

 

 

 

 

 

 

 

 

 

300

 

 

 

 

 

 

 

 

 

 

250

 

 

 

 

 

 

 

 

 

 

200

 

 

 

 

 

 

 

 

 

 

150

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

3

38

73

108

143

178

213

248

283

318

353

 

 

 

 

OBSL (дни)

 

 

 

 

Рис. 10. Гистограмма распределения для показателя OBSL, построенная в

виде ступенчатой функции, при равных интервалах группировки

 

Число заказов

 

 

 

 

 

 

 

Накопленная

 

 

 

 

 

 

 

 

частота

 

 

 

 

 

 

 

 

 

 

 

700

 

 

 

 

 

 

 

 

 

 

120%

600

 

 

 

 

576

 

 

 

 

 

100%

 

 

 

 

 

 

 

 

 

 

 

500

 

 

 

 

 

 

 

 

 

 

80%

 

 

 

 

 

 

 

 

 

 

 

400

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

287

 

 

 

 

60%

300

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

200

 

 

 

 

 

 

 

 

 

 

40%

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

20%

 

 

 

 

 

 

30

 

 

 

 

 

 

0

3

10

 

 

6

2

0

1

 

1

 

 

 

0

 

 

 

 

 

 

 

 

 

0%

 

 

 

 

 

 

 

 

 

 

 

-135

-95

-55

-15

25

65

105

145

185

225

265

 

 

 

 

 

IBSL (дни)

 

 

 

 

Рис. 11. Комбинация гистограммы распределения для показателя IBSL, по-

строенной в виде столбчатой диаграммы, и полигона накопленных частот

при равных интервалах группировки; дополнительно для каждого интервала

указано число значений показателя

 

 

 

 

 

 

30

 

 

 

 

 

 

Технология системных реконструкций

300

 

 

 

 

 

 

 

 

 

 

250

-3s

 

 

Mean

 

 

+3s

 

 

 

 

 

 

 

 

 

 

 

 

 

200

 

 

 

 

 

 

 

 

 

 

150

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

-100

-50

0

50

100

150

200

250

300

350

400

Рис. 12. Гистограмма распределения для показателя и теоретическая кривая

распределения, построенная из предположения о нормальности закона рас-

пределения:

 

 

 

 

 

Mean – среднее арифметическое, s – среднее квадратическое отклонение

 

4.0

 

K = 4.0547

 

 

 

 

 

 

 

 

3.5

 

 

 

 

 

3.0

 

 

 

 

 

2.5

 

 

 

 

 

2.0

 

 

 

 

 

1.5

 

 

 

 

 

1.0

 

 

 

 

 

0.5

 

 

 

 

 

0.0

 

 

 

 

 

3

67

131

195

259

323

Рис. 13. Графическое изображение критерия Колмогорова-Смирнова:

К – максимальное значение критерия (для выполнения критерия с вероятностью 0.86 его максимальное значение не должно превосходить 0.6)

31

Технология системных реконструкций

Критерий Колмогорова-Смирнова – устанавливает расхождение между теоретическим и эмпирическим распределениями; отношение модуля разности между эмпирическим и теоретическим распределениями к квадратному корню из объема выборки, рис. 13.

Нормальный вероятностный график – графическое изображение негруппированного распределения на вероятностной бумаге, имеющей специальную шкалу на оси ординат; используется для визуальной проверки соответствия закона распределения нормальному закону и наличия выбросов. Для нормального распределения график имеет вид прямой линии. Отклонение от прямой свидетельствует о несоответствии закона распределения нормальному. Аномальные значения показателя просматриваются на «хвостах» распределения, рис. 14.

Рис. 14. Нормальный вероятностный график:

(Millions – масштабный коэффициент шкалы измерения; OPTS - имя показателя; выделено аномальное значение)

Аномальные выбросы – отдельные резко выделяющиеся значения показателя. Аномальные выбросы могут быть объяснены допустимыми колебаниями значений показателя или ошибками, возникающими при сборе информации. В последнем случае аномальные значения необходимо исключить из выборки данных.

Способы обнаружения выбросов – основаны на выделении аномальных наблюдений в зонах больших и малых значений показателя по нормальному вероятностному графику, по гистограмме распределения, рис. 15, с помощью аналитических методов c 5-процентным уровнем значимости, табл. 3. Возможно также выделение областей аномальных значений по смысловому содержанию показателя.

Квантиль – значение показателя, отделяющее определенную долю элементов вариационного ряда.

32

Технология системных реконструкций

Медиана – значение показателя, делящее вариационный ряд на две равные по численности элементов части. При четном числе элементов вариационного ряда за медиану берется среднее арифметическое двух центральных элементов.

Квартиль нижняя и верхняя – частный случай квантили в случае деления вариационного ряда на четыре равные по численности элементов части.

Рис. 15. Гистограмма распределения в виде полосовой диаграммы:

OPTS - имя показателя, SUM - накопленная частота; FREQUENCY - частота

Таблица 3

Аномальные значения показателя OPTS

Номер заказа

OPTS

 

 

OPTS > 5 000 000

 

 

026443

7750000

036865

7244049

038650

10830994

038782

29953771

Группирование по методу равных частот – задание интервалов значений на базе квантилей (квартилей, медиан); используется для интервальных показателей.

Таблица частот – способ представления распределения, группированного на базе квантилей, рис. 16.

Рис. 16. Таблицы частот:

FZSF и ST_Dимена показателей; N - объем выборки

Величина показателя малая – диапазон значений показателя, у которого нижняя граница совпадает с минимальным значением, а верхняя граница устанавливается равной нижней квартили; для интервальных показателей с малым объемом выборки вместо квартилей используется медиана.

33

Технология системных реконструкций

Величина показателя большая – диапазон значений показателя, у которого нижняя граница устанавливается равной верхней квартили, а верхняя граница совпадает с максимальным значением; для интервальных показателей с малым объемом выборки вместо квартилей используется медиана.

Главной проблемой применения объекта «Показатель» является анализ на его основе представительности данных с учетом следующих положений:

репрезентативная выборка значений показателя обеспечивает статистическую проявленность определенного аспекта системы;

повторяемость значений количественного показателя уменьшает степень объективности проявления системы;

типические и особенные аспекты системы передаются полными наборами статистических характеристик.

Объект «Таблица наблюдений» задает целокупность наблюдаемых величин, осознаваемую через имена, значения и развернутые комментарии всех отдельно взятых показателей.

Имя – символическое обозначение показателя.

Вектор значений показателя – столбец таблицы наблюдений, содержащий целые или вещественные числа и, возможно, пропуски данных; характеризует индивидуальные особенности единичных объектов; воспринимается как канал проявления системы во всем разнообразии ее типического и особенного; одномерный взгляд на систему, в котором скрыты следы всех других показателей, рис. 17.

Рис. 17. Фрагмент таблицы наблюдений:

KZAK, ZTR54, VES_ZAK, OPTS, OBSL, IBSL, SP13, FZSP, ARM - имена показателей

Развернутый комментарий – краткая характеристика предметного содержания показателя (методика наблюдения и измерения, единицы измерения, шкала измерения, способ кодирования значений и т.д.), табл. 4.

Пропуски данных – неизвестные значения показателей; допускаются, если они непреднамеренные.

Шкалы измерений – номинальные, порядковые, интервальные.

Количество наблюдений – число единичных объектов наблюдений, рассматриваемых в эмпирическом опыте в качестве носителей идеи системы.

34

Технология системных реконструкций

Количество показателей – общее количество показателей, включенных в исходное эмпирическое описание.

 

 

 

 

 

 

Таблица 4

 

Комментарии по показателям (фрагмент для 5 показателей из 178)

 

 

 

 

 

 

 

Имя

Наименование

Шкала

Методика

Ед.

 

Интервалы значений

 

 

 

 

изм.

 

 

DAVL

Давление котлов

Поряд-

Отдел марке-

-

1

– низкое;

 

 

ковая

тинга

 

2

– повышенное;

 

 

 

 

 

3

– высокое

ARM

Арматурный заказ

Номи-

Отдел марке-

-

1

– не арматурный заказ;

 

 

нальная

тинга

 

2

– арматурный заказ

VES_ZAK

Вес заказа

Интер-

Отдел марке-

тн

Минимум: 0.001; максимум: 2459.32;

 

 

вальная

тинга

 

аномально большие: > 1500

OBSL

Интервал между

Интер-

Мониторинг

дни

Минимум: 3; максимум: 355

 

датой первой от-

вальная

заказа

 

 

 

 

грузки и датой за-

 

 

 

 

 

 

пуска заказа

 

 

 

 

 

FZSP

Фабрично-

Интер-

Бухгалтерия

руб

Минимум: -150037; максимум: 10266294;

 

заводская себестои-

вальная

 

 

аномально малые: <0; аномально боль-

 

мость (план)

 

 

 

шие: > 5 млн.

Таблица описательных статистик – таблица, содержащая объем выборки, минимальное и максимальное значения, размах, среднее арифметическое, среднее квадратическое отклонение и коэффициент вариации для каждого интервального показателя, табл. 5.

 

Описательные статистики (фрагмент для 9 показателей из 103)

Таблица 5

 

 

 

 

 

 

 

 

 

 

Имя пока-

Объем

Минималь-

Макси-

Размах

Среднее

Среднее

Коэффи-

зателя

выборки

ное значе-

мальное

 

арифме-

квадрати-

циент

 

 

ние

значение

 

тическое

ческое от-

вариации

 

 

 

 

 

 

клонение

 

VES_ZAK

1532

0.001

2459.32

2459.31

20.05

94.99

4.736

SUMT_D

44

0.00

76712.62

76712.62

4002.13

16106.57

4.024

OBSL

782

3.00

355.00

352.00

79.46

56.51

0.711

IBSL

916

-135.00

266.00

401.00

23.15

24.16

1.044

OPTS

1541

-1013975.00

29953772.00

30967748.00

346859.12

1096434.12

3.161

SP13

1514

-32476.00

1972201.00

2004677.00

23533.73

79425.04

3.375

SP14

1518

-29351.00

2338610.00

2367961.00

23930.61

82755.52

3.458

FZSP

1538

-150037.00

10266294.00

10416331.00

201031.77

534969.19

2.661

PRIB_P

1539

-894762.00

19508060.00

20402822.00

136196.63

679936.56

4.992

Показатели с интенсивной изменчивостью, у которых коэффициент вариации по модулю больше 3, выделены цветом

Сводная табуляграмма – таблица, содержащая частоты встречаемости в выборке значений всех номинальных и порядковых показателей, табл. 6.

Таблица группировок данных – представление распределения значений категориальных (номинальных) показателей в выборке; для интервальных показателей

35

Технология системных реконструкций

в качестве категорий выступают интервалы группировки; количество интервалов и их ширина выбираются одинаковыми для всех показателей, табл. 7.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 6

 

 

Сводная табуляграмма (фрагмент для 4 показателей из 75)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показатель

Объем

Значение

Количество

 

 

 

 

 

Коды

 

 

 

 

 

 

Комментарий

 

 

выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

KZAK

1532

 

1

 

1268

 

Владелец и заказчик – одно юридиче-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ское лицо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

264

 

Владелец и заказчик – разные юридиче-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ские лица

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DAVL

850

 

1

 

298

 

Трубопроводы низкого давления

 

 

 

 

 

 

 

 

 

 

 

2

 

79

 

Трубопроводы повышенного давления

 

 

 

 

 

 

 

 

 

 

3

 

473

 

Трубопроводы высокого давления

 

 

 

 

 

 

 

ARM

1247

 

1

 

1231

 

Не арматурный заказ

 

 

 

 

Малая

 

 

 

 

 

 

2

 

16

 

Арматурный заказ

 

 

 

 

изменчивость

 

ZTR54

1436

 

1

 

1372

 

Цех №54 не участвует в выполнении

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

заказа

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

64

 

Цех №54 участвует в выполнении заказа

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 7

 

 

Таблица группировок данных (фрагмент для 5 показателей из 103)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показатель

 

 

 

 

 

 

Интервалы группировки (руб.)

 

 

 

 

 

 

 

 

< 0

 

0-10

 

10-50

 

50-100

 

100-10

3

 

103-

 

 

5 103-

 

4

5

 

 

105-

 

>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5 103

 

 

104

 

10 -10

 

 

 

5 105

 

500000

 

OPTS

10

 

4

 

2

 

1

 

 

35

 

 

120

 

 

96

 

603

 

 

 

415

 

255

 

SP13

3

 

196

 

10

 

19

209

 

 

351

 

 

181

 

474

 

 

 

65

 

6

 

SP14

2

 

165

 

7

 

13

169

 

 

351

 

 

227

 

510

 

 

 

70

 

4

 

FZSP

6

 

17

 

1

 

3

 

41

 

 

151

 

 

114

 

631

 

 

 

405

 

169

 

PRIB_P

34

 

116

 

73

 

51

186

 

 

167

 

 

103

 

472

 

 

 

243

 

94

 

Группирование – таблица, содержащая объем выборки, количество групп, минимальное и максимальное значения, медиану, нижнюю и верхнюю квартили для каждого интервального показателя, табл. 8.

 

Группирование (фрагмент для 8 показателей из 103)

Таблица 8

 

 

 

 

 

 

 

 

 

 

 

 

Имя пока-

Объем

Коли-

Минималь-

Нижняя

Медиана

Верхняя

Максималь-

 

зателя

выбор-

чество

ное значе-

квартиль

 

квартиль

ное значе-

 

 

ки

групп

ние

 

 

 

ние

 

VES_ZAK

1532

4

0.001

0.64

2.80

12.16

2459.32

 

OBSL

782

4

3.00

41.00

63.00

100.00

355.00

 

IBSL

916

4

-135.00

9.00

19.00

32.00

266.00

 

OPTS

1541

4

-1013975.00

18061.75

73022.00

294227.75

29953772.00

 

SP13

1514

4

-32476.00

697.00

4485.00

18700.00

1972201.00

 

SP14

1518

4

-29351.00

1190.00

6090.00

19029.00

2338610.00

 

FZSP

1538

4

-150037.00

12520.00

48178.00

193329.00

10266294.00

 

PRIB_P

1539

4

-894762.00

371.25

12954.50

76328.00

19508060.00

 

Большие и малые значения показателей – таблица, содержащая границы об-

ластей больших и малых величин для каждого интервального показателя, табл. 9.

36

Технология системных реконструкций

Трехвходовая гистограмма – распределение значений группы показателей по значениям группирующего параметра. В качестве группирующего параметра могут выступать один или более категориальных или порядковых показателей. Если группирующий параметр формируют несколько показателей, то получаемые в результате области значений не должны перекрываться, рис. 18.

Таблица 9

Большие и малые значения показателей (фрагмент для 8 показателей из 103)

Показатель

Малые

Большие

 

 

 

VES_ZAK

< 0.60

> 10

OBSL

< 40

> 100

IBSL

< 10

> 30

OPTS

< 20000

> 300000

SP13

< 700

> 18500

SP14

< 1000

> 20000

FZSP

< 12500

> 200000

PRIB_P

< 400

> 75000

Границы значений малых и больших величин даны с округлением

 

 

Рис. . Трехвходовая гистограмма:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

400

 

 

 

 

 

 

 

 

 

 

 

350

 

 

 

 

 

 

 

 

 

 

 

300

 

 

 

 

 

 

 

 

 

 

 

250

 

 

 

 

 

 

 

 

 

 

 

200 Ось 1

 

Деньги

 

 

 

 

 

 

 

 

 

150

 

 

 

 

 

 

 

 

 

 

 

Ось 2

Бартер

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

Вексель

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

SP13

SP14

 

 

9

FZSP

P

 

P

 

P

 

 

1

PS

_

_

 

P

 

B

 

ENT

 

 

S

 

 

RI

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

 

 

R

 

 

 

 

 

 

 

Показатели

 

 

 

 

 

 

Рис. 18. Распределение заказов («Ось 1») по форме оплаты («Ось 2»)

Главной проблемой применения объекта «Таблица наблюдений» является проверка полноты данных. Ее результат выражается числом и составом наиболее существенных показателей каждого уровня восприятия проявленной сущности

37

Технология системных реконструкций

системы, создающих в своей совокупности ее исчерпывающий панорамный внешний образ.

Технологические индикаторы. Таблица данных воспринимается как единое целое, скрывающее в себе потенциал системы, реализация которого при реконструкции сложного позволяет раскрывать смыслы проблемы. Статистический портрет используется в качестве базы реконструктивного анализа, содержащей набор независимо рассматриваемых показателей вместе с их значениями и вычисленными статистиками, применяемыми для оценки возможности включения каждого отдельно взятого показателя в базу анализа.

Аппарат технологических индикаторов статистического портрета оценивает полноту и представительность исходного эмпирического описания для раскрытия проблемы в общесистемном решении через:

количество пропусков данных, ухудшающих выражение системы в целом, рис. 19;

корректность значений всех показателей, табл. 10;

выявление и исключение неизменяющихся показателей, табл. 11

проверку и улучшение группировок, табл. 12

оценку многовидности изменчивости показателей;

оценку существенности (необходимости) показателей;

полноту и представительность выражения системы в данных.

Таблица 10

Сводная таблица аномальных значений (фрагмент)

№ показателя в

Показатель

Количество выбросов

системе данных

 

 

41

CHR_T

8

42

ORIG_T

14

43

RZ_RDO

6

44

RDO_ZD

3

46

OPTS

9

47

SUMT_R

13

48

PRIXOD

1

49

APIZG

10

50

PLOPL

5

51

PLOIZG

11

Таблица11

Сводная таблица не изменяющихся показателей

Показатель

 

Объем выборки

Значение

Частота

 

KWLAD

1532

1

1532

Таблица 12

 

 

 

 

 

Сводная таблица плохих группировок

 

 

 

 

 

Показатель

 

Частоты

 

 

 

 

Группа значений 1

Группа значений 2

 

ZTR37

 

1433

3

 

 

ZTR42

 

1433

3

 

 

38

 

 

 

 

Технология системных реконструкций

Количествопоказателей

 

 

 

80

 

 

 

72

 

 

 

 

 

 

70

 

 

 

 

 

60

 

 

 

 

 

50

 

 

 

 

39

40

 

 

38

 

 

 

 

 

 

30

 

23

 

 

 

 

 

 

 

 

20

 

 

 

 

 

10

6

 

 

 

 

0

 

 

 

 

 

 

0

500

1000

1500

Более1500

 

 

 

Объемвыборки

 

Рис. 19. Гистограмма распределения показателей по объему выборки

Статистический портрет охватывает все единичные объекты наблюдения, взятые независимо один от другого, и отображает их во множество значений основных показателей, каждый из которых воспринимается на этом шаге независимо друг от друга. Любой показатель задается помимо совокупности его отдельных значений полным набором статистических характеристик.

Резюме статистического портрета (на примерах двух проектов). Стати-

стический портрет отображает проявления проблемы через изменчивость показателей состояния единого носителя информации о проблеме. Основная задача портрета состоит в обеспечении корректности данных и проверке самодостаточности эмпирического описания.

Проект: Конкурентоспособность, качество, техническая и экологическая безопасность продуктов и технологий производства

Технологические индикаторы

Общая оценка портрета

Результаты

Исходных показателей: 59, из них 3 по-

Система данных в смысле ее

Получено развернутое стати-

казателя - идентификаторы стального

полноты и представительности

стическое описание проблемы

листа

может служить достаточным

качества продуктов и техноло-

На базе 10 показателей сформированы 5

эмпирическим основанием для

гий металлургического произ-

новых вычисляемых показателей

получения общесистемного

водства

Мало данных: 2 показателя

решения проблемы

Установлен факт соответствия

Информативных показателей: 49

Большое число количествен-

выпускаемых продуктов тре-

Показателей с аномальными значения-

ных показателей (98%) - по-

буемым нормам и стандартам

ми: 16 (от 1 до 5 выбросов)

ложительный факт для вери-

рынка по списку сдаточных

Объемы выборок: от 158 до 288

фикации общесистемного ре-

показателей (11 характеристик

39