Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

01 КАСЮК С. Т. ПЕРВИЧНЫЙ, КЛАСТЕРНЫЙ, РЕГРЕССИОННЫЙ И ДИСКРИМИНАНТНЫЙ АНАЛИЗ ДАННЫХ СПОРТИВНОЙ МЕДИЦИНЫ НА КОМПЬЮТЕРЕ

.pdf
Скачиваний:
134
Добавлен:
14.03.2016
Размер:
5.88 Mб
Скачать

Название группы

 

Англоязычный интерфейс

Русскоязычный интерфейс

инструментов

 

пакета STATISTICA 10

пакета STATISTICA 10

Группа Manage

 

 

 

(Управление) со-

 

 

держит

средства

 

 

управления дан-

 

 

ными

 

 

 

 

 

 

 

 

Группа Mode

 

 

 

(Режим)

содержит

 

 

средства

задания

 

 

режимов работы

с

 

 

данными

 

 

 

 

 

 

 

 

 

Вкладка Help (Справка)

Группа Help

(Справка) содер-

жит средства получения справочной информации

Группа Support

(Поддержка) со-

держит средства получения технической поддержки

Группа About

(О программе) со-

держит средство вывода информации о программе

151

Приложение Б

Критерий Шапиро-Уилка;

p-квантили статистики критерия W для p = α = 0,01 и 0,05

n

 

p

 

n

 

p

0,01

 

0,05

 

0,01

 

0,05

 

 

 

 

 

 

 

 

 

 

26

0,891

 

0,920

 

 

 

 

 

27

0,891

 

0,920

 

 

 

 

 

28

0,896

 

0,924

 

 

 

 

 

29

0,898

 

0,926

 

 

 

 

 

30

0,900

 

0,927

 

 

 

 

 

31

0,902

 

0,929

 

 

 

 

 

32

0,904

 

0,930

8

0,741

 

0,818

 

33

0,906

 

0,931

9

0,764

 

0,829

 

34

0,910

 

0,933

10

0,781

 

0,842

 

35

0,910

 

0,934

11

0,792

 

0,850

 

36

0,912

 

0,935

12

0,805

 

0,859

 

37

0,914

 

0,936

13

0,814

 

0,866

 

38

0,916

 

0,938

14

0,825

 

0,874

 

39

0,917

 

0,939

15

0,835

 

0,881

 

40

0,919

 

0,940

16

0,844

 

0,887

 

41

0,920

 

0,941

17

0,851

 

0,892

 

42

0,922

 

0,942

18

0,858

 

0,897

 

43

0,923

 

0,943

19

0,863

 

0,901

 

44

0,924

 

0,944

20

0,868

 

0,905

 

45

0,926

 

0,945

21

0,873

 

0,908

 

46

0,927

 

0,945

22

0,878

 

0,911

 

47

0,928

 

0,946

23

0,881

 

0,914

 

48

0,929

 

0,947

24

0,884

 

0,916

 

49

0,929

 

0,947

25

0,888

 

0,918

 

50

0,930

 

0,947

 

 

152

 

 

 

 

Приложение В

Критические значения для наибольшего отклонения эмпирического распределения от теоретического (критерий Колмогорова)

n

α = 0,05

α = 0,01

n

α = 0,05

α = 0,01

n

α = 0,05

α = 0,01

1

0,97500

0,99500

35

0,22425

0,26897

69

0,16088

0,19303

2

0,84189

0,92929

36

0,22119

0,26532

70

0,15975

0,19167

3

0,70760

0,82900

37

0,21826

0,26180

71

0,15864

0,19034

4

0,62394

0,73424

38

0,21544

0,25843

72

0,15755

0,18903

5

0,56328

0,66853

39

0,21273

0,25518

73

0,15649

0,18776

6

0,51926

0,61661

40

0,21012

0,25205

74

0,15544

0,18650

7

0,48342

0,57581

41

0,20760

0,24904

75

0,15442

0,18528

8

0,45427

0,54179

42

0,20517

0,24613

76

0,15442

0,18528

9

0,43001

0,51332

43

0,20283

0,24332

77

0,15342

0,18408

10

0,40925

0,48893

44

0,20056

0,24060

78

0,15244

0,18290

11

0,39122

0,46770

45

0,19837

0,23798

79

0,15147

0,18174

12

0,37543

0,44905

46

0,19625

0,23544

80

0,15052

0,18060

13

0,36143

0,43247

47

0,19420

0,23298

81

0,14868

0,17840

14

0,34890

0,41762

48

0,19221

0,23059

82

0,14779

0,17732

15

0,33760

0,40420

49

0,19028

0,22828

83

0,14691

0,17627

16

0,32733

0,39201

50

0,18841

0,22604

84

0,14605

0,17523

17

0,31796

0,38086

51

0,18659

0,22386

85

0,14520

0,17421

18

0,30936

0,37062

52

0,18482

0,22174

86

0,14437

0,17321

19

0,30143

0,36117

53

0,18311

0,21968

87

0,14355

0,17223

20

0,29408

0,35241

54

0,18144

0,21768

88

0,14274

0,17126

21

0,28724

0,34427

55

0,17981

0,21574

89

0,14195

0,17031

22

0,28087

0,33666

56

0,17823

0,21384

90

0,14117

0,16938

23

0,27490

0,32954

57

0,17669

0,21199

91

0,14040

0,16846

24

0,26931

0,32286

58

0,17519

0,21019

92

0,13965

0,16755

25

0,26404

0,31657

59

0,17373

0,20844

93

0,13891

0,16666

26

0,25907

0,31064

60

0,17231

0,20673

94

0,13818

0,16579

27

0,25438

0,30502

61

0,17091

0,20506

95

0,13746

0,16493

28

0,24993

0,29971

62

0,16956

0,20343

96

0,13675

0,16408

29

0,24571

0,29466

63

0,16823

0,20184

97

0,13606

0,16324

30

0,24170

0,28987

64

0,16603

0,20029

98

0,13537

0,16242

31

0,23788

0,28530

65

0,16567

0,19877

99

0,13469

0,16161

32

0,23424

0,28094

66

0,16443

0,19729

100

0,13403

0,16081

33

0,23076

0,27677

67

0,16322

0,19584

 

 

 

34

0,22743

0,27279

68

0,16204

0,19442

 

 

 

 

 

 

 

153

 

 

 

 

Приложение Г

Таблица значений χ2 распределения Пирсона

Число

 

Уровень значимости α

 

 

степеней

0,1

0,05

0,02

0,01

0,005

0,001

свободы k

 

 

 

 

 

 

1

2,706

3,841

5,412

6,635

7,879

10,827

2

4,605

5,991

7,824

9,210

10,597

13,815

3

6,251

7,815

9,837

11,345

12,838

16,268

4

7,779

9,488

11,668

13,277

14,860

18,465

5

9,236

11,070

13,388

15,086

16,750

20,517

6

10,645

12,592

15,033

16,812

18,548

22,457

7

12,017

14,067

16,622

18,475

20,278

24,322

8

13,362

15,507

18,168

20,090

21,955

26,125

9

14,684

16,919

19,679

21,666

23,589

27,877

10

15,987

18,307

21,161

23,209

25,188

29,588

11

17,275

19,675

22,618

24,725

26,757

31,264

12

18,549

21,026

24,054

26,217

28,300

32,909

13

19,812

22,362

25,472

27,688

29,819

34,528

14

21,064

23,685

26,873

29,141

31,319

36,123

15

22,307

24,996

28,259

30,578

32,801

37,697

16

23,542

26,296

29,633

32,000

34,267

39,252

17

24,769

27,587

30,995

33,409

35,718

40,790

18

25,989

28,869

32,346

34,805

37,156

42,312

19

27,204

30,144

33,687

36,191

38,582

43,820

20

28,412

31,410

35,020

37,566

39,997

45,315

21

29,615

32,671

36,343

38,932

41,401

46,797

22

30,813

33,924

37,659

40,289

42,796

48,268

23

32,007

35,172

38,968

41,638

44,181

49,728

24

33,196

36,415

40,270

42,980

45,558

51,179

25

34,382

37,652

41,566

44,314

46,928

52,620

26

35,563

38,885

42,856

45,642

48,290

54,052

27

36,741

40,113

44,140

46,963

49,645

55,476

28

37,916

41,337

45,419

48,278

50,993

56,893

29

39,087

42,557

46,693

49,588

52,336

58,302

30

40,256

43,773

47,962

50,892

53,672

59,703

 

 

 

154

 

 

 

Приложение Д

Критические точки F-pacпpeделения Фишера, α = 0,05

 

 

 

 

 

k1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k2

1

2

3

4

5

6

7

8

9

1161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 140,54

218,513 19,000 19,164 19,247 19,296 19,330 19,353 19,371 19,385

310,128 9,5521 9,2766 9,1172 9,0135 8,9406 8,8868 8,8452 8,8123

47,7086 6,9443 6,5914 6,3883 6,2560 6,1631 6,0942 6,0410 5,9988

56,6079 5,7861 5,4095 5,1922 5,0503 4,9503 4,8759 4,8183 4,7725

65,9874 5,1433 4,7571 4,5337 4,3874 4,2839 4,2066 4,1468 4,0990

75,5914 4,7374 4,3468 4,1203 3,9715 3,8660 3,7870 3,7257 3,6767

85,3177 4,4590 4,0662 3,8378 3,6875 3,5806 3,5005 3,4381 3,3881

95,1174 4,2565 3,8626 3,6331 3,4817 3,3738 3,2927 3,2296 3,1789

10 4,9646 4,1028 3,7083 3,4780 3,3258 3,2172 3,1355 3,0717 3,0204

11 4,8443 3,9823 3,5874 3,3567 3,2039 2,0946 3,0123 2,9480 2,8962

12 4,7472 3,8853 3,4903 3,2592 3,1059 2,9961 2,9134 2,8486 2,7964

13 4,6672 3,8056 3,4105 3,1791 3,0254 2,9153 2,8321 2,7669 2,7144

14 4,6001 3,7389 3,3439 3,1122 2,9582 2,8477 2,7642 2,6987 2,6458

15 4,5431 3,6823 3,2974 3,0556 2,9013 2,7905 2,7066 2,6408 2,5876

16 4,4940 3,6337 3,2389 3,0069 2,8524 2,7413 2,6572 2,5911 2,5377

17 4,4513 3,5915 3,1968 2,9647 2,8100 2,6987 2,6143 2,5480 2,4943

18 4,4139 3,5546 3,1599 2,9277 2,7729 2,6613 2,5767 2,5102 2,4563

19 4,3808 3,5219 3,1274 2,8951 2,7401 2,6283 2,5435 2,4768 2,4227

20 4,3513 3,4928 3,0984 2,8661 2,7109 2,5990 2,5140 2,4471 2,3928

21 4,3248 3,4668 3,0725 2,8401 2,6848 2,5727 2,4876 2,4205 2,3661

22 4,3009 3,4434 3,0491 2,8167 2,6613 2,5491 2,4638 2,3965 2,3419

23 4,2793 3,4221 3,0280 2,7955 2,6400 2,5277 2,4422 2,3748 2,3201

24 4,2597 3,4028 3,0088 2,7763 2,6207 2,5082 2,4226 2,3551 2,3002

25 4,2417 3,3852 2,9912 2,7587 2,6030 2,4904 2,4047 2,3371 2,2821

26 4,2252 3,3690 3,9751 2,7426 2,5868 2,4741 2,3883 2,3205 2,2655

27 4,2100 3,3541 2,9604 2,7278 2,5719 2,4591 2,3732 2,3053 2,2501

28 4,1960 3,3404 2,9467 2,7141 2,5581 2,4453 2,3593 2,2913 2,2360

29 4,1830 3,3277 2,9340 2,7014 2,5454 2,4324 2,3463 2,2782 2,2229

30 4,1709 3,3158 2,9223 2,6896 2,5336 2,4205 2,3343 2,2662 2,2107

40 4,0848 3,2317 2,8387 2,6060 2,4495 2,3359 2,2490 2,1802 2,1240

60 4,0012 3,1504 2,7581 2,5252 2,3683 2,2540 2,1665 2,0970 2,0401

120 3,9201 3,0718 2,6802 2,4472 2,2900 2,1750 2,0867 2,0164 1,9588

3,8415 2,9957 2,6049 2,3719 2,2141 2,0986 2,0096 1,9384 1,8799

155

Критические точки F-pacпpeделения Фишера, α = 0,01

 

 

 

 

 

k1

 

 

 

 

k2

1

2

3

4

5

6

7

8

9

14052,2 4999,5 5403,3 5624,6 5763,7 5859,0 5928,3 5981,1 6022,5

298,503 99,000 99,166 99,249 99,299 99,332 99,356 99,374 99,388

334,116 30,817 29,457 28,457 28,237 27,911 27,672 27,489 27,345

421,198 18,000 16,694 15,977 15,522 15,207 14,976 14,799 14,659

516,258 13,274 12,060 11,392 10,967 10,672 10,456 10,289 10,158

613,745 10,925 9,7795 9,1483 8,7459 8,4661 8,2600 8,1016 7,9761

712,246 9,5466 8,4513 7,8467 7,4604 7,1914 6,9928 6,8401 6,7188

811,259 8,6491 7,5910 7,0060 6,6318 6,3707 6,1776 6,0289 5,9106

910,561 8,0215 6,9919 6,4221 6,0569 5,8018 5,6129 5,4671 5,3511

10 10,044 7,5594 6,5523 5,9943 5,6363 5,3858 5,2001 5,0567 4,9424

11 9,6460 7,2057 6,2167 5,6683 5,3160 5,0692 4,8861 4,7445 4,6315

12 9,3302 6,9266 5,9526 5,4119 5,0643 4,8206 4,6395 4,4994 4,3875

13 9,0738 6,7010 5,7394 5,2053 4,8616 4,6204 4,4410 4,3021 4,1911

14 8,8616 6,5149 5,5639 5,0354 4,6950 4,4558 4,2779 4,1399 4,0297

15 8,6831 6,3589 5,4170 4,8932 4,5556 4,3183 4,1415 4,0045 3,8948

16 8,5310 6,2262 5,2922 4,7726 4,4374 4,2016 4,0259 3,8896 3,7804

17 8,3997 6,1121 5,1850 4,6690 4,3359 4,1015 3,9267 3,7910 3,6822

18 8,2854 6,0129 5,0919 4,5790 4,2479 4,0146 3,8406 3,7054 3,5971

19 8,1850 5,9259 5,0103 4,5003 4,1708 3,9386 3,7653 3,6305 3,5225

20 8,0960 5,8489 4,9382 4,4307 4,1027 3,8714 3,6987 3,5644 3,4567

21 8,0166 5,7804 4,8740 4,3688 4,0421 3,8117 3,6396 3,5056 3,3981

22 7,9454 5,7190 4,8166 4,3134 3,9880 3,7583 3,5867 3,4530 3,3458

23 7,8811 5,6637 4,7649 4,2635 3,9392 3,7102 3,5390 3,4057 3,2986

24 7,8229 5,6136 4,7181 4,2184 3,8951 3,6667 3,4959 3,3629 3,2560

25 7,7698 5,5680 4,6755 4,1774 3,8550 3,6272 3,4568 3,3239 3,2172

26 7,7213 5,5263 4,6366 4,1400 3,8183 3,5911 3,4210 3,2884 3,1818

27 7,6767 5,4881 4,6009 4,1056 3,7848 3,5580 3,3882 3,2558 3,1494

28 7,6356 5,4529 4,5681 4,0740 3,7539 3,5276 3,3581 3.2259 3,1195

29 7,5976 5,4205 4,5378 4,0449 3,7254 3,4995 3,3302 3,1982 3,0920

30 7,5625 5,3903 4,5097 4,0179 3,6990 3,4735 3,3045 3,1726 3,0665

40 7,3141 5,1785 4,3126 3,8283 3,5138 3,2910 3,1238 2,9930 2,8876

60 7,0771 4,9774 4,1259 3,6491 3,3389 3,1187 2,9530 2.8233 2,7185

120 6,8510 4,7865 3,9491 3,4796 3,1735 2,9559 2,7918 2,6629 2,5586

∞ 6,6349 4,6052 3,7816 3,3192 3,0173 2,8020 2,6393 2,5113 2,4073

156

Приложение Е

Критические точки распределения Стьюдента

Число

 

 

 

 

 

 

степеней

Уровень значимости α (двусторонняя критическая область)

свободы

 

 

 

 

 

 

k

 

 

 

 

 

 

0,10

0,05

0,02

0,01

0,002

0,001

 

 

 

 

 

 

 

 

1

6,31

12,7

31,82

63,7

318 3

637,0

2

2,92

4,30

6,97

9,98

22,33

31,6

3

2,35

3,18

4,64

5,84

10 22

12,9

4

2,13

2,78

3,75

4,60

7,17

8,61

5

2,01

2,57

3,37

4,03

5,89

6,86

6

1,94

2,45

3,14

3,71

5,21

5,96

7

1,89

2,36

3,00

3,50

4,79

5,40

8

1,86

2,31

2,90

3,36

4,50

5,04

9

1,83

2,26

2,82

3,25

4 30

4,78

10

1,81

2,23

2,76

3,17

4,14

4 59

11

1,80

2,20

2 72

3,11

4,03

4,44

12

1,78

2,18

2,68

3,05

3,93

4,32

13

1,77

2,16

2,65

3,01

3,85

4,22

14

1,76

2 14

2,62

2,98

3,79

4,14

15

1,75

2,13

2,6

2,95

3,75

4,07

16

1,75

2,12

2,58

2,92

3,69

4,04

17

1,74

2,11

2,57

2,90

3,65

3,96

18

1,73

2,10

2,55

2,88

3,61

3,92

19

1,73

2,09

2,54

2,86

3,58

3,88

20

1,73

2,09

2,53

2,85

3,55

3,85

21

1,72

2,08

2,52

2,83

3,53

3,82

22

1,72

2,07

2,51

2,82

3,51

3,79

23

1,71

2,07

2,50

2,81

3,49

3,77

24

1,71

2,06

2,49

2,80

3,47

3,74

25

1,71

2,06

2,49

2,79

3,45

3,72

26

1,71

2,06

2,48

2,78

3,44

3,71

27

1,71

2,05

2,47

2,77

3,42

3,69

28

1,70

2,05

2,46

2,76

3,40

3,66

29

1,70

2,05

2,46

2,76

3,40

3,66

30

1,70

2,04

2,46

2,75

3,39

3,65

40

1,68

2,02

2,42

2,70

3,31

3,55

60

1,67

2,00

2,39

2,66

3,23

3,46

120

1,66

1,98

2,36

2,62

3,17

3,37

1,64

1,96

2,33

2,58

3,09

3,29

 

 

 

157

 

 

 

Приложение Ж

Список вопросов к зачету по компьютерной обработке данных экспериментальных исследований

1 Технология анализа данных на компьютере. Модель. Моделирование. Цель моделирования. Виды моделей. Свойства моделей.

2 Аналитический и информационный подходы к моделированию. Аналитические модели. Основные этапы построения аналитической модели. Адекватность модели. Информационные модели. Модель «черный ящик».

3 Принципы анализа данных. Общая схема анализа данных. Эксперт. Гипотеза. Аналитик.

4 Основные этапы моделирования.

5 Подготовка и сбор данных для анализа. Основные принципы и методы сбора данных. Требования к данным.

6 Технологии KDD и Data Mining. Основные этапы KDD. Задачи, решаемые методами Data Mining.

7 Программные пакеты статистического анализа данных. Основные задачи, решаемые в статистических пакетах.

8 Первичный анализ данных в статистических пакетах. Основные описательные статистики: медиана, границы доверительного интервала для среднего, размах, выборочная дисперсия, стандартное отклонение, мода, стандартная ошибка, выборочный коэффициент асимметрии, стандартная ошибка коэффициента асимметрии, выборочный коэффициент эксцесса, стандартная ошибка эксцесса.

9 Первичный анализ данных в статистических пакетах. Диаграммы: диаграммы частотного распределения, столбчатая или колончатая диаграмма, круговая диаграмма, гистограмма, точечный график. Форма частотного распределения: унимодальное (симметричное, скошенное вправо, скошенное влево), бимодальное, равномерное. Нормальное распределение. Преобразование переменных: логарифмическое преобразование, преобразование квадратного корня, обратное преобразование, квадратное преобразование.

10 Первичный анализ данных в статистических пакетах. Проверка гипотезы нормальности распределения по критерием Колмогорова–Смирнова, Шапиро– Уилка и Хи-квадрат Пирсона.

11 Кластерный анализ данных. Цель кластеризации. Меры расстояния: Евклидово расстояние, расстояние Манхэттена.

12Кластерный анализ. Алгоритм k-средних.

13Кластерный анализ. Алгоритм древовидной кластеризации.

14Проблемы алгоритмов кластеризации. Выбор числа кластеров. Правила проведения кластеризации.

158

15 Классификация данных. Цель классификации. Математическая постановка задачи классификации. Методы классификации.

16 Классификация данных. Предположения при проведении классификации. Апостериорные и априорные вероятности классификации. Основные параметры: статистика Уилкса, F-статистика, расстояние Махаланобиса.

17 Линейный дискриминантный анализ Фишера. Линейные классификационные функции.

18 Канонический дискриминантный анализ. Канонические линейные дискриминантные функции.

19 Регрессионный анализ данных. Цель анализа. Основные понятия: метод наименьших квадратов, линия регрессии, уравнение регрессии, коэффициенты регрессии, стандартная ошибка оценивания, коэффициент детерминации, среднеквадратическая ошибка, коэффициент корреляции, F-критерий Фишера, проверка остатков на нормальность.

20 Методика проведения регрессионного анализа данных. Проверка адекватности регрессионной модели. Предположения об ошибке ε для регрессионной модели. Анализ остатков. Гистограмма распределения остатков: тест Колмогоро- ва-Смирнова.

21 Использование линейных и нелинейных регрессионных моделей.

22 Множественный регрессионный анализ данных. Оценка значимости множественной регрессионной модели. Методы отбора переменных в регрессионные модели: метод прямого выбора, метод обратного исключения, метод последовательного отбора, метод поиска лучших подмножеств, метод всех возможных регрессий.

23 Ограничения применения регрессионных моделей. Оценка удаленных остатков. Влияние выбросов на адекватность модели.

24 Нейронные сети. Структура и принцип работы нейронных сетей. Основные свойства нейронных сетей. Структура биологического нейрона. Искусственные нейронные сети.

25 Нейронные сети. Структура искусственного нейрона. Архитектура нейронной сети. Многослойный персептрон. Сеть радиальных базисных функций. Взвешенная сумма входов нейрона. Активационная функция нейрона.

26 Нейронные сети. Выбор числа нейронов в многослойном персептроне. Проблема переобучения нейронной сети. Контрольная кросс-проверка.

27 Обучение нейронных сетей. Локальные и глобальный минимум ошибки сети. Алгоритмы обучения нейронных сетей. Градиентные методы обучения нейронных сетей. Методы глобальной оптимизации. Метод градиентного спуска. Коэффициент скорости обучения. Алгоритм обратного распространения ошибки. Эпохи обучения. Момент.

28 Сети Кохонена. Процедуры обучения сетей Кохонена: конкуренция, объединение, подстройка весов. Обучение сети Кохонена.

159

29 Решение задачи классификации в нейронных сетях. Стратегии построения нейросетевых моделей. Обучающая подвыборка. Контрольная подвыборка. Тестовая подвыборка. Выбор функций активации. Обучение сетей. Алгоритмы обучения. Интерактивное обучение. Анализ результатов обучения: архитектура сети, процент правильной классификации сети, ошибки классификации, анализ чувствительности, описательные статистики, лифтовые карты.

30 Множественный регрессионный анализ данных в нейронных сетях. Стратегии построения нейросетевых моделей. Обучающая подвыборка. Контрольная подвыборка. Тестовая подвыборка. Выбор числа нейронов на скрытом слое. Выбор функций активации. Обучение сетей. Алгоритмы обучения. Интерактивное обучение. Анализ результатов обучения: архитектура сети, обучающая производительность, контрольная производительность, тестовая производительность, ошибка обучения, алгоритм обучения.

160