Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
2
Добавлен:
24.03.2024
Размер:
9.76 Mб
Скачать

183

работоспособности организма повышается уровень потребления кислорода.

Табл. 2

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ В ОЦЕНКЕ ЖИЗНЕННО ВАЖНЫХ ПОКАЗАТЕЛЕЙ ЧЕЛОВЕКА

С.О. Куликов Научный руководитель –Булаев М.П., канд. техн. наук, доцент

Прохорова Е.В., ассистент Рязанский государственный медицинский университет

им. акад. И.П. Павлова

Две разные по числу группы испытуемых студентов выполняли комплекс упражнений по физкультуре. Показателем успешности служило количество выполненных упражнений. В первой группе – с дополнительной мотивацией – 3,17,8,16,15,19,13, во второй группе – без дополнительной мотивации–10,12,18,11,7,6,9,14,15,20. Испытуемые меньшей по численности группы получали дополнительную мотивацию в виде музыкального сопровождения и четких команд тренера. Необходимо узнать – влияет ли дополнительная мотивация на количество выполненных упражнений? Для решения данной задачи применялся U критерий Вилкоксона – Манна–Уитни. Полученные данные необходимо объединить и представить как один упорядоченный ряд в виде таблицы:

Группа с дополни-

Группа без допол-

Инверсии

Инверсии

тельной мотиваци-

нительной мотива-

X/Y

Y/X

ей Х

ции Y

 

 

 

 

 

 

3

 

0

 

5

 

0

 

184

 

6

 

2

 

7

 

2

8

 

2

 

 

9

 

3

 

10

 

3

 

11

 

3

 

12

 

3

13

 

6

 

 

14

 

4

 

15

 

4

16

 

8

 

17

 

8

 

 

18

9

6

19

 

 

 

 

20

 

7

Суммы инверсии

 

33

37

U= min(U(X/Y) U(Y/X)=33. Для уровней P=0.05 и P=0.01 оп-

ределяем по таблице, где n1=7 n2=10.

В принятой форме записи это выглядит так: U=

Соответствующая ось значимости имеет вид

Зона

0.05

0.01

Зона

не значимости

 

 

значимости

Umin

-17

 

11

-33

 

Полученное значение U попало в зону не значимости, следовательно, принимается гипотеза H0, а гипотеза о наличии различия отклоняется. Таким образом, мы можем утверждать, что дополнительная мотивация не приводит к статистически значимому увеличению количества выполненных упражнений у испытуемых студентов.

185

СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ В ЗАДАЧАХ МЕДИЦИНЫ

М.К. Богомолов Научный руководитель - Булаев М.П., канд. техн. наук, доцент

Назарова О.А., старший преподаватель Рязанский государственный медицинский университет

им. акад. И.П. Павлова

Стохастическая аппроксимация (от греч. stochastikos - умеющий угадывать, проницательный и лат. approximo - приближаюсь), метод решения широкого класса задач статистического оценивания, при котором каждое следующее значение оценки получается в виде основанной лишь на новом наблюдении поправки к уже построенной оценке. Основными чертами, обусловившими популярность стохастическая аппроксимация в теоретических и прикладных работах, явились её непараметричность (применимость при весьма скудной информации об объекте наблюдения) и рекуррентность (простота пересчёта оценки при поступлении нового результата наблюдений). Стохастическая аппроксимация применяется во многих прикладных задачах теории управления, обучения, в задачах техники, биологии, медицины. Стохастическая аппроксимация описана в 1951 американскими статистиками Г. Роббинсом и С. Монро.

Физи-

Относи-

 

 

Ди-

Форсиро-

 

Динамо-

намо-

ческая

тельное

 

мет-

ванная

рабо-

потребле-

Окружность грудной

метрия

рия

жизнен-

тоспо-

ние

клетки X2

кистевая

ста-

ная ем-

соб-

кислорода

 

X3

кость лег-

ность Y

X1

 

 

новая

ких X5

 

 

 

 

X4

 

725

44,6

80

25

68

3,45

529

31,7

89

23

60

4,46

463

43,1

78

27

58

3,47

460

38,9

75

24

40

3,27

460

40,4

75

18

50

4,34

500

34,8

81

21

50

3,65

551

38,8

77

22

58

3,91

381

30

89

19

53

3,08

816

46,4

78

20

68

3,61

533

45,7

83

22

50

3,49

633

39,5

85

26

70

4,28

186

762

38

90

22

62

3,87

517

38,1

88

22

40

3,81

435

35,5

85

31

80

4,25

629

33,5

91

32

60

2,66

700

40,1

82

26

74

4,2

612

36,7

82

26

48

3,91

550

38,8

86

28

56

3,11

567

39,4

85

16

58

3,47

717

42

81

37

58

4,18

Стохастическая связь определяет связь между зависимой переменной (результативный признак) и независимой переменной, а также отдельными случайными факторами, подвержёнными случайному разбросу, следовательно, они не могут быть предсказаны достаточно точно, а только с некоторой долей вероятности.

Аналитическое выражение стохастической связи в общем виде представляется следующим уравнением:

где yi f(xi) – доля результативного признака, образованная под воздействием известных факторных признаков, находящихся в стохастической связи с признаком; i - доля результативного признака, образо-

ванная под воздействием случайных факторов.

Любую стохастическую связь можно представить в виде частных случаев – корреляционной и регрессионной связи.

Обработаем эмпирические данные (медицинские показатели) из вышеприведенной таблицы с помощью MS Excel. Число зарегистрированных значений по каждому признаку – 20, а число независимых факторов – 5.

Для оценки степени взаимосвязи между выборками, найдем коэффициент корреляции.

 

PWC17

МПК/кг

ОГК

ДМК

ДМС

Фжел

 

 

 

 

 

 

 

PWC17

1

 

 

 

 

 

МПК/кг

0,477603

1

 

 

 

 

ОГК

0,031223

-0,58379

1

 

 

 

ДМК

0,20512

0,00502

0,118103

1

 

 

ДМС

0,418965

0,118223

0,138537

0,305676

1

 

Фжел

0,105315

0,054045

-0,17326

0,025324

0,29819

1

Проанализировав данные, можно говорить о том, что имеется строгая прямая пропорциональная зависимость только между физической работоспособностью (Y) и относительным потреблением кисло-

187

рода (X1) и динамометрией становой (X4), между другими параметрами линейную взаимосвязь выявить не удалось, т.к. r<0,4. Связь между факторами X1 и X4 – слабая прямая и незначимая. Учитывая, что коэффициенты с уровнем значимости более 0,5 включать в модель нецелесообразно, и исключив их (коэффициенты при X3 и X5), получим уравнение линейной регрессии в следущем виде:

Y=1187,014885+18,42269345X1+9,470607257X2+2,750426521X4

и связанные с ним статистические характеристики:

Регрессионная статистика

Множественный R

 

 

 

0,677310714

R-квадрат

 

 

 

 

0,458749804

Нормированный R-квадрат

 

 

0,265446162

Наблюдения

 

 

 

 

20

Дисперсионный анализ

 

 

 

 

df

SS

MS

F

Значимость F

Регрессия

5

123528,4771

24705,69543

2,373208285

0,092972622

Остаток

14

145743,5229

10410,25163

 

 

Итого

19

269272

 

 

 

 

Коэффициенты

t-статистика

P-Значение

Y-пересечение

-1187,014885

-1,587567262

0,134706168

Переменная X 1

18,42269345

2,667122548

0,01840313

Переменная X 2

9,470607257

1,507171279

0,153996413

Переменная X 3

1,882864477

0,384894376

0,706099612

Переменная X 4

2,750426521

1,056739971

0,308524916

Переменная X 5

15,48112464

0,293467755

0,773470011

Регрессионные коэффициенты представляют независимые вклады каждой независимой переменной в предсказание зависимой переменной.

В столбце P-Значение приводится достоверность отличия соответствующих коэффициентов от нуля. В случае, когда Р>0,05, коэффициент может считаться нулевым; это означает, что соответствующая независимая переменная практически не влияет на зависимую переменную. В нашем случае имеется пять независимых переменных, из которых на Y влияет только переменная X1, в остальных случаях критерий Фишера незначим и влияние факторов на физическую работоспособность доказать не удалось.

Приводимое значение R-квадрат характеризует то, с какой степенью точности полученное регрессионное уравнение аппроксимирует

188

исходные данные (значение R-квадрата близкое к 1.0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных). Коэффициент детерминации в нашем случае равен 0,4587498. Это значение непосредственно интерпретируется следующим образом: изменчивость значений переменной Y около линии регрессии составляет 1-0.46 от исходной дисперсии; другими словами, 46% от исходной изменчивости могут быть объяснены, а 54% остаточной изменчивости остаются необъясненными. В идеале желательно иметь объяснение если не для всей, то хотя бы для большей части исходной изменчивости.

Степень зависимости двух или более предикторов (переменных X) с зависимой переменной Y выражается с помощью коэффициента множественной корреляции R. По определению он равен корню квадратному из коэффициента детерминации. Это неотрицательная величина, принимающая значения между 0 и 1. Для интерпретации направления связи между переменными смотрят на знаки (плюс или минус) регрессионных коэффициентов. Обычно если коэффициент положителен, то связь этой переменной с зависимой переменной положительна; если коэффициент отрицателен, то и связь носит отрицательный характер например, чем меньше число учащихся в классе, тем выше средние оценки по тестам). Конечно, если коэффициент равен 0, связь между переменными отсутствует.

ФАКТОРНЫЙ АНАЛИЗ ПРОГРАММЫ STATISTICA ПРИ ОБРАБОТКЕ МЕДИЦИНСКИХ ДАННЫХ

М.П. Булаев, М.А. Шмонова Рязанский государственный медицинский университет

им. акад. И.П. Павлова

В типичном клиническом исследовании число анализируемых признаков бывает достаточно велико. Большая размерность признакового пространства не только приводит к увеличению полноты и глубины исследования проблемы, но и зачастую затушевывает имеющиеся закономерности. В таких случаях применяют методы факторного анализа. Задачами факторного анализа являются сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, то есть классификация переменных. Поэтому факторный анализ используется как метод сокращения данных или как метод структурной классификации.

189

Рассмотрим применение методов факторного анализа на конкретном примере обработки медицинских данных.

Постановка задачи: 20 случайным образом выбранных девушек, в возрасте от 17 до 22 лет, наблюдались по 8 признакам. Учитывались следующие показатели:

PWC 170 – Общая физическая работоспособность по тесту PWC 170 (в килограммометрах) – кгм;

МПК – Максимальное потребление кислорода (в 1 мин);

Рост – Рост (в см);

Масса – Масса (в кг);

ОГК пауз – Окружность грудной клетки (в паузе) – в см;

ДМС – Динамометрия становая (в кг);

Пос – Пиковая объёмная скорость выдоха;

Сос – Средняя объёмная скорость выдоха.

Данные наблюдений приведены в табл. 1.

Табл. 1

№, п/п

PWC170

МПК

Рост

Масса

ОГК

ДМС

пос

сос

пауз

1.

816

2627

170

59,2

80

80

6,25

5,04

2.

463

2027

160

57

85

58

9,43

7,8

3.

867

2714

167

49,1

76

58

7,21

4,51

4.

625

2303

160

63

88

56

7,44

5,61

5.

475

2048

162

51

78

62

6,65

4,85

6.

700

2430

165

57

83

54

8,22

6,31

7.

408

1934

162

58

85

60

9,43

4,81

8.

800

2600

157

50

77

58

5,83

4,65

9.

467

2034

167

65,4

84

50

6,04

4,92

10.

538

2155

177

78

92

50

8,38

5,91

11.

551

2177

163

56,7

81

62

7,48

5,99

12.

767

2544

170

53,8

79

48

7,42

6,34

13.

490

2073

163

68

89

50

8,67

6,12

14.

388

1900

172

58

82

70

7,24

6,37

15.

566

2202

169

65,7

81

60

8,42

6,8

16.

850

2685

172

60

89

58

7,94

6,13

17.

484

2063

153

55,5

84

50

7,41

5,25

18.

668

2376

169

54,6

81

38

6,54

4,75

19.

640

2328

164

64

88

66

7,49

5,62

20.

555

2184

164

50,8

75

60

5,42

4,44

190

Требуется: провести факторный анализ полученных данных. Решение выполнено с помощью ППП Statistica 8.0.

Рис. 1 - Корреляционная матрица данных

На рис. 1 представлена корреляционная матрица, из которой следует, что общая физическая работоспособность имеет функциональную связь с МПК. Отмечается слабая прямая связь с ростом и ДМС и обратная с массой, ОГК, пос, сос. Полученная корреляционная матрица открывает путь к факторному анализу её внутренней структуры с помощью метода главных компонент.

Рис. 2 - Таблица собственных значений

На рис. 2 показана таблица собственных значений. В первом столбце таблицы даны собственные значения, во втором – процент общей дисперсии, соответствующий этим собственным значениям, далее кумулятивные собственные значения и кумулятивный процент дисперсии. Как можно видеть из таблицы, первый фактор (значение 1) объясняет 39,7 % процентов общей дисперсии, фактор 2 (значение 2) – 22,6% процентов, фактор 3 (значение 3) – 13% процентов. Таким образом, указанные факторы объясняют 75,3% всей дисперсии, а значит их анализом можно ограничиться.

Из факторной матрицы (рис. 3) видно, что Фактор 1 и Фактор 3 отвечают за антропометрические показатели и показатели спирометрии. Фактор 2 можно интерпретировать как физическое здоровье человека. Глядя на эти результаты, можно сделать следующий вывод: выделенные факторы имеют влияние на величину роста человека, и чем

191

большее значение имеют антропометрические показатели, тем большим ростом обладает человек.

Рис. 3 - Таблица факторных нагрузок

На рис. 4 представлена графическая интерпретация выделенных факторов.

Рис. 4 - Факторное решение после поворота осей методом

Varimax normalized

192

СТАТИСТИКА 8.0 В ЗАДАЧАХ ИССЛЕДОВАНИЯ БИОМЕДИЦИНСКИХ ПОКАЗАТЕЛЕЙ ЧЕЛОВЕКА

М.П. Булаев, И.С.Маркова Рязанский государственный медицинский университет

им. акад. И.П. Павлова

Одна из важных задач медицинского исследования – изучение связи между несколькими биометрическими показателями человека. Она решается с помощью коэффициентов корреляции. Корреляция – это описание взаимосвязи количественных или порядковых признаков. Мера корреляции показывает, в какой степени изменение значения одного признака сопровождается изменением значения другого признака в данной выборке.

Значения коэффициента корреляции изменяются в интервале от –1 до 1. Принята (условно) следующая классификация силы корреляции в зависимости от значения коэффициента r:

|r|≤0,25 – слабая корреляция; 0,25<|r|<0,75 – умеренная корреляция; |r|≥0,75 – сильная корреляция.

Для исследования взаимосвязи нормально распределенных количественных признаков будем использовать параметрический корреляционный анализ Пирсона.

Реализацию этого метода в программе STATISTICA 8.0 рассмотрим на следующем примере.

Пример. У 14 человек измерили биомедицинские параметры, а именно максимальное потребление кислорода (на 1 кг веса тела) в 1 мин (МПК), жизненную емкостью легких (жел), рост и массу тела. Требуется установить связь между этими параметрами. Результаты замеров приводятся ниже.

 

 

 

 

Табл. 1.

№ п/п

МПК/кг

Жел/литр

Рост/см

Масса/кг

1

40,4

3,92

169

69,7

2

31,1

3,97

161,5

65,1

3

27,4

5,18

176

89,8

4

35,69

3,28

156

57

5

35,3

4,05

164

59,5

6

44,8

4,82

175

60

7

29,8

4,65

176

68

8

26,2

4,33

165

89