Добавил:
Преподаватель Колледжа информационных технологий Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Построение и исследование моделей краткосрочного прогнозирования гликемии у больных сахарным диабетом

.pdf
Скачиваний:
4
Добавлен:
08.05.2022
Размер:
4.69 Mб
Скачать

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

федеральное государственное бюджетное образовательное учреждение высшего образования

«Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ» (КНИТУ-КАИ)

Институт Компьютерных технологий и защиты информации Кафедра Систем информационной безопасности

Направление подготовки: 09.04.01 «Информатика и вычислительная техника» Образовательная программа/профиль: Компьютерный анализ и интерпретация данных

К защите допустить Зав. каф. СИБ

____________ / И.В. Аникин / «____» _____________ 2021 г.

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА Магистерская диссертация

на тему «Построение и исследование моделей краткосрочного прогнозирования гликемии у больных сахарным диабетом»

ОБУЧАЮЩИЙСЯ Мингалиев Заид Зульфатович

__________

(фамилия, имя, отчество)

(подпись)

РУКОВОДИТЕЛЬ д.т.н., доцент Катасёв Алексей Сергеевич

__________

(ученая степень, звание, фамилия, имя, отчество)

(подпись)

Казань 2021

Construction and study of models of short-

term prediction of glycemia in patients

with diabetes mellitus

By

Mingaliev Zaid Zulfatovich

Submitted to the Department of Information Security Systems

in partial fulfillment of the Requirements for the degree of MASTER OF SCIENCE

at the

Federal State Budgetary Educational Institution of Higher Education

«Kazan National Research Technical University named after A.N.Tupolev-KAI»

(KNRTU-KAI)

Author

 

Mingaliev Zaid Zulfatovich

 

 

 

 

 

(signature)

 

 

Supervisor

 

Aleksey Sergeevich Katasev

 

 

 

 

 

(signature)

 

Ph.D., Associate Professor, Infor-

 

 

 

mation Security Systems Department

Certified by

 

Igor V. Anikin

 

 

 

 

 

(signature)

 

DSc, Professor, Head of Information

 

 

 

Security Systems Department

date

 

 

 

Kazan 2021

2

АННОТАЦИЯ Тема: «Построение и исследование моделей краткосрочного прогнозиро-

вания гликемии у больных сахарным диабетом».

Объем выпускной квалификационной работы составляет 142 страницы, на которых размещено 84 рисунка и 5 таблиц. В процессе написания диплома ис-

пользовалось 25 литературных источников.

Представлены модели краткосрочного прогнозирования уровня сахара в крови у больных сахарным диабетом, основанные на обучении нейронной сети исходными данными по содержанию углеводов, инсулина и глюкозы в крови че-

ловека.

Предметом исследования является нейронная сеть типа «многослойный персептрон», нелинейная авторегрессионная нейронная сеть с внешним входом и модель прогнозирования методом множественной линейной регрессии.

Выпускная квалификационная работа включает в себя введение, четыре главы, заключение и два приложения.

3

ABSTRACT

The theme of the final qualification work: "Construction and research of models of short-term forecasting of glycemia in patients with diabetes mellitus."

The volume of the final qualifying work is 142 pages, which contain 84 figures and 5 tables. In the process of writing the diploma, 25 literary sources were used.

Models of short-term prediction of blood sugar levels in patients with diabetes mellitus are presented, based on training the neural network with initial data on the content of carbohydrates, insulin and glucose in human blood.

The subject of the research is a neural network of the “multilayer perceptron” type, a nonlinear autoregressive neural network with an external input and a prediction model by the method of multiple linear regression.

The final qualifying work includes an introduction, four chapters, a conclusion and two appendices.

4

СОДЕРЖАНИЕ

 

ВВЕДЕНИЕ..................................................................................................................

7

ГЛАВА 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ..................................................

11

1.1. Сахарный диабет первого типа.........................................................................

11

1.2. Проблема прогнозирования гликемии .............................................................

11

1.3. Понятие и характеристики временных рядов .................................................

13

1.4. Методы анализа временных рядов ...................................................................

16

1.5. Модели прогнозирования временных рядов ...................................................

23

1.6. Сравнительный анализ моделей прогнозирования.........................................

25

1.7. Основные положения теории искусственных нейронных сетей ..................

27

1.8. Модель биологического нейрона .....................................................................

28

1.9. Модель искусственного нейрона......................................................................

29

1.10. Многослойный персептрон .............................................................................

32

1.11. Нелинейная авторегрессионная нейронная сеть...........................................

37

1.12 Множественная линейная регрессия...............................................................

38

1.13 Выводы ...............................................................................................................

39

ГЛАВА 2. ОПИСАНИЕ И ПОДГОТОВКА ИСХОДНЫХ ДАННЫХ ДЛЯ

 

АНАЛИЗА..................................................................................................................

40

2.1. Описание исходных данных .............................................................................

40

2.2. Этапы анализа данных.......................................................................................

41

2.3. Разработка синтаксического анализатора .......................................................

43

2.4. Подготовка исходных данных к анализу.........................................................

47

2.5. Формирование обучающей выборки для построения моделей.....................

53

2.6. Формирование тестовой выборки данных.......................................................

58

2.7. Выводы ................................................................................................................

62

ГЛАВА 3. ПОСТРОЕНИЕ МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ

 

ГЛИКЕМИИ...............................................................................................................

63

3.1. Выбор средства разработки...............................................................................

63

3.2. Разработка модели множественной линейной регрессии и оценка точности

прогнозирования гликемии на обучающей выборке.............................................

65

5

 

3.3. Разработка структуры нейросетевой модели................................................

72

3.4. Построение нейросетевых моделей и оценка точности прогнозирования

гликемии на обучающих данных.............................................................................

79

3.5. Выводы............................................................................................................

100

4. ОЦЕНКА АДЕКВАТНОСТИ И СРАВНЕНИЕ МОДЕЛЕЙ ........................

101

4.1. Оценка обобщающей способности модели линейной регрессии при

 

прогнозировании гликемии на тестовых данных ................................................

101

4.2. Оценка обобщающей способности модели многослойного персептрона при

прогнозировании гликемии на тестовых данных ................................................

104

4.3. Оценка обобщающей способности модели нелинейной авторегрессионной

нейронной сети с внешним выходом при прогнозировании гликемии на

 

тестовых данных .....................................................................................................

108

4.4. Влияние типа и структуры построенных моделей на точность

 

прогнозирования .....................................................................................................

112

4.5. Выводы ..............................................................................................................

113

ЗАКЛЮЧЕНИЕ .......................................................................................................

114

CONCLUSION .........................................................................................................

115

СПИСОК ЛИТЕРАТУРЫ.......................................................................................

116

Приложение 1. Фрагмент исходных данных........................................................

119

Приложение 2. Листинги программ ......................................................................

122

6

ВВЕДЕНИЕ

Математическое моделирование биологических процессов (в частности,

острых и хронических заболеваний человека) представляет глубокую фундамен-

тальную проблему, стоящую на стыке медицины, биологии и математики. Одним из таких хронических заболеваний является сахарный диабет. От разработки адекватных математических моделей во многом зависят глобальные успехи в его лечении, профилактике и организации системы оказания помощи.

Сахарный диабет как глобальная медико-социальная проблема современ-

ности крайне подробно рассматривается с позиции математического моделиро-

вания уже много десятилетий. Все принципы интенсифицированной инсулино-

терапии ориентированы на эффективное прогнозирование и управление концен-

трацией глюкозы в крови. Современные технологические достижения (непре-

рывный мониторинг гликемии в режиме реального времени, сверхточное дози-

рование инсулина инсулиновой помпой), а также успехи в математическом мо-

делировании и созданные с его помощью алгоритмы автоматического управле-

ния инфузией инсулина открывают реальную возможность для создания так называемой искусственной поджелудочной железы – инсулиновой помпы, само-

стоятельно управляющей введением инсулина с учетом изменения гликемии в режиме реального времени по принципу «замкнутого контура». Реализация этой крайне перспективной задачи современной медицинской инженерии и киберне-

тики неразрывно связана с использованием математического моделирования.

Таким образом, актуальной задачей, решаемой в выпускной квалификаци-

онной работе, является построение и исследование моделей краткосрочного про-

гнозирования гликемии для больных сахарным диабетом.

Объект исследования: гликемия у больных сахарным диабетом.

Предмет исследования: модели и методы краткосрочного прогнозирования гликемии.

Цель работы: повышение эффективности краткосрочного прогнозирова-

ния гликемии у больных сахарным диабетом на основе построения и исследова-

ния моделей краткосрочного прогнозирования. 7

Достижение поставленной цели потребовало решения следующих задач:

1)анализ предметной области;

2)описание и подготовка исходных данных для анализа временных рядов;

3)построение модели прогнозирования на основе множественной линей-

ной регрессии; 4) построение модели прогнозирования на основе искусственной нейрон-

ной сети типа «многослойный персептрон»;

5) построение модели прогнозирования на основе нелинейной авторегрес-

сионной нейронной сети с внешним выходом; 6) сравнительный анализ эффективности построенных моделей прогнози-

рования.

Методы исследования. Для решения обозначенных задач использованы ме-

тоды нейросетевого и регрессионного моделирования.

Достоверность полученных результатов. Предложенные в работе ориги-

нальные модели прогнозирования теоретически обоснованы и не противоречат известным положениям других авторов. Достоверность полученных результатов обеспечена математически строгим выполнением расчетов, подтверждена иссле-

дованиями и результатами практического использования.

Научная новизна работы заключается в разработке:

1) автоматического синтаксического анализатора данных биологического мониторинга;

2) модели временного ряда для краткосрочного прогнозирования с целью учета периодов «голодания» и отсутствия дополнительных инъекций инсулина.

Теоретическая значимость работы заключается в разработке математиче-

ского обеспечения в виде эффективных моделей краткосрочного прогнозирова-

ния гликемии.

Практическая ценность работы заключается в разработке моделей прогно-

зирования гликемии для дальнейшего ее интегрирования в серверный модуль-

расширение для обеспечения управления искусственной поджелудочной желе-

зой.

8

Пути дальнейшей реализации.

Разработанные математические модели планируются использовать в со-

ставе программного комплекса искусственной поджелудочной железы в каче-

стве прогностической модели для расчета потребной дозы инсулина.

На защиту выносятся следующие результаты:

1) автоматический синтаксический анализатор данных биологического мо-

ниторинга;

2)модель прогнозирования гликемии на основе искусственной нейронной сети типа «многослойный персептрон» для прогнозирования гликемии;

3)модель прогнозирования гликемии на основе нелинейной авторегресси-

онной нейронной сети для прогнозирования гликемии; 4) модель прогнозирования гликемии на основе метода множественной ли-

нейной регрессии.

Структура и объем выпускной квалификационной работы. Выпускная ква-

лификационная работа изложена на 142 страницах машинописного текста, со-

держит 84 рисунка, 5 таблиц, состоит из введения, четырех глав, заключения и списка литературы из 25 наименований на 3 страницах.

Сведения о личном вкладе автора. Личный вклад автора состоит в разра-

ботке моделей краткосрочного прогнозирования гликемии на основе многофак-

торного временного ряда. Кроме того, содержание работы и все представленные в ней результаты получены лично автором.

Во введении рассматривается проблема разработки прогностических мо-

делей, встраиваемых в алгоритмы работы искусственной поджелудочной железы

устройства, позволяющего автоматически управлять гликемией.

Впервой главе рассматриваются общие вопросы прогнозирования глике-

мии у больных сахарным диабетом первого типа, проводится классификация и характеристика временных рядов, выполняется сравнительный анализ эффек-

тивности моделей прогнозирования временных рядов для получения точных прогнозов в контексте решаемой задачи на базе многопараметрических времен-

ных рядов.

9

Во второй главе дается характеристика исходных данных для дальнейшего их использования в прогностических моделях. Описывается принцип построе-

ния автоматического синтаксического анализатора данных биологического мо-

ниторинга, осуществляющий предварительную подготовку данных для дальней-

шего построения адекватных прогностических нейросетевых моделей, и процесс формирования обучающей и тестовой выборки.

В третьей главе обосновывается выбор инструментальных средств для про-

гнозирования гликемии, разрабатывается структура нейросетевой модели. Опи-

сываются параметры и результаты обучения модели линейной регрессии и нейросетевых моделей, производится оценка точности прогнозирования на обу-

чающих моделях.

В четвертой главе производится оценка точности прогнозирования на те-

стовых данных и влияния структуры нейросетевой модели на точность прогно-

зирования. На основании дополнительных экспериментов производится сравни-

тельный анализ точности нейросетевого прогнозирования с моделью линейной регрессии.

В заключении сформулированы основные научные и практические резуль-

таты работы, намечены направления перспективных исследований.

Выпускная квалификационная работа выполнена на кафедре систем инфор-

мационной безопасности федерального государственного бюджетного образова-

тельного учреждения высшего образования «Казанский национальный исследова-

тельский технический университет им. А.Н. Туполева-КАИ» (КНИТУ-КАИ).

Выражаю благодарность за оказанную поддержку при написании выпуск-

ной квалификационной работы д.т.н., профессору кафедры ПМИ Новиковой Светлане Владимировне и д.т.н., профессору кафедры СИБ Катасёву Алексею Сергеевичу.

10