Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Диагностика_заболеваний_методами_теории_вероятностей_Жмудяк_М_Л

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
2.28 Mб
Скачать

Em

=

p j

 

(2.6.2)

 

ij

 

pij

 

 

 

 

характеризует роль i -го ДП

среди

m других признаков в величине p j

величине вероятности j -й болезни.

 

 

 

Можно рассчитать вероятность j -й болезни, используя только тот i -й ДП,

влияние которого анализируется. (Т.е. использован только один ДП!) Найденная

таким расчетом вероятность, которую обозначим

pij , характеризует роль i -го ДП

(в вычисленной вероятности болезни) отдельно, вне влияния других ДП.

 

Соотнесем pij со средней вероятностью остальных болезней, определенной по

тому же (по анализируемому) ДП:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Eij =

 

 

pij

 

для k j.

 

 

 

 

 

 

 

 

 

(2.6.3)

 

 

 

 

 

 

 

 

 

 

1

 

n1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pij

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1 k =1

 

 

 

 

 

 

 

 

 

 

 

 

 

Для двух болезней оценка (2.6.3) роли отдельного ДП вырождается в отношение

E

 

=

 

p1i

=

 

 

π1q1( aoit

)

 

 

при p ( at

) p

2

( at

 

 

),

(2.6.4а)

 

 

pi

 

 

 

)

 

 

i1

 

 

 

 

 

 

π

2

q

2

( at

 

1

oi

 

 

 

 

oi

 

 

 

 

 

 

2

 

 

 

 

 

 

oi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E

 

=

 

p2i

 

=

 

 

π2q2( aoit

)

при p ( at

) < p

2

( at

 

 

).

(2.6.4б)

 

 

pi

 

)

 

 

 

i2

 

 

 

 

 

 

π q ( at

 

 

1

oi

 

 

 

 

oi

 

 

 

 

 

1

 

 

 

 

 

1

1

oi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Еще более простой оценкой является отношение вероятностей или плотностей

вероятностей ДП при двух рассматриваемых болезнях:

 

 

 

 

 

 

 

 

 

 

 

E

 

=

 

p1i

 

 

=

 

q1( aoit

)

 

при q ( at

) q

2

( at

),

(2.6.5а)

 

 

 

 

 

 

 

 

 

i1

 

 

 

p2i

 

 

q2( aoit

)

 

 

1

oi

 

 

 

oi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E

=

 

 

p2i

 

=

q2( aoit

)

при q ( at

) < q

2

( at

 

).

(2.6.5б)

 

 

 

 

 

)

 

 

 

 

i2

 

 

 

 

pi

 

 

 

q ( at

 

 

1 oi

 

 

 

 

oi

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

1

 

oi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Последняя оценка реализована в диагностической компьютерной программе, разработанной авторами. (Хотя оценка (2.6.2) более представительна.) Примеры оценки по соотношениям (2.6.5a,b) приведены в разделе 4.2 и в приложении 2, в рубрике «степень влияния анализа». Для каждой болезни указываются только те

71

величины Eij , которые больше единицы. Это довольно удобно для анализа причин

проведенной диагностики, поскольку, так сказать, аргументы в пользу конкурирующих болезней удалены из информации о данной болезни и размещены в информации о болезнях – конкурентах.

2.7 Модельные болезни и исследование на них теоретических вопросов

Создать, придумать искусственные, модельные болезни авторы предлагают [115, 120], как минимум, с тремя целями. Первая – выяснить влияние на диагностику различных факторов, так сказать, в чистом виде и в различных вариантах. Имеется в виду, что реально наблюдаемые факторы: набор (соотношение) в базе данных больных различными болезнями, собранные для реальных больных и болезней анализы и другие диагностические признаки и т.п. – содержат естественные шум и конкретность, что затрудняет и ограничивает анализ. Вторая цель – получить тестовые примеры для проверки эффективности различных методов диагностики. Модельные тестовые примеры в отличие от реальных данных не имеют ограничений на объём данных, т.е. можно смоделировать любое число больных, и не содержат ошибок диагностики и ошибок сбора данных. Третья цель – выяснить ряд теоретических вопросов, поскольку характер факторов, ДП и число и вид модельных болезней при моделировании последних можно выбрать так, чтобы прояснить возникающие при диагностике вопросы. Например, на модельных болезнях можно выяснить принципы объединения непрерывных и дискретных ДП в многомерный ДП и эффективность диагностики с помощью многомерных ДП.

При этом необходимо обратить внимание на то, как смоделировать независимые и зависимые диагностические признаки, чтобы исследовать проблемы учета взаимозависимости признаков при диагностике.

Среди вопросов, которые можно прояснить на моделях, – вопрос о том, начиная с какого количества данных (объема базы данных) объединение диагностических признаков в многомерные имеет преимущество перед использованием одномерных диагностических признаков как независимых. Планируется выяснить, какие именно диагностические признаки рациональнее объединять в многомерный ДП и т.д.

72

Учитывая это и другие перечисленные выше цели, были предложены модели болезней. Одна из самых простых моделей – однопризнаковая, т.е. такая, при которой состояние пациентов при всех болезнях характеризуется одним диагностическим признаком.

Будем рассматривать однопризнаковые болезни. Диагностические признаки считаем функционально связанными со временем, отсчитываемым от начала заболевания. Модель болезни задаем зависимостью математического ожидания диагностического признака от времени. Под независимым понимаем диагностический признак, значение которого (при заданных математическом ожидании и распределении) находится как случайная величина. В качестве модели нулевого уровня сложности можно предложить модель одной болезни с независимым диагностическим признаком, математическое ожидание которого постоянно или изменяется линейно. Такая модель интересна только для контроля правильности реализации.

Модель следующего (первого) уровня сложности – это модель с двумя болезнями. Значение (единственного) диагностического признака при каждой болезни постоянно и индивидуально для данной болезни, т.е. значения диагностического признака при болезнях – разные. Протекание таких болезней (зависимость математического ожидания величины диагностического признака от времени) изображено на рисунке 2.7.1 линиями. По оси абсцисс – оси времени – могут быть отложены дни от начала заболевания.

 

1

 

 

Болезнь 1

можно

для

удобства

 

 

 

называть

«большое

 

значение

признака

 

 

 

 

 

 

 

 

 

 

 

диагностического

признака»,

или

 

 

 

«большая температура»,

а болезнь

2 –

величина

2

 

 

«маленькое

значение диагностического

 

 

 

признака», или «маленькая температура».

 

 

t (дни)

Для

конкретного

пациента,

 

 

страдающего

болезнью

1,

величину

 

Рис. 2.7.1

 

 

 

 

 

 

диагностического

признака

можно

находить по известному (изображенному на рисунке линией 1) математическому

73

ожиданию диагностического признака и какому-либо, например, нормальному распределению. Таким образом, значение диагностического признака определяется в первый день заболевания. Согласно принятой модели постоянного диагностического признака, в остальные дни заболевания значение диагностического признака у этого пациента такое же, как в первый день. Величина диагностического признака для конкретного пациента в рассматриваемом варианте модельной болезни изображена на рис. 2.7.1 пунктиром.

Определение значения диагностического признака для пациента, страдающего второй болезнью, отличается только использованием другой величины математического ожидания диагностического признака. (За исключением случаев специального исследования разных распределений для болезней.)

В рассмотренных болезнях – болезнях «постоянного диагностического признака» - диагностические признаки являются зависимыми. Это следует из предсказуемости значений диагностических признаков: зная величину диагностического признака в один из дней, можно предсказать величину диагностического признака в любой день.

Модели постоянных диагностических признаков предложены, в основном, для выяснения эффективности усреднения диагностических признаков по сравнению с использованием их как независимых.

Следующий по сложности случай, - когда при одной из болезней диагностический признак линейно изменяется, а при другой – постоянен. Такой случай, точнее, изменение математического ожидания диагностического признака в

функции времени (дней с начала заболевания), изображен на рис. 2.7. 2.

 

 

 

 

 

Первую из

изображенных

на

признака

 

 

рис. 2.7.2 болезней

можно

называть

1

 

«изменяющийся

диагностический

 

 

признак» (пациент болен изменяющимся

величина

 

 

диагностическим признаком),

вторую –

2

 

постоянный диагностический признак.

 

 

 

 

 

 

 

 

Рис. 2.7.2

t (дни)

Величины

переменного

 

 

диагностического

признака

для

 

 

 

 

 

 

74

 

 

 

конкретного пациента находятся так. В первый день болезни значение диагностического признака получается случайным образом при выбранных распределении и математическом ожидании диагностического признака в первый день. Это математическое ожидание изображено на рисунке как ордината в первый день. Значения диагностического признака в остальные дни получим как ординаты линии, проходящей через ординату первого дня и параллельной изображенной на рисунке 2.7.2 линии математических ожиданий величины диагностического признака. Полученное указанным образом изменение величины диагностического признака для конкретного пациента изображено на рис. 2.7.2 пунктиром.

Пересечение (линий математического ожидания) диагностических признаков сделано специально для исследований допустимости усреднения величин диагностических признаков. Ожидается, что у больного изменяющимся диагностическим признаком (болезнь 1) мы совершим диагностическую ошибку, если будем брать пары диагностических признаков, равноудаленных от места пересечения линий диагностических признаков (пунктирной линии и линии математического ожидания болезни 2), усреднять значения диагностических признаков в этих парах и использовать усредненные значения при диагностике. Ошибка ожидается потому, что усредненные значения переменного диагностического признака будут в точности равны диагностическому признаку при второй болезни – болезни «постоянный диагностический признак».

Заметим, что величины диагностических признаков у пациента в два любых дня – достаточная информация для диагностики заболевания: если величины диагностических признаков разные, – болезнь переменный ДП, если величины одинаковые, – болезнь постоянный ДП.

До того, как у пациента определены две величины диагностического признака, диагностические признаки являются независимыми. То есть по значению диагностического признака в один из дней нельзя найти значение диагностического признака в другой день, поскольку неясно, какой болезнью пациент болен. Вместе с тем, при каждой болезни диагностические признаки зависимы: если известна болезнь (известна линия математического ожидания диагностического признака), то по одному значению диагностического признака можно предсказать его значения в

75

любой день.

Планируется провести исследования диагностики на однопризнаковых моделях, а затем перейти к двухпризнаковым моделям. На последних, в числе прочего, планируется исследовать случай, когда диагностические признаки по отдельности свидетельствуют о разных болезнях.

76

Глава 3 База данных, вероятности и плотности вероятностей диагностических признаков

3.1Характеристика статистических данных

3.1.1Относительная частота механической и паренхиматозной желтух

Были приблизительно оценены доли больных механической и паренхиматозной желтухами в общем количестве больных этими желтухами. Имеется в виду общее количество поступивших в больницу больных паренхиматозной и механической желтухами. Оценка проведена по данным терапевтического отделения краевого гепатологического центра (больница №5).

Принято, что доля больных: паренхиматозной желтухой π1 = 0,7; механической желтухой π2 = 0,3.

3.1.2 Диагностические признаки

Методом случайной выборки были взяты 613 историй болезней обычных больных с точно установленными диагнозами (механическая или паренхиматозная желтуха) и выписаны диагностические признаки с указанием дней их определения. Напомним, что под диагностическими признаками понимаются симптомы заболевания, клинические анализы, данные инструментальных обследований пациента; как и ранее, в тексте употребляется сокращение ДП – «диагностический признак». Всего использовалось девятнадцать диагностических признаков, в которые были включены пол и возраст пациента:

1)пол пациента;

2)возраст пациента;

3)боль;

4)кожный зуд;

5)расширение холедоха;

6)расширение внутрипеченочных ходов;

7)увеличение печени;

8)увеличение селезенки;

9)зеленый цвет печени;

77

10)маркеры вирусных гепатитов;

11)обтурация желчных путей (наличие опухоли, желчных камней, стриктур и

т.д.);

12)наличие эффекта от предыдущего лечения;

13)билирубин непрямой (неконъюгированный);

14)билирубин прямой (конъюгированный);

15)ферменты АСАТ (аспартатаминотрансфераза);

16)ферменты АЛАТ (аланинаминотрансфераза);

17)щелочная фосфатаза;

18)сулемовая проба;

19)альбумин.

Данные выписывались в динамике, то есть симптомы, клинические анализы и данные обследований брались не только в день поступления пациента в больницу, но и в другие дни: с 1-го дня (день поступления пациента в больницу) по 50-й день (максимальный период лечения больных).

Заметим, что база данных – реальная, ДП каждого пациента определены не в каждый день болезни. То есть это результаты обычных обследований, далеких от идеальности. Отсутствие анализа для любого признака в один из дней говорит лишь о том, что анализ в этот день не был проведен. Например, некоторые анализы не сделаны, так как были сделаны недавно, а другие анализы не сделаны из-за отсутствия реактивов и т.п. Разработанные нами алгоритм и методика диагностики функционируют и в том случае, когда ДП определены не в каждый день, и когда определены не все ДП.

Все истории болезней были подняты из архива больницы №5 (больница РТП г. Барнаула; данные выписывались под руководством одного из авторов - профессора Г.Г. Устинова).

Ниже приведена история болезни одного из пациентов. Это обычный больной с типичными диагностическими признаками, на основании которых рассчитывается диагноз (рассчитываются вероятности болезней и ставится диагноз).

№ истории болезни: 25 ФИО: П.А.Ю.

Возраст: 20

78

Дата поступления: 12.01.01 День выписки: 1.02.01 Начало болезни: 2 Начало лечения: 0

Комментарий: наркомания, на 20-й – состояние удовлетворительное

УЗИ проводилось в следующие дни:

 

5

 

 

 

Маркеры в 8-й день: +B

4

5

8

14

15

20

Признак/день

1

Боль

+

 

-

 

 

 

 

Кожный зуд

 

 

 

 

 

 

Расширение холедоха

+

 

-

 

 

 

 

Увеличение печени

 

-

 

 

 

 

Увеличение селезенки

 

 

-

+

 

 

 

Маркеры

 

26.00

 

28.00

22.00

18.00

Билирубин непрямой

 

 

 

Билирубин прямой

 

48.00

 

 

16.00

18.00

6.00

Ферменты АСАТ

 

2.00

 

 

1.00

1.10

0.30

Ферменты АЛАТ

 

5.50

 

 

2.20

2.30

0.70

Дадим краткий комментарий приведенным данным.

Больной П. поступил в терапевтическое отделение краевого гепатологического центра (больница №5) 12 января 2001 года. Желтуха появилась за 2 дня до поступления. В день поступления больной отмечал боли в правом подреберье (знак «+» – ДП положительный). Во время обследования врач определил увеличение печени. При лабораторном исследовании (данные анализов поступили на 4-й день) отмечено повышение содержания в крови билирубина за счет прямой фракции, значительное увеличение активности ферментов АЛAT и ACAT. На пятый день произведено ультразвуковое исследование. Установлено, что холедох не расширен, печень и селезенка не увеличены. Проведение УЗИ в динамике показало сокращение печени до нормы. Это не противоречит результатам проведенных ранее исследований, а указывает на положительную динамику течения заболевания под воздействием лечения.

У больного обнаружен HBS-антиген-маркер вирусного гепатита В. Из 19 используемых при компьютерной диагностике ДП в представленных данных содержатся 11 диагностических признаков.

Следует отметить, что в истории болезни имеются и другие диагностические признаки, такие, например, как внутривенное употребление наркотиков, некоторые данные УЗИ, показатели анализов крови.

С накоплением статистики планируется ввести в диагностику все имеющиеся

79

данные, что уточнит конечный результат - диагноз.

Выписанные данные 613 больных ниже используются для статистических характеристик ДП. Для диагностики используются только 564 истории болезни. Дело в том, у остальных 49 больных в истории болезни приведено недостаточно ДП для постановки диагноза. У этих больных диагноз был поставлен не только по ДП, но и по другим данным, например, по результатам операции или вскрытия. Поэтому такие больные из базы для контроля диагностики исключены, но оставлены в базе данных для построения гистограмм.

3.2 Дискретные и непрерывные диагностические признаки, построение гистограмм

3.2.1 Дискретные и непрерывные диагностические признаки

Признаки разделяются на два класса: дискретные и непрерывные. Дискретные признаки (боль, кожный зуд, увеличение печени, потеря веса, пол

и т.д.) принимают одно из четко определенных значений. В рамках диагностируемых состояний – одно из двух значений: наличие патогенного признака или его отсутствие, норма или не норма. Например, наличие или отсутствие боли, печень нормальная или увеличенная, наблюдалась или нет потеря веса. Состоянию «нет» (отсутствие) ставилось в соответствие число 0, состоянию «да» (наличие) – число 1. (Для признака «пол»: 0 – мужской пол, 1 – женский пол.)

Медицинские данные иногда позволяют разделять дискретные признаки на 3 и более категории. Например, боль: сильная, слабая, отсутствует. Цвет печени: розовый, коричневый, фиолетовый, зеленый. Размеры печени: уменьшена, не увеличена, увеличена на 1 см, увеличена на 2 см и т.п. Однако анализ многих историй болезней пациентов показал, что даже при двух взаимоисключающих категориях возможны различные оценки одного и тоже состояния разными врачами. Например, врач-интерн записывает, что печень не увеличена, а заведующий отделением – напротив – печень увеличена. Так как увеличение возможных состояний дискретных признаков может привести к увеличению ошибок (в силу субъективности обследования лечащим врачом), пока принято, что дискретный признак может иметь только два значения. При этом (в ущерб детальности) повышается надежность исходных данных.

80

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение