Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Диагностика_заболеваний_методами_теории_вероятностей_Жмудяк_М_Л

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
2.28 Mб
Скачать

которых выполнен анализ. Матрица показывает слабую взаимозависимость 1 и 2-го дней. Сильно зависимы дни: 2-4-5, 3-4-5-6-7-8-9, 4-8-9, 5-7-9, 6-8-9, 7-8-9, 8-9, 9-10.

Можно выделить следующие характерные интервалы дней признака: 1, 2, 3-4-5-6-7, 8-9-10.

Вдальнейшем, если необходимо поставить диагноз пациенту, которому сделаны анализы билирубина в 1, 3, 6, 7-й дни, то для расчетов берется значение признака 1-й день и усредненное значение за 3, 6, 7-й дни.

Такой подход требует специального рассмотрения динамики всех признаков для каждой болезни.

Вусловиях ограниченной неполной статистики следует усреднять близкие по времени (повторные) значения признака: сильно зависимые признаки усредняются, слабо зависимые считаются независимыми. Проведенные исследования и анализ зависимости ДП позволили приближенно сформулировать следующие рекомендации по использованию при диагностике (механической и паренхиматозной желтух) многократно определяемых признаков: значения ДП (анализов) первых двух дней усредняются в 1-й диагностический признак, анализы за следующие 3 дня усредняются во 2-й признак, за следующие 5 дней усредняются

в3-й признак. Таким образом, вместо 10 независимых ДП получаем 3 признака. Предлагаемое усреднение привело к уточнению диагностики, по сравнению с диагностикой без усреднения повторных измерений признаков (глава 5).

4.3 Влияние лечения на динамику заболевания

Предложенная методика диагностики тестируется на механической и паренхиматозной желтухах, течение которых кардинально отличны. Соответствующим образом отличается и лечение. Лечение паренхиматозной желтухи – терапевтическое, медикаментозное. За время лечения (от 10 дней до 2 месяцев) состояние больного, в основном, нормализуется, то есть большинство диагностических признаков постепенно приближаются к норме. Если полагать, что лечение паренхиматозной желтухи примерно одинаково для всех больных, то можно говорить о динамике заболевания при лечении. Больному обычно назначают медицинские процедуры уже в день поступления, поэтому учесть динамику болезни до начала лечения в настоящей работе не удалось – не было нужных данных. Хотя

111

предпринималась попытка приближенно оценить начало паренхиматозной желтухи по имеющейся информации. Затем без уточнения действительного дня начала заболевания было достигнуто почти стопроцентное совпадение компьютерного и врачебного диагнозов. После этого попытки откорректировать начало заболеваний, приближая его к реальному, были отложены.

Как правило, своевременно предпринятое лечение паренхиматозной желтухи постепенно приводит к улучшению состояния больного и нормализации лабораторных показателей.

Лечение механической желтухи, в большинстве случаев, хирургическое. Операцию необходимо проводить в первые 5 – 7 дней с момента поступления. В течение этого времени проводится предоперационная подготовка. Однако, как уже указывалось, большинство больных поступают в хирургическое отделение поздно - на 10 – 30-й день болезни. Все это время больному проводится лечение, однако улучшение состояния и лабораторных показателей не происходит. Таким образом, динамика двух заболеваний различна, и её учет должен приводить к повышению точности диагностики.

После операции признаки механической желтухи резко снижаются, что не характерно для естественной динамики болезни при медикаментозном лечении. День операции индивидуален для каждого больного, он зависит как от наличия достоверных показаний о необходимости операции, так и от состояния больного. А значит, говорить об общей естественной динамике собственно болезни после операции нельзя и в рамках решаемой задачи диагностики нет необходимости.

Приведенные выше обстоятельства указывают, что проводимая в настоящей работе диагностика – это диагностика болезней на фоне лечения и до операции у больных механической желтухой. Следовательно, нельзя использовать для диагностики анализы и другие ДП пациента после операции. Эти данные не должны влиять ни на диагностику, ни на статистические распределения. Вследствие обоснованного выше игнорирования послеоперационных распределений признаков затруднена дифференциальная диагностика других больных, которым не выполнялись операции, то есть больных паренхиматозной желтухой, ДП которых (после 10 дней пребывания в больнице) не с чем сравнивать. В среднем,

112

эксперименты по диагностике пациентов проводились с учетом данных 10 дней от начала лечения. После десятого дня большинству больных механической желтухой были сделаны операции. Как показали эксперименты, диагностика с учетом динамики по 10 дням оказалась лучшей диагностикой по всем дням.

Очевидно, что диагноз должен быть известен как можно раньше и, конечно, до операции. После операции компьютерный диагноз не нужен.

Приведенные выводы о динамике болезни с учетом лечения верны для пациентов, которые лечатся от той болезни, которой они действительно больны. Их динамика, примерно, одинакова в пределах одной группы. Но что происходит, когда больного механической желтухой ошибочно принимают за больного паренхиматозной желтухой? Или больного паренхиматозной желтухой за пациента с механической желтухой. Лечение таких больных отлично от лечения группы, к которой они принадлежат, и результаты лечения также иные.

Случаи неверных диагностики и соответственно лечения, к сожалению, вполне регулярны, и безрезультатное лечение одной из болезней не зря введено в

исходные данные (раздел 3.1) как диагностический признак № 12 «наличие эффекта от предыдущего лечения», который свидетельствует о другом типе желтухи (в основном, отсутствие эффекта от лечения паренхиматозной желтухи указывает на механическую желтуху).

Изложенные ситуации показывают проблемы диагностики больных, которым не проводилось лечение, и больных, которым проводилось лечение от другой болезни. Для решения этих проблем вместо двух диагностируемых состояний (механическая и паренхиматозная желтуха) следовало бы ввести базу данных с четырьмя группами больных: пациент болен и лечится от механической желтухи, пациент болен и лечится от паренхиматозной желтухи, пациент болен механической желтухой и лечится от паренхиматозной желтухи, пациент болен паренхиматозной желтухой и лечится от механической желтухи. После этого появилась бы возможность более тонкой диагностики: более надежно диагностировались бы больные, которым проводится неверное лечение.

Однако, проблема еще обширнее. Обсуждаемых больных не все время лечат неправильно, на какой-то день после начала лечения пациентам ставят верный

113

диагноз. Следовательно, меняется лечение, и пациент уже не характеризуется одним из 4-х введенных состояний. Он, строго говоря, относится к новой группе. Также к иным, отдельным группам относятся пациенты, лечение которых начиналось не со дня поступления в больницу, а раньше (самолечение, лечение не в специализированной клинике) или позже этого дня.

Например, группа пациентов, лечение которых началось в день поступления в больницу, отлична от группы пациентов, интенсивное лечение которых началось на 5-й день после поступления (скажем, после праздничных дней). У первой группы на 5-й день анализы уже изменились в сторону нормы, а у второй группы их отличие от нормы не уменьшилось. Соответственно, распределения признаков обеих групп на 5-й и последующие дни будут отличны, несмотря на то, что обе группы могут относиться к одному диагностическому состоянию и проходят аналогичное лечение.

Заметим, что количество дней, прошедших между началом болезни и поступлением в больницу, сильно отличается для разных пациентов. На это влияет, в частности, удаленность от больницы, другие факторы. Например, житель города при первых признаках желтухи обращается в больницу и проходит лечение, когда болезнь не запущена. В то же время, сельский житель может болеть продолжительное время, и в день поступления в специализированную больницу анализы такого больного будут сильно отличаться от нормы. Очевидно, что правильнее отсчитывать динамику от дня начала заболевания, а не от дня поступления в больницу. Желательно также учесть день начала лечения и индивидуальные особенности протекания стадий болезни для каждого больного. Методика учета индивидуальных начала лечения и течения болезни прорабатывалась авторами [91]. Но пока при практической диагностике были использованы только следующие простые допущения:

1.Днем начала заболевания и начала лечения условно считается день поступления в больницу.

2.Больные с ошибочными диагнозами не выделяются в отдельные группы, т.е. распределения ДП включают некоторое количество больных с лечением, отличным от лечения большинства больных.

114

Глава 5 Результаты диагностики с применением различных методических приемов

5.1 Применение уровня надежности и коэффициента эффективности для оценки качества диагностики

Расчет погрешности определения вероятности болезней [99] пока не реализован, поэтому результаты диагностики оцениваются согласно разделу 2.6: кроме процента верных диагнозов используются предложенный коэффициент эффективности диагностики (CE ) и уровень надежности диагноза. (Наиболее вероятная болезнь считается диагнозом не всегда, а тогда, когда вероятность этой болезни еще и выше заданного уровня надежности. В качестве уровня надежности принята вероятность болезни 90%.) Использование уровня надежности диагноза позволяет «перевести» часть недостаточно надежных (неправильных и правильных) диагнозов в разряд «неопределенных».

Ниже приведен пример результатов диагностики 563 больных с использованием уровня надежности.

Таблица 5.1 Сравнение диагностики пациентов при разных уровнях надежности

 

Принятый уровень

Правильных

Неправильн.

Неопредел.

 

диагнозов

диагнозов

диагнозов

 

надежности

 

 

 

 

 

 

 

 

пац.

%

пац.

%

пац.

%

 

 

 

 

 

 

 

 

 

 

1.

50% (без неопределенных)

543

96,5

20

3,5

0

0

 

 

 

 

 

 

 

 

2.

90% (с неопределенными)

525

93

11

2

27

5

 

 

 

 

 

 

 

 

В первой графе приведена диагностика больных с принятым уровнем диагностической надежности – 50%. То есть для двух болезней фактически уровень надежности не используется и диагнозом считается та болезнь, вероятность которой выше вероятности другой болезни (а значит больше 50%). В данном случае неопределенных диагнозов нет. Во второй графе принят уровень надежности – 90%. Здесь появляются неопределенные диагнозы.

При установке уровня надежности 90%, количество правильных диагнозов уменьшилось на 18 (на 3,2% от числа всех больных), количество неправильных

115

диагнозов уменьшилось на 9 (1,6%), и появились 27 неопределенных диагнозов

(5%).

Несмотря на то, что часть правильных диагнозов стали неопределенными, мы считаем этот подход оправданным: важнее сделать меньше ошибок в диагнозе, чем большему числу пациентов поставить верный диагноз.

Возникает вопрос о выборе уровня диагностической надежности диагноза. Чем выше этот уровень, тем меньше правильных и, одновременно, неправильных диагнозов. Можно установить такой высокий уровень надежности, что все неправильные диагнозы исчезнут, перейдут в область неопределенных диагнозов. При этом количество правильных диагнозов уменьшиться настолько, что такая диагностика перестанет удовлетворять врача. Вполне возможен случай появления нового больного, которому будет поставлен неверный диагноз при любом уровне надежности.

Кроме того, установка уровня надежности зависит от количества данных, используемых в диагностике: чем больше данных, тем, в принципе, большей должна быть полученная расчетом разница вероятностей правильного и неправильного диагнозов, следовательно, тем более высокий уровень надежности можно установить.

Таблица 5.2

Влияние количества диагностирующих данных (признаков) на вероятности болезней

 

Вероятность действительной болезни пациента,

Пациент

с использованием данных нескольких дней, %

 

 

 

 

 

 

1-й день

1, 2-й дни

1, 2, 3-й дни

1,2,3,4-й дни

 

 

 

 

 

1

99,99486

99,99956

99,99987

99,99999

 

 

 

 

 

2

99,97545

99,96377

99,99816

99,99990

 

 

 

 

 

3

89,54650

99,91049

99,99890

99,99997

 

 

 

 

 

4

67,75748

19,76993

62,11264

36,18332

 

 

 

 

 

5

15,72451

6,39987

2,97724

0,05839

 

 

 

 

 

В таблице 5.2 показано как изменяются вероятности истинных болезней пяти пациентов. (Истинные здесь – те болезни, которыми пациент действительно болен и

116

от которых его лечат.) В первом столбце (в начале строк) - номера пациентов, в заголовках следующих столбцов указано число дней, в которые взяты диагностические признаки, использованные при диагностике каждого пациента. Больные диагностируются на основании набора признаков взятых сначала за 1-й день, потом за 1 и 2-й дни, за 1, 2, 3-й дни, и за 1, 2, 3 ,4-й дни. У большинства пациентов вероятности истинных болезней приближаются либо к 1 (№1, №2, №3), либо к 0 (№5). Таким образом, увеличение массива данных, по которым ставится диагноз, приводит к увеличению числа правильных и неправильных диагнозов при постоянном уровне надежности. Практически, это означает сложность использования постоянного уровня надежности для неодинаковых наборов данных. Сложность заключается в адекватном сравнении результатов диагностики.

Таблица 5.3

Влияние уровня надежности на диагностику пациентов, вероятности болезней которых содержатся в табл. 5.2

Уровень

 

Количество поставленных диагнозов

 

надежности

 

 

 

 

1-3-й дни

1-й день

1-2-й дни

диагноза

 

 

 

 

 

 

Прав.

Неправ.

Прав.

Неправ.

Прав.

Неправ.

 

 

 

 

 

 

 

90%

2

0

3

1

3

1

 

 

 

 

 

 

 

95%

2

0

3

0

3

1

 

 

 

 

 

 

 

97%

2

0

3

0

3

0

 

 

 

 

 

 

 

50%

4

1

3

2

4

1

 

 

 

 

 

 

 

Для данных пациентов и для диагностики за 1-й день наиболее подходящим уровнем диагностической надежности, когда программа реже всего ошибается, является 90%. Уровень надежности 95% – лучший при диагностике за 1 – 2-й дни, 97% – за 1 – 3-й дни. С увеличением количества данных, по которым ставится диагноз, уровень надежности диагноза должен повышаться. В работе далее не исследуется более подробно вопрос выбора уровня диагностической надежности. Он принимается равным 90% для диагностики всех пациентов. На наш взгляд, это, примерно, тот уровень, при котором врач может доверять компьютерному диагнозу.

Введение неопределенных диагнозов возвращает нас к проблеме сравнения и оценки качества диагностики различными методами и приемами (или при разных условиях). Например: в каком из расчетов таблиц 5.1 и 5.2 качество диагностики

117

выше, где больше процент верных или меньше процент неверных диагнозов? В таблицах приведены одни и те же расчеты. Просто в таблице 5.2 взят разный уровень надежности.

С целью сравнения качества диагностик в разделе 2.6 был введен «коэффициент эффективности» диагностики (CE ). Определено понятие CE диагностики одного пациента – это расчетная вероятность действительной болезни данного пациента, т.е. той болезни, которой он действительно болен. Общий CE (всех пациентов) – это среднеарифметическое CE каждого пациента. Данный показатель одновременно учитывает и правильные, и неправильные, и неопределенные диагнозы. CE является универсальной характеристикой качества диагностики, не зависящей от уровня надежности и размера выборки диагностируемых пациентов. CE диагностики в таблице 5.1 равен 0,9601 (для обоих расчетов он одинаков).

5.2 Серия экспериментов при различных приемах формирований распределений

Для проведения экспериментов выбраны непрерывные ДП «билирубин прямой», «билирубин непрямой», «ферменты АСАТ», «ферменты АЛАТ», «щелочная фостафаза», «альбумин», «возраст». Так как только на построение распределений непрерывных признаков влияют описанные в разделах 3.2 и 3.5 правила. Величины признаков взяты для диагностики один раз – в ближайший день от начала болезни. Результаты экспериментов приведены в таблице 5.4. В этой таблице использованы следующие понятия.

1.Высота интервала – число больных, у которых значение признака попадает

вданный интервал. Высота интервала, точнее, минимальная высота интервала задается для формирования гистограммы; последняя формируется так, что число больных в интервале, в который попал ДП диагностируемого больного, не менее заданной минимальной высоты интервала.

2.Высота каждого интервала формируется по логическим условиям «да»/«нет». Если «да», то высота каждого интервала (не только того, в который попало значение признака) будет не меньше, чем в п. 1. В ином случае возможно построение гистограммы, в которой имеются интервалы с любой высотой, даже с

118

нулевой.

3.Унимодальность гистограммы. Гистограмма может быть не унимодальной (значение «нет»), полностью унимодальной для всех интервалов (значение «да»), унимодальной только для интервалов с высотой большей, чем вычисляемая высота (значение «да, относительно»).

4.Центр интервала. При значении «да» гистограмма формируется так, что значение анализа является центром интервала. При «нет» гистограмма формируется без центрирования интервала вокруг значения ДП.

CE – коэффициент эффективности. Это основной показатель, по которому

оценивается рациональность выбора того или иного метода построения гистограмм. Как видно по таблице, высота интервала (1-я переменная) должна быть не больше 1. Только при такой величине достигается максимальной количество правильных диагнозов – 471 и коэффициент эффективности – 0,914 (1-й

эксперимент из экспериментов 1 – 4).

Далее при высоте интервала 1 определяется, необходимо ли условие, когда высота каждого интервала должна быть не меньше найденной минимальной 1 (переменная №2). Это выясняется из сравнения 1 и 6-го экспериментов. Результаты очень похожи, но неприменение этого условия все же предпочтительнее (CE 1-го эксперимента = 0,9141, CE 6-го эксперимента = 0,9120). Видимо, соблюдение условия ненулевого значения каждого интервала чуть-чуть ухудшает представительность «главного» интервала, того интервала, в который попал ДП диагностируемого больного.

Вэкспериментах 1, 7, 8 определяется необходимость условия унимодальности (3-я переменная). В 1-м расчете унимодальность не выполняется, в 7-м расчете унимодальность – полная, в 8-м – относительная. Лучшим вариантом (CE = 0,9146) оказался 8-й эксперимент: т.е. предпочтителен предложенный прием такого разбиения на интервалы, что соблюдается унимодальность интервалов с высотой большей, чем высота интервала, в который попал ДП диагностируемого больного.

В9-м расчете показано, что признак, для которого рассчитывается распределение, должен располагаться в центре интервала (CE = 0,9194). В 10 и 11-м расчетах еще раз проверяется условие унимодальности.

119

Некоторые варианты построения распределений демонстрируются в приложении 2, где приведены примеры определения вероятностей и плотностей вероятностей ДП одного из пациентов.

Таким образом, экспериментальным путем подобраны следующие условия построения гистограмм:

1.Высота интервала = 1.

2.Высота каждого интервала гистограммы, кроме интервала, указанного в предыдущем пункте, может быть любой.

3.Должна соблюдаться унимодальность гистограммы для всех интервалов, высота интервала в которых больше, чем в интервале, указанном в пункте 1.

4.Интервал следует формировать так, что признак, плотность распределения которого рассчитывается, должен попадать в центр интервала.

Таблица 5.4

Численные эксперименты по формированию распределений

 

Правила формирования распределений

Поставленных диагнозов

CE

 

Правиль

Непра-

Неопред

экс.

 

 

 

 

-ных

вильных

еленных

 

 

1.

Высота интервала – 1

 

 

 

 

1.

2.

Высота каждого интервала – нет

471

14

79

0.9141

3.

Унимодальность гистограммы – нет

 

4.

Симптом – центр интервала – нет

 

 

 

 

 

1.

Высота интервала – 2

 

 

 

 

2

2.

Высота каждого интервала – нет

467

14

83

0.9077

3.

Унимодальность гистограммы – нет

 

4.

Симптом – центр интервала – нет

 

 

 

 

 

1.

Высота интервала – 4

 

 

 

 

3

2.

Высота каждого интервала – нет

468

13

83

0.9088

3.

Унимодальность гистограммы – нет

 

4.

Симптом – центр интервала – нет

 

 

 

 

 

1.

Высота интервала – 8

 

 

 

 

4

2.

Высота каждого интервала – нет

463

17

84

0.9045

3.

Унимодальность гистограммы – нет

 

4.

Симптом – центр интервала – нет

 

 

 

 

 

1.

Высота интервала – 16

 

 

 

 

5

2.

Высота каждого интервала – нет

446

12

106

0.8947

3.

Унимодальность гистограммы – нет

 

4.

Симптом – центр интервала – нет

 

 

 

 

 

1.

Высота интервала – 1

 

 

 

 

6

2.

Высота каждого интервала – да

471

15

78

0.9120

3.

Унимодальность гистограммы - нет

 

4.

Симптом – центр интервала – нет

 

 

 

 

 

 

120

 

 

 

 

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение