Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1 курс / Психология / Шум_Несовершенство_человеческих_суждений_Д_Канеман_2021.pdf
Скачиваний:
20
Добавлен:
24.03.2024
Размер:
3.47 Mб
Скачать

тия, касающегося бессмысленности многих долгосрочных прогнозов, Тетлок и его жена Барбара Меллерс принялись за изучение того, насколько хорошо люди справляются с предсказанием мировых событий на относительно короткий период – как правило, меньше года. Они обнаружили, что давать краткосрочные прогнозы трудно, но вполне возможно, и некоторые люди, названные Тетлоком и Меллерс суперпредсказателями, показывают лучшие результаты, чем другие, – включая работающих в разведке профессионалов. В принятых здесь терминах новые открытия совместимы с гипотезой о том, что чем дальше мы заглядываем в будущее, тем выше объективная неосведомленность. К суперпредсказателям мы вернемся в главе 21.

Беспомощные эксперты и немногим лучшие модели

Ранние исследования Тетлока продемонстрировали присущую людям абсолютную неспособность к долгосрочным политическим прогнозам. Если бы удалось найти хоть одного человека с настоящим магическим кристаллом, это полностью изменило бы сделанные выводы. Задача считается невыполнимой лишь после того, как многие заслуживающие доверия личности попробовали свои силы и потерпели неудачу. Ранее мы уже показали, что как механическая агрегация информации часто одерживает верх над человечески-

ми оценками, так и точность правил и алгоритмов гарантирует лучшую проверку тому, насколько в действительности предсказуем – или непредсказуем – конечный результат.

После прочтения предыдущих глав у вас могло возникнуть впечатление, что алгоритмы непременно берут верх над оценочными суждениями. Однако это впечатление может быть обманчивым. Модели постепенно становятся лучше людей, но ненамного. По сути нет подтвержденных ситуаций, когда, владея одной и той же информацией, люди проявляют себя из ряда вон плохо, а модели, наоборот, очень хорошо.

В главе 9 мы упоминали обзор 136 исследований139, которые продемонстрировали превосходство механической агрегации над клиническими оценками. В то время как доказательства этого превосходства, вне сомнения, «обширны и последовательны», разница в эффективности невелика. 93 исследования сосредоточились на бинарных оценках (да или нет); они измеряли «процент попадания» у клиницистов и формул. В среднем клиницисты оказались правы в 68 % случаев, формулы – в 73 %. Меньшая подгруппа (35 исследований) использовала в качестве меры точности коэффициент корреляции. В этом случае клиницисты получили среднюю корреляцию с конечным результатом 0,32 (ПС=60 %), а формулы – 0,56 (ПС=69 %). По обоим показателям формулы работали в равной степени лучше, чем клиницисты, однако ограниченная достоверность механических прогнозов бро-

Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/

сается в глаза. Эффективность моделей не изменила картину довольно низкого предельного уровня прогнозируемости.

А что же искусственный интеллект? Как мы заметили, ИИ часто работает лучше простых моделей. Однако в большинстве случаев и его эффективность далека от идеальной. Рассмотрим, например, алгоритм прогнозирования при вынесении решений об освобождении под залог, обсужденный в главе 10. Мы видим, что при одном и том же количестве человек, которым отказано в освобождении, применение алгоритма может снизить уровень преступности до 24 %. Это впечатляющая победа над судьей-человеком, однако если бы алгоритм мог предсказать с идеальной точностью, какие из обвиняемых совершат преступление повторно, уровень преступности мог бы снизиться еще больше. Прогнозирование будущих преступлений в фильме «Особое мнение» неспроста всего лишь фантастика: в предсказании поведения человека немало объективной неосведомленности.

В другом исследовании под руководством Сендила Муллайнатана и Зияда Обермейера была смоделирована поста-

новка диагноза при инфаркте140. Если у пациента имеются симптомы инфаркта, медикам отделения «Скорой помощи» приходится решать, требуются ли ему дополнительные обследования. В принципе такие обследования нужны только в том случае, если риск достаточно высок: они не только дорогостоящи, но к тому же инвазивны и сами по себе рискованны. Поэтому, если нет особой опасности для пациента,

они нежелательны. Таким образом, при назначении обследований врачи должны оценить риск инфаркта. Для этого исследователи создали модель на базе ИИ. Модель использует более 2400 переменных и основана на большом количестве случаев (1,6 миллиона пациентов и 4,4 миллиона обращений к врачам). При таком массиве данных модель, вероятно, достигает нижнего предела объективной неосведомленности.

Неудивительно, что точность модели на базе ИИ оказалась заметно выше, чем у врачей. Чтобы оценить эффективность модели, обратим внимание на пациентов, которых модель отнесла к 10 %, имеющим максимальный риск. По результатам обследований инфаркт был выявлен у 30 % из них, в то время как в группе среднего риска – у 9,3 %. Уровень селективности модели впечатляет, хотя и далек от идеала. Можно сделать разумный вывод, что правильность диагнозов врачей ограничена рамками объективной неосведомленности не менее, чем несовершенством их оценок.

Отрицание неведения

Может показаться, что, настаивая на невозможности идеальных прогнозов, мы утверждаем очевидные вещи. Ясно, что утверждения о непредсказуемости будущего вряд ли можно назвать концептуальным прорывом. Тем не менее очевидность этого факта сравнима разве что с регулярностью, с которой его игнорируют, – что вновь и вновь подтвер-

Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/

ждают выводы исследователей об излишней самоуверенности в прогнозах.

Засилье самоуверенности проливает новый свет на наши неформальные опросы экспертов, доверяющих своей интуиции. Мы заметили, что люди часто принимают субъективные ощущения своей правоты за признак достоверности прогнозов. Например, после того как вы в главе 9 просмотрели результаты тестирования Натали и Моники и сделали на их основе логичные выводы, не что иное, как внутренний голос нашептывал вам, что Натали более сильный кандидат. Однако если вы уверены в своем прогнозе, вы стали жертвой иллюзии достоверности: точность прогноза на основе данной вам информации довольно низка.

Люди, не сомневающиеся в своей способности достигать невероятно высокого уровня точности прогнозов, не просто излишне самоуверенны. Они к тому же не признают наличия в своих оценках шумовых помех и смещения. Мало того что ставят себя выше других смертных, так еще и верят в предсказуемость событий, которые фактически непредсказуемы, безоговорочно отрицая существование неопределенности! Придерживаясь терминологии этой книги, мы можем назвать их позицию отрицанием неведения.

Отрицание неведения дает ответ на загадку, которая ставила в тупик Мила и его последователей: почему их идею долгое время не принимали во внимание и почему эксперты продолжают полагаться на свою интуицию? Когда они при-

слушиваются к своей интуиции, они чувствуют внутренний сигнал и испытывают эмоциональный подъем. Этот внутренний сигнал – «я дал правильную оценку!» – заставляет поверить: «не знаю почему, но знаю». Однако объективная оценка истинности подобных озарений редко оправдывает настолько высокую степень уверенности.

Отказаться от эмоциональной награды за интуитивную уверенность нелегко. Лидеры зачастую хвалятся тем, что в

крайне неопределенных обстоятельствах141 склонны прибегать к интуитивным решениям. Когда факты не укладываются в их представления о ситуации и не дают почувствовать себя уверенно, они обращаются к интуиции, которая заполнит все пробелы. И чем больше неизвестности, тем больше соблазна отрицать неведение.

Отрицание неведения дает ответ и на другую загадку. Перед лицом фактов, представленных нами здесь, многие лидеры приходят к парадоксальному на первый взгляд умозаключению. Основанные на интуиции решения могут быть небезупречны, утверждают они, однако если и более продвинутые варианты так же далеки от идеала, то есть ли смысл их предпочитать? Вспомним, например, что средняя корреляция между рейтингами экспертов и эффективностью принятых на работу сотрудников составляет 0,28 (ПС=59 %). Согласно тем же исследованиям и вышеприведенным доказательствам, механическое прогнозирование работает лучше, однако ненамного: точность составляет 0,44 (ПС=65 %). Лю-

Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/

бой руководитель может спросить – а стоит ли игра свеч? Ответ прост: при решении таких важных задач, как под-

бор персонала, увеличение достоверности значит очень много. Те же самые руководители регулярно вносят значительные изменения в свои методы работы ради приобретения выгоды, пусть и не особо большой. Разумом они понимают, что успех никогда не гарантирован; максимально повысить шансы успеха – вот к чему они стремятся, принимая решения. К тому же они знают, что такое вероятность. Никто из них не купит лотерейный билет, который выиграет с вероятностью 59 %, если за ту же цену можно купить билет с вероятностью выигрыша 65 %.

Проблема в том, что «цена» в этой ситуации совсем иная. Интуитивные суждения идут в паре с вознаграждением, с

внутренним сигналом. Люди готовы доверять алгоритму142, который достигает очень высокого уровня точности, потому что он дает им чувство уверенности, равное или превосходящее то, что дала интуиция. Однако отказ от эмоционального вознаграждения – слишком высокая цена, если в качестве альтернативы предлагается некий механический процесс, к тому же не претендующий на высокую достоверность.

Это наблюдение имеет важные последствия для улучшения качества оценок. Несмотря на все доводы в пользу механических и основанных на алгоритмах методов и несмотря на рациональные подсчеты, которые ясно показывают важность поэтапного улучшения качества прогнозов, многие