- •Часть I
- •Снижение уровня шума при назначении наказаний
- •К разговору о шуме при вынесении приговоров
- •Лотерея, создающая шум
- •Ревизия шумовых помех выявляет системный шум
- •Нежелательный разброс против желаемого разнообразия
- •Иллюзия согласия
- •К разговору о системном шуме в страховой компании
- •Уникальные или типовые
- •Шум в уникальных решениях
- •Как контролировать шум в уникальных решениях
- •К разговору об уникальных решениях
- •Процесс вынесения суждения: пример
- •Цель суждения: внутренний сигнал
- •Как оценивается суждение: результат и процесс
- •Оценочные суждения
- •В чем проблема с шумом
- •Нежелательный, но поддающийся измерению
- •К разговору о профессиональных суждениях
- •Нужно ли компании GoodSell сокращать уровень шума?
- •Среднеквадратические значения
- •Уравнения расчета погрешности
- •Цена шума
- •Ревизия шумовых помех при назначении наказаний
- •Средний срок приговора
- •Лотерея при вынесении приговоров
- •Некоторые судьи особенно суровы: межэкспертный шум
- •Не все судьи одинаковы: внутриэкспертный шум
- •Составляющие шума
- •К разговору об анализе шума
- •Вторая лотерея
- •Измерение уровня ситуативного шума
- •Один в поле воин
- •Источники ситуативного шума
- •Определение масштабов ситуативного шума
- •Ситуативный шум, внутренние причины
- •К разговору о ситуативном шуме
- •Шум в музыке
- •Не только скачивание музыки
- •Каскады
- •Групповая поляризация
- •К разговору о групповых решениях
- •Часть III
- •Суждение или формула?
- •Пол Мил: оптимальная модель одерживает над вами верх
- •Голдберг: ваша модель одерживает над вами верх
- •К разговору об оценках и моделях
- •Больше простоты: грубые и прекрасные
- •Еще больше простоты: простые правила
- •Больше сложности: методы машинного обучения
- •Освобождение под залог: оптимальные решения
- •Почему мы не так часто используем правила?
- •Объективная неосведомленность
- •Излишне самоуверенные эксперты
- •Беспомощные эксперты и немногим лучшие модели
- •Отрицание неведения
- •К разговору об объективной неосведомленности
- •Прогнозирование жизненного пути
- •Понимание и прогнозирование
- •Каузальное мышление
- •Понимание в долине правдоподобности
- •Взгляд изнутри и взгляд со стороны
- •К разговору о границах понимания
- •Часть IV
- •Диагностика искажений
- •Подстановка
- •Предопределенность вывода
- •Избыточная когерентность
- •Психологические искажения как причина шума
- •К разговору об эвристике, искажениях и шуме
- •Сравнение и когерентность
- •Сравнение интенсивности
- •Искажения в сравнительных прогнозах
- •Шум в сравнительных прогнозах: пределы абсолютных оценок
- •К разговору о сравнениях
- •Гипотеза о возмущении
- •«Шумные» шкалы
- •Доллары и якорение
- •Неутешительные выводы
- •К разговору о шкалах
- •Задачи трудные и задачи легкие
- •Внутриэкспертный шум: постоянный или временный
- •Аналогия с чертами характера человека
- •К разговору о внутриэкспертном шуме
- •Компоненты шума
- •Систематизация компонентов шума
- •Объяснение ошибок
- •Шум как статистическое явление
- •К разговору об источниках шума
- •Эксперты и лидеры мнений
- •Интеллектуальные способности
- •Когнитивные стили
- •К разговору о «лучших судьях»
- •Предупреждать или исправлять?
- •Ограничения методов устранения искажений
- •Наблюдатель за процессом принятия решений
- •Снижение уровня шума: гигиена принятия решений
- •Отпечатки пальцев
- •Ситуативный шум в дактилоскопии
- •Насколько шум чреват ошибками?
- •Прислушиваясь к шуму
- •Управление информационным потоком
- •К разговору об управлении информационным потоком
- •Улучшение качества прогнозов
- •Проект «Верное суждение»
- •Вечная бета-версия
- •Шум и смещение в прогнозировании
- •В каких случаях срабатывают методы отбора и обобщения
- •К разговору об отборе и агрегировании
- •Общий обзор
- •Значение методических рекомендаций: снижение шума в медицине
- •Психиатрия – удручающий пример
- •К разговору о методических рекомендациях в медицине
- •Требуется суждение…
- •Старая проблема: в поисках решения
- •Аргументы в пользу суждений относительного характера
- •Ранжируем без принуждения
- •Что же дальше?
- •К разговору об определении шкалы оценки профессиональной эффективности
- •Риски интервью
- •Шум при собеседованиях
- •Психология интервьюера
- •Структурирование как метод оптимизации подбора персонала
- •К разговору о структурировании процесса найма персонала
- •Первая встреча: согласование подхода
- •Вторая встреча: определение факторов для промежуточных оценок
- •Команда аналитиков
- •Решающее совещание
- •Протокол промежуточных оценок при типовых решениях
- •Перемены, которые вносит протокол
- •К разговору о протоколе промежуточных оценок
- •Меньше шума – больше ошибок?
- •«Бесшумные» предвзятые алгоритмы
- •К разговору о цене снижения шума
- •Изменение системы ценностей
- •Обман системы и обход правил
- •Предупреждение правонарушений Аппетит к риску
- •Творческое начало, моральный настрой и свежие идеи
- •К разговору о достоинстве
- •Неоднородность и неосведомленность
- •Боссы и контроль над подчиненными
- •Возврат вытесненного
- •Обоснование концепции
- •Объявим шум вне закона?
- •К разговору о правилах и стандартах
- •Суждения
- •Ошибки: смещение и шумовые помехи
- •Измерение смещения и шума
- •Шум – серьезная проблема
- •Разновидности шума
- •Психология суждений и влияние шума
- •Шум – «вещь в себе»
- •Как снизить уровень шума и влияние искажений
- •Допустимое количество шума
- •Подготовка материалов исследования
- •Предварительная встреча с руководством компании
- •Проведение исследования
- •Анализ и выводы
- •Чек-лист для выявления искажений
- •Выражение признательности
- •Об авторах
- •Примечания
эксперты будут отвергать практику принятия решений, которая лишает их возможности «включать» свою интуицию. До тех пор пока алгоритмы далеко не идеальны – и пока во многих сферах объективная неосведомленность внушает, что они никогда не будут идеальны, – ничто не заменит человеческих суждений. Вот почему их так необходимо улучшить.
К разговору об объективной неосведомленности
«Где есть прогноз, там есть и неосведомленность, и, возможно, больше, чем мы думаем. Откуда нам знать, что эксперты, которым мы доверяем, чаще попадают в цель, чем шимпанзе, метающая дротики в дартс?»
«Когда вы доверяете интуиции, прислушиваясь к внутреннему голосу, вместо того чтобы анализировать факты, вы отрицаете объективную неосведомленность».
«Модели более совершенны, чем люди; однако их превосходство незначительно. Чаще всего мы сталкиваемся с экспертными оценками средней руки и лишь ненамного лучшими моделями. И все же надо стремиться к лучшему, а лучше все-таки модели».
«Возможно, нас никогда не удовлетворит модель, которая будет принимать решения, – ведь мы привыкли доверять лишь своей интуиции. Так давайте хотя бы постараемся усо-
Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/
вершенствовать наш процесс принятия решений».
Глава 12 Долина правдоподобности
Зададимся более глобальным вопросом: как мы чувствуем себя в мире, в котором многие проблемы легко решаемы, а вот к другим не дает подступиться объективная неосведомленность? Прежде всего, там, где объективная неосведомленность непреодолима, мы должны со временем осознать бесполезность магического кристалла применительно к событиям в жизни людей. Однако жизнь ничему нас не учит. Наоборот, как показали предыдущие главы, мы демонстрируем постоянную готовность давать смелые прогнозы на будущее на основе лишь жалких крох полезной информации. В данной главе мы обратим внимание на распространенное заблуждение, что события, которые никак нельзя спрогнозировать, тем не менее можно понять.
Что означает в действительности такая уверенность? Мы обсудим этот вопрос в двух контекстах: социологическом и применительно к повседневной жизни.
Прогнозирование жизненного пути
В 2020 году группа из 112 исследователей под руководством Сары Макланахан и Мэтью Салганика, профессо-
ров социологии Принстонского университета, опубликова-
Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/
ла в журнале Pro-ceedings of the National Academy of Sciences
необычную статью 143. Исследователи задались целью разобраться, представляют ли в действительности социологи, как в будущем сложится жизнь социально уязвимых семей. Насколько успешно социологи могут предугадать события в жизни семьи, зная то, что они знают? В частности, какого уровня точности могут добиться эксперты в своих прогнозах, используя информацию, которую обычно собирают и затем применяют в своих исследованиях социологи? В рамках нашей терминологии целью исследования было измерить уровень объективной неосведомленности, который остается после того, как социологи сделали свою работу.
Авторы статьи воспользовались материалами программы FFCWS11 – широкомасштабного долгосрочного исследования, в ходе которого детей наблюдали с рождения до пятнадцати лет. Огромная база данных содержала несколько тысяч элементов информации о семьях, где росли почти пять тысяч детей из крупных городов США. Большинство детей воспитывались не состоящими в браке родителями. Эти данные включали в себя такие сведения, как уровень образования и род занятий бабушек и дедушек, состояние здоровья всех членов семьи, показатели экономического и социального положения, ответы на множество анкет и тесты на когни-
11 FFCWS (Fragile Families and Child Wellbeing Study) – «Исследование уязви-
мых семей и благополучия детей». Исследования в рамках программы проводились с 1998 по 2020 год.
тивные установки и личностные качества. Социологи сумели как нельзя лучше распорядиться таким обилием ценной информации: на основе полученных от FFCWS данных было написано более 750 научных статей. Во многих из этих документов анализировались социальные условия, в которых воспитывались дети, чтобы объяснить их последующие достижения и неудачи: например, успехи в средней школе или привлечение к уголовной ответственности.
Исследования принстонской команды сосредотачивались на прогнозируемости развития событий по шести различным категориям к тому времени, когда ребенку исполнится пятнадцать лет, таким как выселение из квартиры, средний балл в школе и общая оценка материального положения семьи. Организаторы использовали метод, названный ими «метод типовых задач». Они пригласили команды ученых для состязания в вынесении прогнозов по шести выбранным категориям с использованием доступного массива данных о каждой семье, участвовавшей в программе FFCWS. Подобный тип задач нестандартен для социологии, хотя вполне обычен для информатики, где команды часто приглашают для состязания, например, в машинном переводе стандартных текстов или в распознавании животных по большому набору фотографий. Достижения команды-победителя устанавливают планку для следующих состязаний. В социологических задачах прогнозирования, где невозможно ожидать быстрых улучшений, разумно использовать в качестве меры
Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/
предсказуемости развития событий наиболее точный прогноз из всех, участвовавших в состязании, – другими словами, остаточный уровень объективной неосведомленности.
Исследование вызвало заслуженный интерес среди специалистов. Последний доклад представил результаты 160 высококвалифицированных команд, выбранных из внушительного международного пула претендентов. Большинство из выбранных конкурентов использовали методы машинного обучения и позиционировали себя как специалистов по базам данных.
На первом этапе состязаний команды участников имели доступ ко всем данным на половинной выборке; данные включали варианты развития событий по шести категориям. Команды использовали эти «тренировочные данные» для обучения алгоритма. Затем алгоритмы применялись ко второй выборке, которая не участвовала в тренировке. В качестве единицы измерения точности использовали MSE: погрешность прогнозирования в каждом случае определялась как квадрат разности между реальным и прогнозируемым результатом.
Насколько хороши были модели победителей? Продвинутые алгоритмы на основе методов машинного обучения, прошедшие тренировку на больших массивах данных, конечно, обогнали простые линейные модели (и смогли бы оставить позади опытных экспертов, будь у них такая возможность). А вот превосходство моделей на основе ИИ над самой про-
стой моделью оказалось совсем незначительным, и точность их прогнозов осталась плачевно низкой. С прогнозированием случаев выселения из квартиры лучшая модель добилась корреляции 0,22144145 (ПС=57 %). Схожие результаты были выявлены для других однократных событий – например, был ли первый опекун уволен, имел ли он профессию или на сколько баллов ребенок оценил свою так называемую «хватку» – черту характера, которая сочетает в себе упорство и настойчивое стремление к конкретной цели. Здесь корреляция колебалась между 0,17 и 0,24 (ПС=55–58 %).
Две из шести категорий представляли из себя комплексные показатели и потому более подходили для прогнозирования. Корреляция по среднему баллу, полученному ребенком в школе, составила 0,44 (ПС=65 %), а корреляция по суммарному индексу материальных затруднений за предшествующие 12 месяцев – 0,48 (ПС=66 %). Этот индекс определялся ответами на 11 вопросов, таких как «Постоянно ли вы голодали?» и «Отключали ли вам телефон за неуплату?». Комплексные показатели зарекомендовали себя как более подходящие для прогнозирования и более предсказуемые в категориях разовых событий. Основной вывод по результатам исследований был следующим: большой объем предиктивной информации недостаточен для прогноза разовых событий в жизни людей, и даже прогноз комплексных показателей довольно серьезно ограничен.
Наблюдаемые здесь результаты типичны; во многих слу-
Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/
чаях заявленная социологами корреляция попадает в этот диапазон. В более обширном обзоре по социальной психоло-
гии146, включающем в себя 25 тысяч исследований и 8 миллионов предметов обсуждения за период более ста лет, был сделан вывод, что «результативность прогнозов в социальной психологии довольно низка: коэффициент корреляции обычно не превосходит 0,21». Более высокая корреляция – например упомянутая ранее корреляция порядка 0,60 между ростом и размером стопы взрослого человека – обычна для физических параметров и крайне редко встречается в
социологии. Обзор 708 исследований147 на поведенческую и когнитивную тематику выявил, что всего в 3 % из них корреляция оказалась 0,50 и выше.
Настолько невысокий коэффициент корреляции может вас удивить, если вы начитались статей, в которых результаты заявлены как «статистически значимые» или даже «весьма значимые». Статистические термины зачастую вводят непрофессионалов в заблуждение, и «значимый» – наихудший тому пример. Когда результат объявляется «значимым», из этого не следует, что описываемый эффект устойчив. Это по сути всего лишь утверждение типа «маловероятно, что выявленная зависимость всего лишь игра случая». На достаточно большой выборке корреляция может быть одновременно и «очень значимой», и, наоборот, «слишком незначительной, чтобы ее обсуждать».
Ограниченная предсказуемость однократных событий в