Теорема Байеса: как уточнять свои шансы?

29 октября 2024
8 мин.

«Нужна ли математика в жизни?» — этот вопрос возглавляет топ запросов в Google по слову «математика». Примеров приме- нения этой науки — великое множество, но в этот раз речь пойдёт об уникальной истории: всего лишь одна теорема поможет нам в принятии большинства жизненных решений из любых областей! Встречайте: теорема Байеса.

ПЕРЕКЛЮЧАТЕЛЬ ИЛИ ШКАЛА?

Представьте себе, что вас спросили, как прошёл ваш день. Как назло, сегодня вы переволновались у доски и получили низкую оценку — день не задался. Скорее всего, вы ответите, что он был не очень. Но, допустим, после занятий вы встретили старого друга и здорово провели время. Можно сказать, что сейчас у вас всё хорошо. Но как же оценить свой сегодняшний день в целом? Самый простой способ — охарактеризовать своё отношение с помощью своеобразного переключателя «хорошо-плохо». Но как сравнить между собой сегодняшний «хороший» день со вчерашним «хорошим»? В подобном случае гораздо удобнее использовать не «переключатель», а, например, шкалу от 0 до 10. Допустим, в начале дня у нас выставляется среднее значение — 5. А дальше, если произойдёт что-то хорошее, значение несколько сдвигается в сторону 10, плохое — в сторону 0. То есть значение калибруется в зависимости от наблюдений. Так по каждому важному вопросу у вас в голове будет шкала оценки.

КАК МЕНЯЮТСЯ НАШИ ШАНСЫ

Теперь представим, что нам предстоит важное событие, например, экзамен по математике. Можем ли мы оценить, каковы наши шансы сдать его хорошо? Очевидно, чем больше мы готовились, тем больше наша уверенность в вероятном успехе. И для оценки мы можем воспользоваться предыдущей идеей о шкале. Например, оценка «2 из 10» значит, что шанс сдать экзамен хорошо равен 2 против 8 (число 8 получилось как 10–2, то есть из общего количества мы вычитаем благоприятные исходы).

Допустим, мы оценили шансы на успешную сдачу экзамена и, предположим, оценили объективно. Но тут происходит новое событие: например, в состав экзаменационной комиссии вошёл очень строгий преподаватель. Или наоборот — он покидает экзаменаторов. Нам надо понять, необходимо ли «откалибровать» свои шансы? Если да, то как это сделать? Если этот пример кажется надуманным, давайте приведём другие, с похожей сутью. Вдруг вы узнали, что ваши анализы дали положительный результат на редкое заболевание (действительно ли вы больны, или это ошибка?). Или узнали, что ваш сосед попал в ДТП (насколько опасным стал перекрёсток возле дома?). И так далее.

ТЕОРЕМА БАЙЕСА

Инструмент для поиска ответов на подобные вопросы впер- вые появился в работах английского математика и священника Томаса Байеса. Но мы не узнали бы о нём, не пожелай наследники Байеса издать книгу в память о предке. Для этого они попросили другого математика Ричарда Прайса ознакомиться с манускриптами покойного и выбрать интересные заметки. Там Прайс и нашёл размышления Байеса, спустя два года довёл эти идеи до ума и представил их Королевскому обществу, а в 1812 году способ Байеса был вновь открыт французским математиком Пьер-Симоном Лапласом. От диковинной формулы до «байесианской революции» эта теорема прошла долгий путь. Математик сэр Гарольд Джефрис скажет:

«…для теории вероятности теорема Байеса, то же, что теорема Пифагора для геометрии».

По сути, всё просто: изначально у нас была некоторая вероятность P(Н) — так мы оценивали то, произойдёт ли событие Н. Потом произошло событие Е, и нам надо вычислить новую вероятность: P(Н|E) — вероятность наступления исходного события при условии, что наступило новое событие Е. Грубо эту ситуацию может описать уравнение:

ИГРА В КОСТИ

Чтобы разобраться в тонкостях этой формулы, нужно вдумчиво разобрать несколько примеров. Предположим, мы хотим оценить шанс того, что сумма на двух брошенных нами кубиках будет равна 12. На каждом кубике может выпасть 6 вариантов (от 1 до 6), следовательно, всего вариантов будет 36 (согласно правилу произведения 6х6=36). И только одна комбинация даёт нужный ответ — когда на каждом кубике выпадет шестёрка. Значит, наша вероятность равна 1 36 . А теперь предположим, что мы бросили кубики, на одном вы- пала шестёрка, а второй закатился под стул, и мы пока не видим, что на нём. Вопрос всё тот же: какова вероятность выпадения 12 очков? Вот тут мы предлагаем вам сделать паузу и подумать.

Что говорит интуиция? Ведь бросаются те же кости, задан тот же вопрос, почему ответ должен быть другим? Переведём условие задачи в термины формулы Байеса. Н — «суммарные 12 очков», а Е — «шестёрка на одном кубике».

По формуле исходную вероятность P(H)=1/36 умножаем на дробь. В числителе находится P(Е|Н), то есть вероятность того, что на видном нам кубике выпало 6 при условии того, что в сумме 12. Вероятность P(Е|Н) = 1, ведь 12 нам по-другому не получить. Далее вычислим вероятность того, что на кубике выпало 6. Такое возможно в 1 случае из 6, то есть P(E)= 1/6.

Действительно, ведь новое сведение (выпадение 6 на одном кубике) существенно увеличило наши шансы набрать в сумме 12 очков. Теперь рассмотрим аналогичный пример, но из жизни.

КАК ПЕРЕСТАТЬ БОЯТЬСЯ ЛЕТАТЬ НА САМОЛЁТАХ

Допустим, вы сидите в аэропорту в ожидании посадки на само- лёт. Вдруг пассажирам сообщают, что в самолёте была найдена серьёзная неисправность, а ваш рейс откладывают до её исправления. Представьте свои ощущения. Будет ли вам страшно лететь на таком самолёте? Захотите ли сдать свой билет? Будет ли это рационально?

Итак, у нас была некоторая вероятность, поступила дополнительная информация, и мы должны оценить новые шансы. Поможет в этом теорема Байеса. Есть исходное событие Н — что у самолёта случится поломка. Вероятность этого события P(H) можно узнать из интернета — она примерно равна 1 из 10 000 000. Не зря самолёт — одно из самых безопасных транспортных средств в мире. Произошло событие Е — первая поломка самолёта. Как имен- но следует скорректировать вероятность исходного события Н?

Оценим Р(Е|H) — вероятность того, что произойдёт первая поломка, при условии, что произошла вторая (последующая). Согласитесь, будущая поломка не может влиять на предыдущую поломку, следовательно, вероятность Р(Е|H) не больше чем P(E), значит, числитель и знаменатель примерно равны. В итоге наша исходная вероятность не сильно изменилась. Мораль: не бойтесь, летите!

Кстати, когда дробь близка к единице, то есть шансы практически не поменялись, говорят, что событие Е слабо свидетельствует в пользу изменения шансов. Иначе говоря, Е является слабым свидетельством. И это одна из двух серьёзных ошибок, которые мы допускаем при принятии решений: когда слабое свидетельство интуитивно кажется сильным. В чём же другая проблема? Допустим, свидетельство действительно оказалось сильным: дробь равна не 1, а 10 или даже 100 (например, произошла сложная поломка двигателя, и мы знаем, что в таком случае вероятность выхода судна из строя в 10 раз выше).

Однако если исходные шансы были очень малы (как в нашем случае — 1 к 10 000 000), то даже домножение на 10 даст почти такой же шанс: 1 к 1 000 000 — всё ещё очень малая вероятность. Для сравнения: шанс попасть в ДТП на машине хотя бы один раз в жизни равняется примерно 1 к 34, а в ДТП с тяжёлыми последствиями — примерно 1 к 5000. Но это не мешает нам гораздо больше доверять машинам, чем самолётам!

НЕ ПАНИКОВАТЬ, А ТРЕЗВО РАССЧИТАТЬ

Рассмотрим ещё один пример, чуть более сложный, но не менее интересный. Предположим, во время сдачи ежегодных медицинских анализов врачи обнаружили у вас редкую болезнь, которой заболевает 1 человек из 1000. Врачи утверждают, что их метод точен на 90 %, а вероятность ошибочно диагностировать болезнь, когда пациент на самом деле здоров, равна 1 %. Большинство людей и врачей в подобных ситуациях уверены, что человек болен, ведь точность метода очень высока — 90 %! Так ли это? Давайте оценим вероятность того, что человек здоров, при условии, что его результаты говорят, что он болен:

Результаты анализа будем обозначать через кавычки («болен» или «здоров»), а действительное состояние — без (болен или здоров). Нам известно, что заболевает 1 человек из 1000,
значит, вероятность заболеть и не заболеть равны:

Р(Болен)=0,001

Р(Здоров)=0,999

Рассмотрим вероятность в числителе дроби формулы:

Р(«Болен»| Здоров)=0,01

Это вероятность того, что тест выдал положительный результат, при условии, что человек здоров. То есть тест выдал ложноположительный результат, и эта вероятность заложена в условии задачи. А вероятность того, что результат будет положительным, при условии, что он болен, равна (это следует из условия задачи):

Р(«Болен»| Болен)=0,9

Осталось посчитать вероятность в знаменателе Р(«Болен»). То есть вероятность того, что человек болен по результатам теста:

Р(«Болен»)=Р(Здоров) × Р(«Болен»|Здоров) + Р(Болен) × Р(«Болен»|Болен).

Итак, человек может быть либо болен, либо здоров. Далее, на каждый исход есть два варианта теста либо положительный («болен»), либо отрицательный («не болен»). Отобразим эти варианты в виде дерева исходов. Нас интересуют исходы, приводящие к положительному результату («болен») — они помечены зелёным.

Р(«Болен»)= 0,9990 × 01+0,001 × 0,9 = 0,01089
Подставим значения и рассчитаем искомую вероятность:

Иначе говоря, с более чем 91,73 %-ной вероятностью можно считать, что вы здоровы. Из расчётов видно, вопреки нашему первоначальному ожиданию, что мы больны с вероятностью 90 %, мы получили обратный результат с почти такой же вероятностью. Но обратите внимание и на другой факт: изначально вероятность быть здоровым была 0,999, а после теста снизилась до 0,9173. То есть новые сведения позволяют скорректировать нашу исходную вероятность, а значит, результат теста всё-таки её скорректировал.