Статистические войны: как учёные спорят о достоверности открытий экзопланет
Ничто так не будоражит учёных, как старый добрый статистический спор. Когда речь заходит о поиске двойников Земли или биосигнатур в атмосферах далёких планет, эти дискуссии могут иметь реальные последствия — как для распределения ресурсов на новые наблюдения, так и для нашего понимания места человечества во Вселенной.
Недавно на сервере препринтов arXiv появилась статья двух известных «охотников за экзопланетами» — Дэвида Киппинга (Колумбийский университет) и Бьёрна Беннеке (UCLA). В ней учёные утверждают, что их коллеги десятилетиями неправильно применяли статистику при интерпретации данных, и предлагают новый способ представления результатов публике.
Почему статистика — это важно?
Хотя статистика может казаться сугубо технической частью астрономических исследований, именно она лежит в основе научных открытий. Чтобы доказать существование планеты или биосигнатуры, данные должны достичь определённого уровня «статистической значимости».
Проблема в том, что в науке используются два разных подхода:
-
Байесовская статистика (вероятность того, что явление реально, а не случайно).
-
Частотная (frequentist) статистика (насколько неожиданным является наблюдаемый результат).
Перевод между ними — сложная задача, и, по мнению авторов статьи, учёные десятилетиями делали это неправильно.
Ошибка в расчётах: «5 сигм» или меньше?
Особую известность частотный подход получил после открытия бозона Хиггса в 2012 году, когда его значимость оценили в «5 сигм» (то есть вероятность ошибки — менее 1 на 3,5 миллиона). С тех пор «сигмы» стали стандартом в научных публикациях.
Однако, как выяснили Киппинг и Беннеке, в ключевой статье 2013 года (соавтором которой был сам Беннеке) закралась ошибка: вместо «не более чем X сигм» было написано «как минимум X сигм». Это привело к завышенной оценке достоверности многих открытий.
Пример: спорный сигнал DMS на экзопланете K2-18b
Один из недавних скандалов — обнаружение диметилсульфида (DMS) в атмосфере планеты K2-18b. Это вещество на Земле производят микроорганизмы, поэтому его считают потенциальной биосигнатурой.
Но авторы новой статьи утверждают: если правильно пересчитать данные, значимость этого открытия не дотягивает до 3 сигм. То есть вероятность, что сигнал — просто шум, гораздо выше, чем заявлялось.
Что делать? Вернуться к «байесовским шансам»
Учёные предлагают два пути:
-
Использовать более строгие методы перевода между статистическими подходами.
-
Отказаться от «сигм» и говорить на языке байесовских вероятностей — как в ставках («шансы 10 к 1»).
«Если экзопланетологи начнут использовать понятные аналогии, их результаты станут понятнее и достовернее», — считают авторы.
Впрочем, научные баталии на этом не закончатся. Кто-то наверняка ответит мемной статьёй в защиту частотной статистики. Но одно ясно точно: чем больше данных мы получим, тем жарче будут споры об их значении.
В нашем Telegram‑канале, и группе ВК вы найдёте новости о непознанном, НЛО, мистике, научных открытиях, неизвестных исторических фактах. Подписывайтесь, чтобы ничего не пропустить.