Ошибки 1 и 2 рода в статистике

В статистике ошибка I рода — это ложноположительное заключение, а ошибка II рода — ложноотрицательное заключение.

Принятие статистического решения всегда связано с неопределенностями, поэтому риски совершения этих ошибок неизбежны при проверке гипотез.

Вероятность совершения ошибки первого рода — это уровень значимости, или альфа (α), а вероятность совершения ошибки второго рода — бета (β). Эти риски можно свести к минимуму путем тщательного планирования дизайна вашего исследования.

Пример: ошибка I и II рода
Вы решаете пройти тестирование на COVID-19 на основании легких симптомов. Потенциально могут возникнуть две ошибки:

  • Ошибка I типа (ложноположительный результат): результат теста говорит о том, что у вас есть коронавирус, но на самом деле его нет.
  • Ошибка II типа (ложноотрицательный результат): результат теста говорит о том, что у вас нет коронавируса, но на самом деле он у вас есть.

Ошибка I рода

Ошибка I рода означает отказ от нулевой гипотезы, когда она на самом деле верна. Это означает, что результаты статистически значимы, хотя на самом деле они получены чисто случайно или из-за несвязанных факторов.

Риск совершения этой ошибки — это выбранный вами уровень значимости. Это значение, которое вы устанавливаете в начале исследования для оценки статистической вероятности получения результатов (значение p).

Уровень значимости обычно устанавливается на уровне 0,05 или 5%. Это означает, что вероятность появления ваших результатов составляет всего 5% или меньше, если нулевая гипотеза действительно верна.

Если значение p вашего теста ниже уровня значимости, это означает, что ваши результаты статистически значимы и соответствуют альтернативной гипотезе. Если ваше значение p выше уровня значимости, то ваши результаты считаются статистически незначимыми.

Пример: статистическая значимость и ошибка I рода.
В своем клиническом исследовании вы сравниваете симптомы пациентов, получивших новый препарат или контрольное лечение. Используя t-тест, вы получаете значение p=0,035. Это значение p ниже, чем ваша альфа 0,05, поэтому вы считаете свои результаты статистически значимыми и отвергаете нулевую гипотезу.

Однако значение p означает, что вероятность того, что ваши результаты будут получены, если нулевая гипотеза верна, составляет 3,5%. Поэтому риск допустить ошибку I рода все же существует.

Чтобы уменьшить вероятность ошибки I рода, вы можете просто установить более низкий уровень значимости.

Ошибка II рода

Ошибка второго рода означает отказ от отклонения нулевой гипотезы, когда она на самом деле неверна. Это не совсем то же самое, что «принятие» нулевой гипотезы, поскольку проверка гипотезы может только сказать вам, следует ли отвергать нулевую гипотезу.

Вместо этого ошибка второго рода означает неспособность прийти к выводу о наличии эффекта, хотя он действительно имел место. В действительности ваше исследование, возможно, не имело достаточной статистической мощности, чтобы обнаружить эффект определенного размера.

Мощность — это степень, в которой тест может правильно обнаружить реальный эффект, если таковой имеется. Уровень мощности 80% или выше обычно считается приемлемым.

Риск ошибки второго рода обратно пропорционален статистической мощности исследования. Чем выше статистическая мощность, тем ниже вероятность совершения ошибки второго рода.

Пример: статистическая мощность и ошибка второго рода.
При подготовке клинического исследования вы проводите анализ мощности и определяете, что при размере выборки у вас есть 80%-ная вероятность обнаружить величину эффекта 20% или выше. Размер эффекта в 20% означает, что медикаментозное вмешательство уменьшает симптомы на 20% больше, чем контрольное лечение.Однако тип II может возникнуть, если эффект меньше этого размера. Меньший эффект вряд ли будет обнаружен в вашем исследовании из-за недостаточной статистической мощности.

Статистическая мощность определяется:

  • Размер эффекта: более крупные эффекты легче обнаружить.
  • Ошибка измерения: систематические и случайные ошибки в записанных данных снижают мощность.
  • Размер выборки: выборки большего размера уменьшают ошибку выборки и увеличивают мощность.
  • Уровень значимости: повышение уровня значимости увеличивает мощность.

Чтобы (косвенно) снизить риск ошибки второго рода, вы можете увеличить размер выборки или уровень значимости.

Компромисс между ошибками типа I и типа II

Коэффициенты ошибок типа I и типа II влияют друг на друга. Это связано с тем, что уровень значимости (коэффициент ошибок типа I) влияет на статистическую мощность, которая обратно пропорциональна частоте ошибок типа II.

Это означает, что существует важный компромисс между ошибками типа I и типа II:

  • Установка более низкого уровня значимости снижает риск ошибки типа I, но увеличивает риск ошибки типа II.
  • Увеличение мощности теста снижает риск ошибки типа II, но увеличивает риск ошибки типа I.

Что хуже ошибка  I или II рода?

Для статистиков ошибка I рода обычно более опасна. Однако с практической точки зрения любой тип ошибки может быть хуже в зависимости от контекста вашего исследования.

Ошибка I рода означает ошибочное игнорирование основного статистического предположения нулевой гипотезы. Это может привести к неадекватной новой политике, практике или лечению или к пустой трате ресурсов.

Пример: последствия ошибки первого рода
На основании неверного вывода об эффективности нового лекарственного препарата более миллиона пациентов прописывают его, несмотря на риск серьезных побочных эффектов и недостаточное исследование результатов. Последствия этой ошибки I типа также означают, что другие варианты лечения отвергаются в пользу этого вмешательства.

Напротив, ошибка второго рода означает неспособность отвергнуть нулевую гипотезу. Это может привести лишь к упущенным возможностям для инноваций, но это также может иметь важные практические последствия.

Пример: последствия ошибки второго рода
Если допущена ошибка II рода, медикаментозное вмешательство считается неэффективным, если оно действительно может улучшить симптомы заболевания. Это означает, что лекарство, имеющее важное клиническое значение, не достигает большого числа пациентов, которым оно могло бы принести ощутимую пользу.
Ошибки 1 и 2 рода в статистике
Пролистать наверх
Яндекс.Метрика
WhatsApp
ДИССЕРТАНТ