В статистике ошибка I рода — это ложноположительное заключение, а ошибка II рода — ложноотрицательное заключение.
Принятие статистического решения всегда связано с неопределенностями, поэтому риски совершения этих ошибок неизбежны при проверке гипотез.
Вероятность совершения ошибки первого рода — это уровень значимости, или альфа (α), а вероятность совершения ошибки второго рода — бета (β). Эти риски можно свести к минимуму путем тщательного планирования дизайна вашего исследования.
- Ошибка I типа (ложноположительный результат): результат теста говорит о том, что у вас есть коронавирус, но на самом деле его нет.
- Ошибка II типа (ложноотрицательный результат): результат теста говорит о том, что у вас нет коронавируса, но на самом деле он у вас есть.
Ошибка I рода
Ошибка I рода означает отказ от нулевой гипотезы, когда она на самом деле верна. Это означает, что результаты статистически значимы, хотя на самом деле они получены чисто случайно или из-за несвязанных факторов.
Риск совершения этой ошибки — это выбранный вами уровень значимости. Это значение, которое вы устанавливаете в начале исследования для оценки статистической вероятности получения результатов (значение p).
Уровень значимости обычно устанавливается на уровне 0,05 или 5%. Это означает, что вероятность появления ваших результатов составляет всего 5% или меньше, если нулевая гипотеза действительно верна.
Если значение p вашего теста ниже уровня значимости, это означает, что ваши результаты статистически значимы и соответствуют альтернативной гипотезе. Если ваше значение p выше уровня значимости, то ваши результаты считаются статистически незначимыми.
Однако значение p означает, что вероятность того, что ваши результаты будут получены, если нулевая гипотеза верна, составляет 3,5%. Поэтому риск допустить ошибку I рода все же существует.
Чтобы уменьшить вероятность ошибки I рода, вы можете просто установить более низкий уровень значимости.
Ошибка II рода
Ошибка второго рода означает отказ от отклонения нулевой гипотезы, когда она на самом деле неверна. Это не совсем то же самое, что «принятие» нулевой гипотезы, поскольку проверка гипотезы может только сказать вам, следует ли отвергать нулевую гипотезу.
Вместо этого ошибка второго рода означает неспособность прийти к выводу о наличии эффекта, хотя он действительно имел место. В действительности ваше исследование, возможно, не имело достаточной статистической мощности, чтобы обнаружить эффект определенного размера.
Мощность — это степень, в которой тест может правильно обнаружить реальный эффект, если таковой имеется. Уровень мощности 80% или выше обычно считается приемлемым.
Риск ошибки второго рода обратно пропорционален статистической мощности исследования. Чем выше статистическая мощность, тем ниже вероятность совершения ошибки второго рода.
Статистическая мощность определяется:
- Размер эффекта: более крупные эффекты легче обнаружить.
- Ошибка измерения: систематические и случайные ошибки в записанных данных снижают мощность.
- Размер выборки: выборки большего размера уменьшают ошибку выборки и увеличивают мощность.
- Уровень значимости: повышение уровня значимости увеличивает мощность.
Чтобы (косвенно) снизить риск ошибки второго рода, вы можете увеличить размер выборки или уровень значимости.
Компромисс между ошибками типа I и типа II
Коэффициенты ошибок типа I и типа II влияют друг на друга. Это связано с тем, что уровень значимости (коэффициент ошибок типа I) влияет на статистическую мощность, которая обратно пропорциональна частоте ошибок типа II.
Это означает, что существует важный компромисс между ошибками типа I и типа II:
- Установка более низкого уровня значимости снижает риск ошибки типа I, но увеличивает риск ошибки типа II.
- Увеличение мощности теста снижает риск ошибки типа II, но увеличивает риск ошибки типа I.
Что хуже ошибка I или II рода?
Для статистиков ошибка I рода обычно более опасна. Однако с практической точки зрения любой тип ошибки может быть хуже в зависимости от контекста вашего исследования.
Ошибка I рода означает ошибочное игнорирование основного статистического предположения нулевой гипотезы. Это может привести к неадекватной новой политике, практике или лечению или к пустой трате ресурсов.
Напротив, ошибка второго рода означает неспособность отвергнуть нулевую гипотезу. Это может привести лишь к упущенным возможностям для инноваций, но это также может иметь важные практические последствия.