Расчет доверительного интервала (confidence interval, CI, ДИ) применим для всех статистических тестов, которые подразумевают расчет уровня значимости (p-value, p). Рассмотрим различия между этими терминамии некоторые аспекты интерпретации доверительного интервала.
Что такое доверительный интервал?
В отличие от уровня значимости, определение доверительного интервала напрямую основано на предположениях о свойствах генеральной совокупности. Так, доверительный интервал для среднего отражает диапазон значений, в который с определенной вероятностью будет попадать среднее при повторении эксперимента. Обычно рассчитывают интервал для доверительной вероятности 95% или 99%.
Пример: 95% ДИ для уровня систолического артериального давления составляет [110; 125] мм рт. ст.
Это значит, что при повторениях исследования на выборках такого же размера в 95% случаев среднее значение систолического артериального давления будет оказываться между 110 и 125 мм рт. ст.
Верно также, что при повторениях исследования на выборках такого же размера 95% доверительных интервалов будут включать истинное значение систолического артериального давления.
Как видно из примера, доверительный интервал рассчитывается с учетом выборочного значения среднего, но позволяет строить ожидания о генеральной совокупности. При этом по сравнению с уровнем значимости интерпретация доверительного интервала зачастую более наглядна.
Доверительный интервал показывает, насколько исследователь может быть уверен в точности оценки. Более узкий доверительный интервал указывает на бо́льшую надежность результатов, а более широкий — на меньшую.
NB! Доверительный интервал можно рассчитать не только для количественных (ДИ для среднего), но и для категориальных показателей (ДИ для доли).
Когда используется доверительный интервал?
Зачастую доверительный интервал используют при оценке эффективности терапии. Например, многие клинические исследования препаратов оценивают среднюю разницу в эффекте лечения между двумя группами.
95% доверительный интервал средней разницы в эффекте лечения указывает на то, что в 95% случаев при повторении данного исследования на выборках такого же размера разница в эффекте лечения между группами будет попадать в этот интервал. Если 95% доверительный интервал включает ноль, можно сказать, что статистически значимой разницы между двумя группами не обнаружено – при повторении исследования каждая из групп может оказаться как лучше, так и хуже другой. Уровень значимости в этой ситуации будет превышать пороговый.