To main content

Интерпретация ROC-анализа

Зачастую для разделения выборки на две категории (например, с наличием или отсутствием заболевания) используют количественный показатель. ROC-анализ (receiver operating characteristic) позволяет оценить возможности диагностического теста при разных значениях количественной переменной.
По результатам этого анализа выстраивается ROC-кривая, которая отражает долю ложноположительных (по оси OX) и истинно положительных (по оси OY) результатов теста при использовании различных значений количественной переменной в качестве пороговых.
При интерпретации результатов ROC-анализа имеют значение:
  • Значимость отличий ROC-кривой от диагональной опорной линии
Если отличия значимые, показатель можно использовать в качестве классификатора.
  • Площадь под кривой (area under curve, AUC)
Чем больше AUC, тем более качественным можно считать классификатор.
  • Характеристики диагностического теста при выбранном пороговом значении
Существуют разные подходы к выбору порогового значения:
  • Выбор значения с оптимальным балансом чувствительности и специфичности
Это один из наиболее распространенных подходов к выбору пороговой точки.
Для оценки зачастую используют индекс Йодена (Youden's index, J), который представляет собой сумму чувствительности и специфичности минус 1.

J = Se + Sp – 1

  • Выбор значения с максимальной чувствительностью при достаточной специфичности
Такой подход бывает оправдан, если важнее повысить долю истинно-положительных результатов (даже если при этом возрастет доля ложноположительных).
Например, порог с максимальной чувствительностью стоит выбрать, если наиболее важно не пропустить заболевание (даже если при этом возрастет риск ошибочного подтверждения диагноза).
  • Выбор значения с максимальной специфичностью при достаточной чувствительности
Такой подход бывает оправдан, если важнее повысить долю истинно-отрицательных результатов (даже если при этом возрастет доля ложноотрицательных).
Например, порог с максимальной специфичностью стоит выбрать, если наиболее важно не допустить ошибочного подтверждения диагноза (даже если при этом возрастет риск пропустить заболевание).
  • Использование двух пороговых значений
В некоторых случаях оправдано использование двух вышеупомянутых точек. Для части выборки принадлежность к той или иной категории признается сомнительной, при этом доля таких случаев может оказаться довольно большой. Однако такой подход повышает уверенность в результатах тестирования остальных пациентов.
Made on
Tilda