Что означают цифры и как выбрать главную метрику для вашей задачи
Метрики позволяют ответить на ключевые вопросы:
Выбор метрики зависит от типа задачи (классификация, регрессия, анализ выживаемости) и целей исследования. Ниже разберём основные метрики, которые доступны в «АвИ Орбита».
Матрица ошибок (confusion matrix) — основа для расчёта большинства метрик. Она показывает количество:
Accuracy (доля правильных ответов): (TP+TN)/(TP+TN+FP+FN). Хороша при сбалансированных классах. При сильном дисбалансе может вводить в заблуждение.
Precision (точность): TP/(TP+FP). Доля предсказанных положительных случаев, которые действительно являются положительными. Важна, когда цена ложноположительного вывода высока (например, ненужное инвазивное лечение).
Recall (чувствительность, полнота): TP/(TP+FN). Доля реальных положительных случаев, которые модель смогла обнаружить. Критична, когда пропуск заболевания опасен (онкологический скрининг).
F1‑score: гармоническое среднее precision и recall: 2 × (precision × recall)/(precision + recall). Полезна, когда нужен баланс между двумя метриками.
ROC‑AUC (площадь под ROC‑кривой): показывает способность модели различать классы при разных порогах. AUC 0,5 — случайное угадывание, 0,8–0,9 — хорошая дискриминация, >0,9 — отличная. Не чувствительна к дисбалансу классов.
PR‑AUC (площадь под precision‑recall кривой): лучше подходит для сильно несбалансированных данных (например, редкое заболевание).
В «АвИ Орбита» после обучения классификатора отображаются все перечисленные метрики, матрица ошибок и ROC‑кривая.
В «АвИ Орбита» после обучения регрессионной модели выводятся R², MAE, RMSE, а также график «предсказанные vs фактические» и остатки.
В «АвИ Орбита» для моделей выживаемости доступны C‑index, а также кривые Каплана‑Мейера для групп риска (для визуальной оценки дискриминации) и Brier-score.
Всегда смотрите на несколько метрик — одна цифра не даёт полной картины.
Представим, что модель предсказывает злокачественность новообразования. Важно не пропустить рак (FN) — поэтому выбираем высокий recall. Но при этом ложноположительные срабатывания (FP) ведут к ненужным биопсиям. Поэтому оптимальный баланс — F1‑score. ROC‑AUC поможет сравнить модели в целом, не завися от выбранного порога.
В «АвИ Орбита» вы можете после обучения модели изменять порог классификации и видеть, как меняются метрики, чтобы выбрать оптимальный для вашей клинической ситуации.
Все описанные метрики, графики и матрицы ошибок доступны в графическом интерфейсе после обучения модели. Не нужно писать код — просто загрузите данные, выберите алгоритм и получите подробный отчёт о качестве.
Узнать больше