Сравнение групп

Сравнение групп в медицинских исследованиях

От t-теста до ANOVA: как выбрать правильный статистический критерий

🎯 Зачем нужно сравнение групп?

Большинство клинических исследований строятся вокруг сравнения: эффективность препарата против плацебо, исходы в разных возрастных группах, лабораторные показатели у здоровых и больных. Правильный выбор статистического теста — залог того, что выводы будут достоверными и воспроизводимыми.

В этой статье разберём основные критерии выбора: тип данных (количественные, категориальные, ранговые), количество групп (2 или больше), зависимость наблюдений (независимые или парные/повторные измерения).

📊 Типы данных и проверка нормальности

Количественные (непрерывные) – рост, давление, уровень глюкозы. Для них важна проверка распределения.
Категориальные (номинальные) – пол, наличие осложнения, группа лечения. Сравнивают частоты.
Порядковые (ранговые) – степень тяжести (лёгкая/средняя/тяжёлая), стадия рака. Здесь нужны непараметрические тесты.

Проверка нормальности (тест Шапиро-Уилка, критерий Колмогорова-Смирнова, визуально по гистограмме и Q-Q plot). Для больших выборок (>100) центральная предельная теорема позволяет использовать параметрические тесты даже при умеренных отклонениях, но лучше перестраховаться и применять непараметрические аналоги, если распределение сильно отличается от нормального.

📌 Сравнение двух независимых групп

t-тест (Стьюдента) – для количественных данных с нормальным распределением и примерно равными дисперсиями. Позволяет сравнить средние.
Критерий Манна-Уитни (U-тест) – непараметрический аналог t-теста. Подходит для порядковых данных или количественных с отклонением от нормальности.
Критерий хи-квадрат (χ²) – для сравнения долей в категориальных таблицах 2×2 (например, доля ответивших на лечение).
Точный тест Фишера – используется при малых ожидаемых частотах (менее 5 в любой ячейке).

Пример: сравнение систолического давления в группе лечения и плацебо. Если давление распределено нормально – t-тест, если нет – Манна-Уитни.

🔄 Сравнение двух связанных групп (парный дизайн)

Парный t-тест – для количественных данных с нормальным распределением разностей. Пример: давление «до» и «после» лечения.
Критерий Уилкоксона (знаковых рангов) – непараметрический аналог парного t-теста. Подходит для порядковых данных или при отсутствии нормальности.
Критерий знаков (sign test) – ещё более простой непараметрический метод, но менее мощный. Используется, когда можно учесть только направление изменения (улучшилось/ухудшилось).

📌 Сравнение трёх и более групп

Однофакторный дисперсионный анализ (ANOVA) – для количественных данных с нормальным распределением. Позволяет выявить, есть ли различия между несколькими группами.
Критерий Краскела-Уоллиса – непараметрический аналог ANOVA. Подходит для порядковых данных или при нарушении нормальности.
Поправки на множественные сравнения – если ANOVA показал значимость, нужно выяснить, какие именно группы различаются. Используют post‑hoc тесты: Тьюки (при равных дисперсиях), Геймса-Хоуэлла (при неравных дисперсиях), Бонферрони.
Двухфакторный ANOVA – учитывает влияние двух факторов (например, лечение и пол) и их взаимодействие.

📋 Шпаргалка: какой тест выбрать?

2 независимые группы, количественные, нормальные → t-тест (Стьюдента).
2 независимые группы, количественные, НЕ нормальные → Манна-Уитни.
2 независимые группы, категориальные (доли) → хи-квадрат или точный тест Фишера.
2 связанные группы, количественные, нормальные → парный t-тест.
2 связанные группы, количественные, НЕ нормальные → Уилкоксон.
3+ независимые группы, количественные, нормальные → ANOVA (с post‑hoc).
3+ независимые группы, количественные, НЕ нормальные → Краскела-Уоллиса.

⚠️ Типичные ошибки при сравнении групп

Множественные тесты без поправки – если вы сравниваете 10 показателей, вероятность ложноположительного результата резко возрастает. Используйте поправку Бонферрони, Холма или контролируйте FDR.
Игнорирование проверки нормальности – применение t-теста к ненормальным данным может привести к неверным p-значениям.
Сравнение более двух групп с помощью нескольких t-тестов – вместо этого используйте ANOVA, а затем post‑hoc.
Неучёт зависимых наблюдений – если одни и те же пациенты измерены несколько раз, нужны парные тесты или ANOVA с повторными измерениями.

⚠️ Информация носит ознакомительный характер. Для планирования исследования и выбора статистических методов рекомендуется консультация с профессиональным статистиком.

Выполняйте сравнения групп быстро и без ошибок

В «АвИ Орбита» реализованы все описанные тесты с автоматической проверкой условий применимости. Загружайте данные, выбирайте группы и получайте корректные p‑значения и доверительные интервалы.

Узнать больше