Сравнение групп

Сравнение групп в медицинских исследованиях

От t-теста до ANOVA: как выбрать правильный статистический критерий

🎯 Зачем нужно сравнение групп?

Большинство клинических исследований строятся вокруг сравнения: эффективность препарата против плацебо, исходы в разных возрастных группах, лабораторные показатели у здоровых и больных. Правильный выбор статистического теста — залог того, что выводы будут достоверными и воспроизводимыми.

В этой статье разберём основные критерии выбора: тип данных (количественные, категориальные, ранговые), количество групп (2 или больше), зависимость наблюдений (независимые или парные/повторные измерения).

📊 Типы данных и проверка нормальности

  • Количественные (непрерывные) – рост, давление, уровень глюкозы. Для них важна проверка распределения.
  • Категориальные (номинальные) – пол, наличие осложнения, группа лечения. Сравнивают частоты.
  • Порядковые (ранговые) – степень тяжести (лёгкая/средняя/тяжёлая), стадия рака. Здесь нужны непараметрические тесты.

Проверка нормальности (тест Шапиро-Уилка, критерий Колмогорова-Смирнова, визуально по гистограмме и Q-Q plot). Для больших выборок (>100) центральная предельная теорема позволяет использовать параметрические тесты даже при умеренных отклонениях, но лучше перестраховаться и применять непараметрические аналоги, если распределение сильно отличается от нормального.

📌 Сравнение двух независимых групп

  • t-тест (Стьюдента) – для количественных данных с нормальным распределением и примерно равными дисперсиями. Позволяет сравнить средние.
  • Критерий Манна-Уитни (U-тест) – непараметрический аналог t-теста. Подходит для порядковых данных или количественных с отклонением от нормальности.
  • Критерий хи-квадрат (χ²) – для сравнения долей в категориальных таблицах 2×2 (например, доля ответивших на лечение).
  • Точный тест Фишера – используется при малых ожидаемых частотах (менее 5 в любой ячейке).

Пример: сравнение систолического давления в группе лечения и плацебо. Если давление распределено нормально – t-тест, если нет – Манна-Уитни.

🔄 Сравнение двух связанных групп (парный дизайн)

  • Парный t-тест – для количественных данных с нормальным распределением разностей. Пример: давление «до» и «после» лечения.
  • Критерий Уилкоксона (знаковых рангов) – непараметрический аналог парного t-теста. Подходит для порядковых данных или при отсутствии нормальности.
  • Критерий знаков (sign test) – ещё более простой непараметрический метод, но менее мощный. Используется, когда можно учесть только направление изменения (улучшилось/ухудшилось).

📌 Сравнение трёх и более групп

  • Однофакторный дисперсионный анализ (ANOVA) – для количественных данных с нормальным распределением. Позволяет выявить, есть ли различия между несколькими группами.
  • Критерий Краскела-Уоллиса – непараметрический аналог ANOVA. Подходит для порядковых данных или при нарушении нормальности.
  • Поправки на множественные сравнения – если ANOVA показал значимость, нужно выяснить, какие именно группы различаются. Используют post‑hoc тесты: Тьюки (при равных дисперсиях), Геймса-Хоуэлла (при неравных дисперсиях), Бонферрони.
  • Двухфакторный ANOVA – учитывает влияние двух факторов (например, лечение и пол) и их взаимодействие.

📋 Шпаргалка: какой тест выбрать?

  • 2 независимые группы, количественные, нормальные → t-тест (Стьюдента).
  • 2 независимые группы, количественные, НЕ нормальные → Манна-Уитни.
  • 2 независимые группы, категориальные (доли) → хи-квадрат или точный тест Фишера.
  • 2 связанные группы, количественные, нормальные → парный t-тест.
  • 2 связанные группы, количественные, НЕ нормальные → Уилкоксон.
  • 3+ независимые группы, количественные, нормальные → ANOVA (с post‑hoc).
  • 3+ независимые группы, количественные, НЕ нормальные → Краскела-Уоллиса.

⚠️ Типичные ошибки при сравнении групп

  • Множественные тесты без поправки – если вы сравниваете 10 показателей, вероятность ложноположительного результата резко возрастает. Используйте поправку Бонферрони, Холма или контролируйте FDR.
  • Игнорирование проверки нормальности – применение t-теста к ненормальным данным может привести к неверным p-значениям.
  • Сравнение более двух групп с помощью нескольких t-тестов – вместо этого используйте ANOVA, а затем post‑hoc.
  • Неучёт зависимых наблюдений – если одни и те же пациенты измерены несколько раз, нужны парные тесты или ANOVA с повторными измерениями.
⚠️ Информация носит ознакомительный характер. Для планирования исследования и выбора статистических методов рекомендуется консультация с профессиональным статистиком.

Выполняйте сравнения групп быстро и без ошибок

В «АвИ Орбита» реализованы все описанные тесты с автоматической проверкой условий применимости. Загружайте данные, выбирайте группы и получайте корректные p‑значения и доверительные интервалы.

Узнать больше