🎯 Зачем нужно сравнение групп?
Большинство клинических исследований строятся вокруг сравнения: эффективность препарата против плацебо, исходы в разных возрастных группах, лабораторные показатели у здоровых и больных. Правильный выбор статистического теста — залог того, что выводы будут достоверными и воспроизводимыми.
В этой статье разберём основные критерии выбора: тип данных (количественные, категориальные, ранговые), количество групп (2 или больше), зависимость наблюдений (независимые или парные/повторные измерения).
📊 Типы данных и проверка нормальности
- Количественные (непрерывные) – рост, давление, уровень глюкозы. Для них важна проверка распределения.
- Категориальные (номинальные) – пол, наличие осложнения, группа лечения. Сравнивают частоты.
- Порядковые (ранговые) – степень тяжести (лёгкая/средняя/тяжёлая), стадия рака. Здесь нужны непараметрические тесты.
Проверка нормальности (тест Шапиро-Уилка, критерий Колмогорова-Смирнова, визуально по гистограмме и Q-Q plot). Для больших выборок (>100) центральная предельная теорема позволяет использовать параметрические тесты даже при умеренных отклонениях, но лучше перестраховаться и применять непараметрические аналоги, если распределение сильно отличается от нормального.
📌 Сравнение двух независимых групп
- t-тест (Стьюдента) – для количественных данных с нормальным распределением и примерно равными дисперсиями. Позволяет сравнить средние.
- Критерий Манна-Уитни (U-тест) – непараметрический аналог t-теста. Подходит для порядковых данных или количественных с отклонением от нормальности.
- Критерий хи-квадрат (χ²) – для сравнения долей в категориальных таблицах 2×2 (например, доля ответивших на лечение).
- Точный тест Фишера – используется при малых ожидаемых частотах (менее 5 в любой ячейке).
Пример: сравнение систолического давления в группе лечения и плацебо. Если давление распределено нормально – t-тест, если нет – Манна-Уитни.
🔄 Сравнение двух связанных групп (парный дизайн)
- Парный t-тест – для количественных данных с нормальным распределением разностей. Пример: давление «до» и «после» лечения.
- Критерий Уилкоксона (знаковых рангов) – непараметрический аналог парного t-теста. Подходит для порядковых данных или при отсутствии нормальности.
- Критерий знаков (sign test) – ещё более простой непараметрический метод, но менее мощный. Используется, когда можно учесть только направление изменения (улучшилось/ухудшилось).
📌 Сравнение трёх и более групп
- Однофакторный дисперсионный анализ (ANOVA) – для количественных данных с нормальным распределением. Позволяет выявить, есть ли различия между несколькими группами.
- Критерий Краскела-Уоллиса – непараметрический аналог ANOVA. Подходит для порядковых данных или при нарушении нормальности.
- Поправки на множественные сравнения – если ANOVA показал значимость, нужно выяснить, какие именно группы различаются. Используют post‑hoc тесты: Тьюки (при равных дисперсиях), Геймса-Хоуэлла (при неравных дисперсиях), Бонферрони.
- Двухфакторный ANOVA – учитывает влияние двух факторов (например, лечение и пол) и их взаимодействие.
📋 Шпаргалка: какой тест выбрать?
- 2 независимые группы, количественные, нормальные → t-тест (Стьюдента).
- 2 независимые группы, количественные, НЕ нормальные → Манна-Уитни.
- 2 независимые группы, категориальные (доли) → хи-квадрат или точный тест Фишера.
- 2 связанные группы, количественные, нормальные → парный t-тест.
- 2 связанные группы, количественные, НЕ нормальные → Уилкоксон.
- 3+ независимые группы, количественные, нормальные → ANOVA (с post‑hoc).
- 3+ независимые группы, количественные, НЕ нормальные → Краскела-Уоллиса.
⚠️ Типичные ошибки при сравнении групп
- Множественные тесты без поправки – если вы сравниваете 10 показателей, вероятность ложноположительного результата резко возрастает. Используйте поправку Бонферрони, Холма или контролируйте FDR.
- Игнорирование проверки нормальности – применение t-теста к ненормальным данным может привести к неверным p-значениям.
- Сравнение более двух групп с помощью нескольких t-тестов – вместо этого используйте ANOVA, а затем post‑hoc.
- Неучёт зависимых наблюдений – если одни и те же пациенты измерены несколько раз, нужны парные тесты или ANOVA с повторными измерениями.
⚠️ Информация носит ознакомительный характер. Для планирования исследования и выбора статистических методов рекомендуется консультация с профессиональным статистиком.
Выполняйте сравнения групп быстро и без ошибок
В «АвИ Орбита» реализованы все описанные тесты с автоматической проверкой условий применимости. Загружайте данные, выбирайте группы и получайте корректные p‑значения и доверительные интервалы.
Узнать больше