Онлайн калькулятор проверки гипотез AB теста

Сравните две группы (A и B), чтобы определить, есть ли статистически значимая разница в их конверсиях или средних значениях. Мгновенный расчет P-значения.

P-значение (p)
0.000
Достаточно оснований для отклонения нулевой гипотезы
Анализ улучшения (Lift)
0% улучшения относительно Группы A
Статистическая уверенность: 0%
Распределения вероятностей

Наблюдайте за перекрытием: меньшее перекрытие означает большую уверенность в том, что различия реальны, а не случайны.

Текст для вашего отчета

После анализа X испытуемых Группа B показывает улучшение на Y% со статистической уверенностью Z% (p=0,00).

Студия утилит

Хотите эту утилиту на своём сайте?

Настройте цвета и тёмную тему для WordPress, Notion или вашего сайта.

Часто задаваемые вопросы

Что означает P-значение?

P-значение (P-Value) сообщает вам вероятность того, что разница в результатах между Группой A и Группой B является чистой случайностью. Если P-значение ниже уровня значимости (обычно 0,05), это означает, что вы можете быть на 95% уверены в реальности структурного различия.

Что такое уровень значимости (Альфа или α)?

Это ваш уровень строгости теста. Альфа 0,05 требует 95-процентной уверенности в том, что Группа B отличается от A, чтобы считать результат значимым. Альфа 0,01 требует гораздо большей строгости (99%). Академическая и промышленная конвенция — использование 0,05 по умолчанию.

В чем разница между тестом пропорций и тестом средних?

Тест пропорций измеряет дихотомические переменные успеха или неудачи: клики, открытия писем, конверсии. Тест средних сравнивает накопленное количественное поведение: средний чек в корзине или дни клинического выздоровления.

Что если моя выборка меньше 30 испытуемых?

Аппроксимация нормальным распределением становится менее точной при таких малых выборках (центральная предельная теорема). Для принятия клинических решений мы рекомендуем использовать более консервативные методы точной вероятности или скорректированный t-критерий Стьюдента.

# Онлайн калькулятор проверки гипотез A/B-теста

Принимать решения на основе интуиции опасно; принимать их на основе чистых данных — путь к успеху. Калькулятор проверки гипотез (A/B-тест) — это незаменимый инструмент для аналитиков, маркетологов и исследователей, которым необходимо подтвердить, является ли разница между двумя группами статистически значимой или просто результатом случая.
P-значение Финальный судья
Локально Без загрузки данных
Мгновенно Нативные графики

# Почему мы разделяем тесты на Конверсии и Средние значения?

В зависимости от характера вашего исследования метрика успеха будет меняться. Наш инструмент нативно поддерживает два наиболее широко используемых типа статистических тестов в индустрии.

Тест пропорций (Конверсии)

Сравнивает проценты или показатели успеха между двумя группами.

  • Идеально для маркетинга (Клики, Продажи, Подписки)
  • Использует общее количество случаев (n) и успехи (x)
  • Применяет Z-критерий для двух пропорций

Тест непрерывных средних

Сравнивает средние числовые значения между двумя группами.

  • Идеально для среднего чека, времени на сайте или клинических испытаний
  • Использует среднее (μ) и стандартное отклонение (σ)
  • Применяет надежную нормальную аппроксимацию для выборок (Z/T)

# Как интерпретировать результаты: P-значение — ваш гид

Сердцем этого калькулятора является знаменитое P-значение. Это число сообщает вам вероятность получения таких наблюдаемых различий, если бы Нулевая гипотеза (утверждающая, что «обе группы равны») была верна.
Наблюдаемое P-значение Практический смысл Стандартное решение
Больше 0,05Разница мала по сравнению с дисперсией. Случай вполне может ее объяснить.НЕ отвергать Нулевую гипотезу. Нет доказанного реального улучшения.
Меньше 0,05Крайне маловероятно, что случай вызвал такую разницу. Существует реальный эффект.Отвергнуть Нулевую гипотезу. Вариант B лучше!
Меньше 0,01Свидетельства в пользу изменений подавляющие (99% уверенности).Твердо отвергнуть. Огромный успех эксперимента.
Коррекция для малых выборок
Если ваши группы обрабатывают менее 30 испытуемых, инструмент покажет предупреждение «Малая выборка». В этих пограничных сценариях классическая нормальная аппроксимация теряет точность; мы рекомендуем использовать точный t-критерий Стьюдента или инструменты Фишера.

# Глоссарий A/B-тестирования

Контрольная группа (A)
Оригинальная версия или база, относительно которой вы будете оценивать свой эксперимент.
Вариант (B)
Новая модифицированная версия, от которой вы ожидаете улучшения метрик.
Lift (Относительное улучшение)
Процентное изменение показателей Группы B относительно базы Группы A.
Уровень значимости (α)
Порог ошибки, который вы готовы принять (обычно 5% или 0,05).

Библиографические ссылки