在线 A/B 测试假设检验计算器

比较两个小组(A 和 B),以确定它们的转化率或平均值是否存在统计学上的显著差异。立即计算 P 值。

P 值 (p)
0.000
有足够的证据拒绝原假设
提升分析 (Lift)
0% 相对于 A 组的改进
统计置信度: 0%
概率分布

观察重叠部分:重叠越少,表明差异是真实的而非偶然结果的确定性越高。

用于报告的文本

分析了 X 个受试者后,B 组在 Z% 的统计置信度下显示出 Y% 的提升 (p=0.00)。

工具工作室

想把这个工具添加到你的网站吗?

为 WordPress、Notion 或你自己的网站自定义配色和深色模式。

常见问题

P 值代表什么?

P 值告诉您 A 组和 B 组之间的表现差异纯粹是由偶然因素导致的概率。如果 P 值低于显著性水平(通常为 0.05),这意味着您可以 95% 肯定这种结构性差异是真实存在的。

什么是显著性水平(Alpha 或 α)?

这是您对测试的严格程度要求。Alpha 为 0.05 要求 95% 确定 B 组与 A 组不同才能认为结果有效。Alpha 为 0.01 则要求更高的严格程度(99%)。学术界和工业界的惯例是默认使用 0.05。

比例检验和平均值检验有什么区别?

比例检验测量二元的成功或失败变量:点击次数、电子邮件打开次数、转化次数。平均值检验比较累积的定量行为:平均购物车支出或临床康复天数。

如果我的样本量小于 30 个受试者怎么办?

样本量如此之小时,正态分布近似会变得不够精确(中心极限定理)。对于临床决策,我们建议使用更保守的精确概率技术或调整后的 Student t 检验技术。

# 在线 A/B 测试假设检验计算器

凭直觉做决定是危险的;基于纯粹的数据做决定才是成功之路。假设检验计算器(A/B 测试)是分析师、营销人员和研究人员的必备工具,用于验证两个小组之间的差异是具有统计学显著性,还是仅仅是偶然的结果。
P 值 最终裁决者
本地 不上传数据
即时 内置图表

# 为什么我们要将测试分为“转化率”和“平均值”?

根据研究性质的不同,成功指标也会发生变化。我们的工具原生支持行业内最广泛使用的两种统计检验类型。

比例检验(转化率)

比较两组之间的百分比或成功率。

  • 适用于营销(点击次数、销售额、订阅数)
  • 使用总案例数 (n) 和成功次数 (x)
  • 应用双方比例 Z 检验

连续平均值检验

比较两组之间的平均数值。

  • 适用于客单价、页面停留时间或临床试验
  • 使用平均值 (μ) 和标准差 (σ)
  • 对样本应用稳健的正态近似 (Z/T)

# 如何解读结果:P 值是您的指南

本计算器的核心是著名的 P 值。这个数字告诉您,如果原假设(假设“两组相等”)为真,获得这些观测差异的概率。
观测 P 值 实际意义 标准决策
大于 0.05相对于方差而言,差异较小。偶然因素完全可以解释这一点。不拒绝原假设。没有证明存在实际改进。
小于 0.05偶然因素导致如此大差异的可能性极低。存在实际效应。拒绝原假设。变体 B 表现更好!
小于 0.01支持变化的证据是压倒性的(99% 置信度)。坚决拒绝。实验取得巨大成功。
小样本修正
如果您的分组处理的受试者少于 30 个,工具将显示“小样本”警告。在这些临界场景中,经典的正态近似会失去精度;我们建议使用精确的 Student t 检验或 Fisher 工具。

# A/B 测试术语表

对照组 (A)
用于衡量实验效果的原始版本或基准。
变体 (B)
您期望能改善指标的新修改版本。
提升(相对改进)
B 组表现相对于 A 组基准的百分比变化。
显著性水平 (α)
您愿意接受的错误阈值(通常为 5% 或 0.05)。

参考文献