选择语言

EN English FR Français DE Deutsch IT Italiano PT Português NL Nederlands SV Svenska PL Polski ID Bahasa Indonesia TR Türkçe RU Русский JA 日本語 KO 한국어 ZH 中文 ES Español

在线 A/B 测试假设检验计算器

比较两个小组（A 和 B），以确定它们的转化率或平均值是否存在统计学上的显著差异。立即计算 P 值。

P 值 (p)

0.000

有足够的证据拒绝原假设

提升分析 (Lift)

0% 相对于 A 组的改进

统计置信度： 0%

概率分布

观察重叠部分：重叠越少，表明差异是真实的而非偶然结果的确定性越高。

用于报告的文本

分析了 X 个受试者后，B 组在 Z% 的统计置信度下显示出 Y% 的提升 (p=0.00)。

常见问题

P 值代表什么？

P 值告诉您 A 组和 B 组之间的表现差异纯粹是由偶然因素导致的概率。如果 P 值低于显著性水平（通常为 0.05），这意味着您可以 95% 肯定这种结构性差异是真实存在的。

什么是显著性水平（Alpha 或 α）？

这是您对测试的严格程度要求。Alpha 为 0.05 要求 95% 确定 B 组与 A 组不同才能认为结果有效。Alpha 为 0.01 则要求更高的严格程度（99%）。学术界和工业界的惯例是默认使用 0.05。

比例检验和平均值检验有什么区别？

比例检验测量二元的成功或失败变量：点击次数、电子邮件打开次数、转化次数。平均值检验比较累积的定量行为：平均购物车支出或临床康复天数。

如果我的样本量小于 30 个受试者怎么办？

样本量如此之小时，正态分布近似会变得不够精确（中心极限定理）。对于临床决策，我们建议使用更保守的精确概率技术或调整后的 Student t 检验技术。

# 在线 A/B 测试假设检验计算器

凭直觉做决定是危险的；基于纯粹的数据做决定才是成功之路。假设检验计算器（A/B 测试）是分析师、营销人员和研究人员的必备工具，用于验证两个小组之间的差异是具有统计学显著性，还是仅仅是偶然的结果。

P 值最终裁决者

本地不上传数据

即时内置图表

# 为什么我们要将测试分为“转化率”和“平均值”？

根据研究性质的不同，成功指标也会发生变化。我们的工具原生支持行业内最广泛使用的两种统计检验类型。

比例检验（转化率）

比较两组之间的百分比或成功率。

适用于营销（点击次数、销售额、订阅数）
使用总案例数 (n) 和成功次数 (x)
应用双方比例 Z 检验

连续平均值检验

比较两组之间的平均数值。

适用于客单价、页面停留时间或临床试验
使用平均值 (μ) 和标准差 (σ)
对样本应用稳健的正态近似 (Z/T)

# 如何解读结果：P 值是您的指南

本计算器的核心是著名的 P 值。这个数字告诉您，如果原假设（假设“两组相等”）为真，获得这些观测差异的概率。

观测 P 值	实际意义	标准决策
大于 0.05	相对于方差而言，差异较小。偶然因素完全可以解释这一点。	不拒绝原假设。没有证明存在实际改进。
小于 0.05	偶然因素导致如此大差异的可能性极低。存在实际效应。	拒绝原假设。变体 B 表现更好！
小于 0.01	支持变化的证据是压倒性的（99% 置信度）。	坚决拒绝。实验取得巨大成功。

小样本修正

如果您的分组处理的受试者少于 30 个，工具将显示“小样本”警告。在这些临界场景中，经典的正态近似会失去精度；我们建议使用精确的 Student t 检验或 Fisher 工具。

# A/B 测试术语表

对照组 (A): 用于衡量实验效果的原始版本或基准。
变体 (B): 您期望能改善指标的新修改版本。
提升（相对改进）: B 组表现相对于 A 组基准的百分比变化。
显著性水平 (α): 您愿意接受的错误阈值（通常为 5% 或 0.05）。