# 卡方独立性检验计算器
虽然像 A/B 测试或描述性统计这样的经典工具在处理连续数字(均值、收入、重量)方面表现出色,但现实世界充满了分类数据(颜色、品牌、满意度水平)。卡方独立性计算器是用于分析确定两个定性变量是在统计上存在联系,还是彼此完全独立变化的“王牌”检验。# 卡方统计量 (χ²) 究竟是用来做什么的?
卡方独立性检验将观测频数(您测量和收集的真实数据)与期望频数(如果变量之间根本没有相互作用,我们期望在每个单元格中看到的频数)进行比较。相关变量(存在关系)
一个类别的比例根据另一个类别的不同而剧烈变化。
- 示例:移动端访问者更喜欢设计 A,而 PC 端用户更喜欢设计 B。
- 卡方值 (χ²) 激增,P 值下降。
- 克莱姆 V 指示强度(如:强 > 0.5)。
独立变量(偶然)
各级比例保持坚如磐石的稳定。
- 示例:客户的眼睛颜色不影响他们购买哪个品牌的汽车。
- 卡方值极小,且 P 值大于 0.05。
- 无法拒绝原假设。
# 克莱姆 V:理解联系的强度
获得极低的 P 值并不意味着变量之间存在“强烈”联系;它只表明偶然因素不太可能是原因(也许是因为您有数万个真实案例)。为了衡量“效应量”,我们自动纳入了克莱姆 V (Cramér's V) 系数。| 计算器(V 值) | 分析评级 | 解释 |
|---|---|---|
| 0.00 到 0.10 | 无关联 / 琐碎关联 | 理论上相关,但很不明显,对商业目的来说毫无用处。 |
| 0.11 到 0.30 | 弱关联 | 存在轻微联系,但许多其他外部因素权重更大。 |
| 0.31 到 0.50 | 中度关联 | 两种特征明显相互影响。 |
| 0.50 以上 | 强关联 | 非常清晰的联系。了解变量 A 可以非常好地预测变量 B。 |
数学可行性条件
注意空单元格!为了使 Pearson 卡方近似值在钟形曲线下保持稳健,方法论上要求至少 80% 的期望频数(而非观测频数)大于 5,且没有单元格低于 1。如果未满足此条件,我们的警告指示器将触发,建议您合并类别。# 内置残差热力图
为了增强用户体验并协助得出报告结论,我们的矩阵会根据单元格的标准化残差(偏差)自动对其背景着色:绿色色调:该单元格的成功次数远多于纯数学上的预期。
红色色调:与预期标准相比,该单元格危险地“空”。
# 卡方术语表
- 观测频数
- 您在实验室或调查中实际统计的确切频数。
- 期望频数
- 假设变量相互独立,根据所在行和列的总计计算出的理论频数。
- 自由度 (df)
- 独立数据的几何数量。计算方法为(行数-1)乘以(列数-1)。
- 标准化残差
- 观测值与期望值之间经过标准化的差异。衡量哪个单元格对发现的贡献最大。