# オンラインA/Bテスト仮説検定計算機
直感に基づいて決定を下すのは危険です。純粋なデータに基づいて決定を下すことこそが成功への道です。仮説検定計算機(A/Bテスト)は、2つのグループ間の差が統計的に有意であるか、単なる偶然の結果であるかを検証する必要があるアナリスト、マーケター、研究者にとって決定的なツールです。# なぜテストをコンバージョンと平均に分けるのですか?
調査の性質に応じて、成功指標は変わります。当ツールは、業界で最も広く使用されている2つの統計検定タイプをネイティブにサポートしています。比率の検定(コンバージョン)
2つのグループ間の割合や成功率を比較します。
- マーケティングに最適(クリック、販売、購読)
- 合計ケース数 (n) と成功数 (x) を使用
- 2標本の比率のZ検定を適用
連続した平均の検定
2つのグループ間の平均的な数値を比較します。
- 平均客単価、滞在時間、または臨床試験に最適
- 平均 (μ) と標準偏差 (σ) を使用
- サンプルに対する堅牢な正規近似を適用 (Z/T)
# 結果の解釈方法:P値はあなたのガイドです
この計算機の核心は、有名なP値です。この数値は、帰無仮説(「両方のグループは等しい」と仮定)が正しいとした場合に、今回観察されたような差が得られる確率を示します。| 観察されたP値 | 実用的な意味 | 標準的な決定 |
|---|---|---|
| 0.05以上 | 差は分散に対して小さいです。偶然で説明がつきます。 | 帰無仮説を棄却しない。実質的な改善は証明されませんでした。 |
| 0.05未満 | 偶然がこのような差を引き起こす可能性は極めて低いです。実質的な効果があります。 | 帰無仮説を棄却する。バリエーションBの方が優れた結果です! |
| 0.01未満 | 変化を支持する証拠が圧倒的です(99%の信頼度)。 | 断固として棄却する。実験は輝かしい成功を収めました。 |
小規模サンプルの補正
グループの対象が30未満の場合、ツールは「小規模サンプル」という警告を表示します。これらの境界線上のシナリオでは、古典的な正規近似の精度が低下します。正確なスチューデントのt検定やフィッシャーの正確検定ツールの使用をお勧めします。# A/Bテスト用語集
- コントロールグループ (A)
- 実験の測定基準となる元のバージョンまたはベースライン。
- バリエーション (B)
- 指標の改善を期待する、新しく修正されたバージョン。
- リフト(相対的な改善)
- グループAのベースラインに対するグループBのパフォーマンスの変化率。
- 有意水準 (α)
- 許容できるエラーのしきい値(通常は5%または0.05)。