# カイ二乗独立性検定計算機
A/Bテストや記述統計などの古典的なツールは、連続的な数値(平均、収益、重量)に非常に適していますが、現実の世界はカテゴリデータ(色、ブランド、満足度レベル)に満ちています。カイ二乗独立性計算機は、2つの定性変数が統計的に結びついているか、あるいは互いに完全に独立して変化しているかを分析的に判断するための「王道」となる検定です。# カイ二乗統計量(χ²)は具体的に何のために使用されますか?
カイ二乗独立性検定は、観測度数(測定して収集した実際の数値)と、期待度数(変数間に全く相互作用がない場合に各セルに期待されるカウント)を比較します。従属変数(関係がある)
一方のカテゴリの割合が、他方のカテゴリに応じて大きく変化します。
- 例:モバイルユーザーはデザインAを好むが、PCユーザーはデザインBを好む。
- カイ二乗値 (χ²) が急上昇し、P値が低下します。
- クラメールのVが連関の強さを示します(例:強い > 0.5)。
独立変数(偶然)
割合はすべてのレベルにおいて一定のままです。
- 例:顧客の目の色は、どの自動車ブランドを購入するかに影響しません。
- カイ二乗値は非常に小さく、P値は0.05より大きくなります。
- 帰無仮説を棄却することはできません。
# クラメールのV:関連性の強さを理解する
非常に低いP値が得られたからといって、変数が「密接に」結びついているとは限りません。それは単に偶然が原因ではないことを示しているに過ぎません(数万件の実例がある場合など)。「効果量」を測定するために、当ツールではクラメールのV係数を自動的に算出して組み込んでいます。| 計算機(V値) | 分析評価 | 意味する内容 |
|---|---|---|
| 0.00 〜 0.10 | 関連なし / 極めて弱い連関 | 理論的には従属していますが、実務上の目的には感知できず役に立たないレベルです。 |
| 0.11 〜 0.30 | 弱い連関 | わずかな関連性はありますが、他の多くの外部要因の影響の方が大きいです。 |
| 0.31 〜 0.50 | 中程度の連関 | 両方の特性が互いに顕著に影響し合っています。 |
| 0.50 以上 | 強い連関 | 非常に明確な連関です。変数Aを知ることで、変数Bを非常によく予測できます。 |
数学的な実行条件
空のセルに注意してください!ピアソンのカイ二乗近似が堅牢であるためには、期待度数(観測度数ではありません)の少なくとも80%が5より大きく、かつ1未満のセルがないことが方法論的に要求されます。この条件が満たされない場合、警告が表示され、カテゴリの統合が推奨されます。# 残差ヒートマップの内蔵
ユーザーエクスペリエンスを向上させ、レポートの結論を出しやすくするために、当ツールの行列は標準化残差(偏差)に基づいてセルの背景を自動的に色付けします。緑色の濃淡:純粋に数学的に期待されるよりも、成功数が大幅に多いセルです。
赤色の濃淡:期待される基準と比較して、危険なほど「空」に近いセルです。
# カイ二乗用語集
- 観測度数
- 実験や調査で実際にカウントした正確な数値。
- 期待度数
- 行と列の周辺合計から算出される、変数間に関連がないと仮定した場合の理論上の度数。
- 自由度 (df)
- 自由に動けるデータの数。 (行数-1) × (列数-1) で求められます。
- 標準化残差
- 観測値と期待値の差を正規化したもの。どのセルが結果を最も大きく「押し上げている」かを測定します。