オンライン・カイ二乗独立性検定計算機

2つのカテゴリ変数の間に統計的な関係があるかどうかを判定します。観測度数行列を入力して、P値を即座に計算します。

観測度数(入力)

これらは、2つの変数間に関連が全くない(ランダムな分布)場合に各セルに存在する数値です。

P値 (p)
0.000
有意な関係があります
全体統計
カイ二乗値 (χ²)
0.00
自由度 (df)
1
連関の強さ (クラメールのV)
0.00 (連関なし)
残差の可視化(観測 vs 期待)
残差の変動に応じてセルの背景色が変化します。
レポート用テキスト

合計N件の観測結果を分析した結果、χ²(df) = X という値が得られました。P値がPであることから、有意な従属関係があると結論付けられます。

ユーティリティスタジオ

このユーティリティをあなたのサイトに追加しませんか?

WordPress、Notion、またはご自身のサイト向けに、カラーとダークモードをカスタマイズできます。

よくある質問

カイ二乗独立性検定とは何ですか?

2つのカテゴリ変数または名義変数の間の観測された関連性が、偶然によるものである確率を評価するために使用される統計的検定です。例えば、人の好きなデザートが住んでいる地域に関連しているかどうかなどです。

クラメールのV係数は何に使用されますか?

カイ二乗値は関係が「あるかないか」を示すのに対し、クラメールのVは関係が「どの程度強いか」を示します。0(完全な独立)から1(絶対的な数学的依存)の範囲をとります。社会学的には0.5以上の値は非常に強いと見なされます。

期待度数が非常に低い場合はどうなりますか?

20%以上のセルで期待度数が5未満の場合、数学的なカイ二乗近似の信頼性が低下します。リスクがある場合は、当ツールが視覚的に警告を表示します。その場合は、疑わしいカテゴリを統合することをお勧めします。

定性的な調査に使用できますか?

もちろんです。小数ではなく、互いに排他的なカテゴリ(独身/既婚、はい/いいえ、北/南など)を扱う社会学や市場調査において、主要なユーティリティとなります。

# カイ二乗独立性検定計算機

A/Bテストや記述統計などの古典的なツールは、連続的な数値(平均、収益、重量)に非常に適していますが、現実の世界はカテゴリデータ(色、ブランド、満足度レベル)に満ちています。カイ二乗独立性計算機は、2つの定性変数が統計的に結びついているか、あるいは互いに完全に独立して変化しているかを分析的に判断するための「王道」となる検定です。
最大3×3の動的サイズ
クラメールのV 連関の強さ
ヒートマップ 残差と偏差

# カイ二乗統計量(χ²)は具体的に何のために使用されますか?

カイ二乗独立性検定は、観測度数(測定して収集した実際の数値)と、期待度数(変数間に全く相互作用がない場合に各セルに期待されるカウント)を比較します。

従属変数(関係がある)

一方のカテゴリの割合が、他方のカテゴリに応じて大きく変化します。

  • 例:モバイルユーザーはデザインAを好むが、PCユーザーはデザインBを好む。
  • カイ二乗値 (χ²) が急上昇し、P値が低下します。
  • クラメールのVが連関の強さを示します(例:強い > 0.5)。

独立変数(偶然)

割合はすべてのレベルにおいて一定のままです。

  • 例:顧客の目の色は、どの自動車ブランドを購入するかに影響しません。
  • カイ二乗値は非常に小さく、P値は0.05より大きくなります。
  • 帰無仮説を棄却することはできません。

# クラメールのV:関連性の強さを理解する

非常に低いP値が得られたからといって、変数が「密接に」結びついているとは限りません。それは単に偶然が原因ではないことを示しているに過ぎません(数万件の実例がある場合など)。「効果量」を測定するために、当ツールではクラメールのV係数を自動的に算出して組み込んでいます。
計算機(V値) 分析評価 意味する内容
0.00 〜 0.10関連なし / 極めて弱い連関理論的には従属していますが、実務上の目的には感知できず役に立たないレベルです。
0.11 〜 0.30弱い連関わずかな関連性はありますが、他の多くの外部要因の影響の方が大きいです。
0.31 〜 0.50中程度の連関両方の特性が互いに顕著に影響し合っています。
0.50 以上強い連関非常に明確な連関です。変数Aを知ることで、変数Bを非常によく予測できます。
数学的な実行条件
空のセルに注意してください!ピアソンのカイ二乗近似が堅牢であるためには、期待度数(観測度数ではありません)の少なくとも80%が5より大きく、かつ1未満のセルがないことが方法論的に要求されます。この条件が満たされない場合、警告が表示され、カテゴリの統合が推奨されます。

# 残差ヒートマップの内蔵

ユーザーエクスペリエンスを向上させ、レポートの結論を出しやすくするために、当ツールの行列は標準化残差(偏差)に基づいてセルの背景を自動的に色付けします。

緑色の濃淡:純粋に数学的に期待されるよりも、成功数が大幅に多いセルです。
赤色の濃淡:期待される基準と比較して、危険なほど「空」に近いセルです。

# カイ二乗用語集

観測度数
実験や調査で実際にカウントした正確な数値。
期待度数
行と列の周辺合計から算出される、変数間に関連がないと仮定した場合の理論上の度数。
自由度 (df)
自由に動けるデータの数。 (行数-1) × (列数-1) で求められます。
標準化残差
観測値と期待値の差を正規化したもの。どのセルが結果を最も大きく「押し上げている」かを測定します。

参考文献