온라인 카이제곱 독립성 검정 계산기

두 범주형 변수 사이에 통계적 관계가 있는지 확인하세요. 관측 빈도 행렬을 입력하고 P-값을 즉시 계산합니다.

관측 빈도 (입력)

두 변수 사이에 아무런 관계가 없을 때(무작위 분포) 각 셀에 나타날 것으로 예상되는 수치입니다.

P-값 (p)
0.000
유의미한 관계가 발견됨
전역 통계
카이제곱 (χ²)
0.00
자유도 (df)
1
관계 강도 (크래머 V)
0.00 (없음)
잔차 시각화 (관측 vs 기대)
입력 표의 각 셀은 잔차의 편차 정도에 따라 색칠됩니다.
보고서용 텍스트

총 N개의 관측치를 분석한 결과, χ²(df) = X 값을 얻었습니다. p=P 값을 통해 유의미한 종속 관계가 있음이 확인되었습니다.

유틸리티 스튜디오

이 유틸리티를 내 웹사이트에 추가하고 싶으신가요?

WordPress, Notion 또는 직접 운영하는 사이트에 맞게 색상과 다크 모드를 설정하세요.

자주 묻는 질문

카이제곱 독립성 검정이란 무엇인가요?

두 범주형 또는 명목 변수 사이의 관찰된 연관성이 우연일 확률을 평가하는 데 사용되는 통계적 검정입니다. 예: 사람이 좋아하는 디저트가 거주 지역과 관련이 있는지 여부.

크래머의 V 계수는 어디에 사용되나요?

카이제곱이 '어떤' 관계가 있는지를 알려준다면, 크래머의 V는 '얼마나' 관계가 있는지를 알려줍니다. 0(완전 독립)에서 1(성공적인 수학적 의존) 사이의 값을 가집니다. 사회학적으로 0.5 이상의 값은 매우 강한 것으로 간주됩니다.

기대 빈도가 매우 낮으면 어떻게 되나요?

전체 셀의 20% 이상에서 기대 빈도가 5 미만이면 카이제곱 근사의 신뢰도가 떨어집니다. 위험이 있는 경우 본 도구에서 시각적 경고를 표시합니다. 이 경우 의심스러운 범주를 병합하는 것이 좋습니다.

정성적 설문 조사에 사용할 수 있나요?

당연히 가능합니다. 소수점 데이터보다는 상호 배타적인 범주(미혼/기혼, 예/아니오, 북부/남부)를 다루는 사회학 및 시장 조사에서 핵심적인 도구로 활용됩니다.

# 카이제곱 독립성 검정 계산기

A/B 테스트나 기술 통계와 같은 고전적인 도구는 연속적인 데이터(평균, 수익, 무게)에 매우 적합하지만, 실제 세계는 범주형 데이터(색상, 브랜드, 만족도)로 가득 차 있습니다. 카이제곱 독립성 계산기는 두 정성적 변수가 통계적으로 연결되어 있는지, 아니면 서로 완전히 독립적으로 변하는지를 분석적으로 판단하는 가장 대표적인 검정입니다.
최대 3×3 동적 크기
크래머 V 연관성 강도
히트맵 잔차 및 편차

# 카이제곱 통계량(χ²)은 구체적으로 어디에 쓰이나요?

카이제곱 독립성 검정은 관측 빈도(실제로 측정하고 수집한 수치)와 기대 빈도(변수 간에 아무런 관계가 없을 때 각 셀에서 예상되는 수치)를 비교합니다.

종속 변수 (관계 있음)

한 범주의 비율이 다른 범주에 따라 크게 달라집니다.

  • 예: 모바일 방문자는 디자인 A를 선호하지만, PC 사용자는 디자인 B를 선호함.
  • 카이제곱(χ²) 값이 급증하고 P-값이 급감합니다.
  • 크래머 V가 관계의 강도를 나타냅니다 (예: 강함 > 0.5).

독립 변수 (우연)

비율이 모든 영역에서 일정하게 유지됩니다.

  • 예: 고객의 눈 색깔은 자동차 브랜드 구매 결정에 영향을 주지 않음.
  • 카이제곱 값이 매우 작고 P-값이 0.05보다 큽니다.
  • 귀무 가설을 기각할 수 없습니다.

# 크래머 V: 관계의 강도 이해하기

P-값이 매우 낮다고 해서 변수가 반드시 고도로 밀접하게 연결된 것은 아닙니다. 그것은 단지 우연이 원인일 가능성이 낮다는 것을 나타낼 뿐입니다(표본이 매우 많은 경우 등). 관계의 실질적인 강도인 "효과 크기"를 측정하기 위해 본 도구는 크래머의 V 계수를 자동으로 제공합니다.
계산기 (V 값) 분석적 평가 해석
0.00 ~ 0.10관계 없음 / 무시할 만한 연관성이론적으로는 종속적일 수 있으나 비즈니스적으로는 감지되지 않는 수준입니다.
0.11 ~ 0.30약한 연관성어느 정도 관계는 있으나 다른 외부 요인의 영향이 더 큽니다.
0.31 ~ 0.50보통 연관성두 특성이 서로 눈에 띄게 영향을 미칩니다.
0.50 이상강한 연관성매우 명확한 관계입니다. 변수 A를 알면 변수 B를 상당히 정확하게 예측할 수 있습니다.
수학적 성립 조건
비어 있는 셀에 주의하세요! 피어슨 카이제곱 근사가 정밀하게 작동하려면 기대 빈도(관측 빈도가 아님)의 80% 이상이 5보다 커야 하며, 빈도가 1 미만인 셀이 없어야 한다는 방법론적 조건이 필요합니다. 이 조건이 충족되지 않으면 경고 표시가 나타나며 범주 병합을 권장합니다.

# 내장된 잔차 히트맵

사용자 경험을 개선하고 보고서 결론 도출을 돕기 위해, 본 행렬은 표준화 잔차(편차)를 기반으로 셀 배경을 자동으로 색칠합니다.

초록색 계열: 해당 셀은 수학적 기대치보다 훨씬 더 많은 성공 사례를 포함합니다.
빨간색 계열: 해당 셀은 기대치에 비해 위험할 정도로 "비어 있음"을 나타냅니다.

# 카이제곱 용어 설명

관측 빈도
실험이나 설문 조사에서 실제로 집계된 정확한 수치입니다.
기대 빈도
변수 간 독립을 가정했을 때, 행과 열의 비율을 기반으로 산출된 이론적 빈도입니다.
자유도 (df)
통계적으로 자유로운 데이터의 수치. (행 수 - 1) × (열 수 - 1)로 구합니다.
표준화 잔차
관측값과 기대값의 차이를 정규화한 수치입니다. 어느 셀이 결과에 큰 영향을 주는지 보여줍니다.

참고 문헌