Онлайн калькулятор теста независимости Хи квадрат

Определите, существует ли статистическая связь между двумя категориальными переменными. Заполните матрицу наблюдаемых частот и мгновенно рассчитайте P-значение.

Наблюдаемые частоты (Ввод)

Это значения, которые существовали бы в каждой ячейке, если бы между переменными не было никакой связи (случайное распределение).

P-значение (p)
0.000
Существует значимая связь
Глобальная статистика
Хи-квадрат (χ²)
0.00
Степени свободы (df)
1
Сила связи (V Крамера)
0.00 (Нет)
Визуализация остатков (Наблюдаемые vs Ожидаемые)
Ячейки ввода в таблице окрашены в соответствии с вариацией остатков.
Текст для вашего отчета

После анализа N наблюдений мы обнаружили значение χ²(df) = X. С p-значением P делается вывод о наличии значимой зависимости.

Студия утилит

Хотите эту утилиту на своём сайте?

Настройте цвета и тёмную тему для WordPress, Notion или вашего сайта.

Часто задаваемые вопросы

Что такое тест независимости Хи-квадрат?

Это статистический тест, используемый для оценки вероятности того, что наблюдаемая связь между двумя категориальными или номинальными переменными обусловлена случаем. Например: связан ли любимый десерт человека с регионом, в котором он живет.

Для чего используется коэффициент V Крамера?

В то время как Хи-квадрат говорит вам, существует ли «какая-либо» связь, V Крамера говорит вам, «насколько сильна» эта связь. Коэффициент варьируется от 0 (полная независимость) до 1 (абсолютная математическая зависимость). Значения выше 0,5 считаются очень сильными с социологической точки зрения.

Что произойдет, если мои ожидаемые частоты очень низкие?

Математическая аппроксимация Хи-квадрат теряет надежность, если ожидаемые частоты меньше 5 более чем в 20% ячеек. Наш инструмент визуально предупредит вас, если возникнет риск. В этом случае рекомендуется объединить сомнительные категории.

Можно ли использовать это для качественных опросов?

Безусловно, да. Это основной инструмент для социологии и маркетинговых исследований, где вы редко имеете дело с десятичными числами, а скорее с взаимоисключающими категориями (Холост/Женат, Да/Нет, Север/Юг).

# Калькулятор теста независимости Хи-квадрат

В то время как классические инструменты, такие как A/B-тест или описательная статистика, отлично работают с непрерывными числами (средние значения, доходы, веса), реальный мир полон категориальных данных (цвета, бренды, уровни удовлетворенности). Калькулятор независимости Хи-квадрат — это «королевский» тест для аналитического определения того, связаны ли две качественные переменные статистически или они изменяются совершенно независимо друг от друга.
Таблица Динамическая до 3×3
V Крамера Сила связи
Теплокарта Остатки и отклонение

# Для чего именно используется статистика Хи-квадрат (χ²)?

Тест независимости Хи-квадрат сравнивает наблюдаемые частоты (реальные числа, которые вы измерили и собрали) с ожидаемыми частотами (количества, которые мы бы ожидали в каждой ячейке, если бы между переменными вообще не было взаимодействия).

Зависимые переменные (связь существует)

Пропорции одной категории сильно меняются в зависимости от другой.

  • Пример: Мобильные посетители предпочитают Дизайн А, а пользователи ПК — Дизайн Б.
  • Значение Хи-квадрат (χ²) резко возрастает, а P-значение падает.
  • V Крамера указывает на силу связи (например, Сильная > 0,5).

Независимые переменные (случай)

Пропорции остаются стабильными на всех уровнях.

  • Пример: Цвет глаз клиента не влияет на марку автомобиля, который он покупает.
  • Хи-квадрат ничтожно мал, а P-значение больше 0,05.
  • Нулевая гипотеза не может быть отвергнута.

# V Крамера: понимание силы связи

Получение очень низкого P-значения не означает, что переменные связаны «интенсивно»; это лишь указывает на то, что случай не может быть причиной (возможно, потому что у вас десятки тысяч реальных случаев). Чтобы измерить «размер эффекта», мы автоматически включаем коэффициент V Крамера.
Калькулятор (значение V) Аналитическая оценка Интерпретация
от 0,00 до 0,10Ничтожная связьТеоретически зависимы, но неощутимо и бесполезно для практических целей.
от 0,11 до 0,30Слабая связьСуществует небольшая связь, но многие другие внешние факторы имеют больший вес.
от 0,31 до 0,50Умеренная связьОбе характеристики заметно влияют друг на друга.
Выше 0,50Сильная связьОчень четкая связь. Знание переменной А позволяет чрезвычайно точно предсказать переменную Б.
Условия математической применимости
Остерегайтесь пустых ячеек! Чтобы аппроксимация хи-квадрат Пирсона оставалась надежной, методологически требуется, чтобы по крайней мере 80% ожидаемых частот (не наблюдаемых) были больше 5, и ни одна ячейка не была ниже 1. Если это условие не соблюдается, сработает наш индикатор предупреждения, предлагающий вам объединить категории.

# Встроенная теплокарта остатков

Для улучшения пользовательского интерфейса и облегчения выводов в отчетах наша матрица автоматически окрашивает фон ячеек на основе их стандартизированных остатков (отклонения):

Зеленые оттенки: в ячейке гораздо больше успехов, чем можно было бы ожидать чисто математически.
Красные оттенки: ячейка опасно «пуста» по сравнению с ожидаемой нормой.

# Глоссарий Хи-квадрат

Наблюдаемая частота
Количество именно в том виде, в котором вы его физически подсчитали в ходе исследования или опроса.
Ожидаемая частота
Теоретический расчет, полученный путем умножения суммы строки на сумму столбца и деления на общий итог.
Степени свободы (df)
Геометрическое количество свободных данных. Находится путем вычитания 1 из количества строк и столбцов и их умножения.
Стандартизированный остаток
Нормированная разница между наблюдаемым и ожидаемым значением. Показывает, какая ячейка больше всего влияет на результат.

Библиографические ссылки