適合度検定

(Goodness of Fit Test)

観測されたカテゴリ変数の分布が、期待される分布に適合するかを検定します。N-1カイ二乗検定・G検定・Cochran-Armitage傾向検定に対応しています。

解説

適合度検定とは

適合度検定は、1つのカテゴリ変数の観測度数が、あらかじめ定めた期待分布(例: 等確率・理論的な比率)に適合しているかどうかを検定する手法です。

例えば、サイコロを60回振ったときに各目が10回ずつ出ることが期待されますが、実際の観測度数がこの期待からどの程度ずれているかを統計的に評価します。

帰無仮説 (H₀): 観測度数は期待分布に適合している
対立仮説 (H₁): 観測度数は期待分布に適合していない

本アプリでサポートする機能

検定手法

手法 特徴
N-1カイ二乗検定 (Pearson) 最も標準的な手法。N-1補正により小標本でも安定した結果が得られる
G検定(尤度比検定) 対数尤度比に基づく検定。大標本では Pearson カイ二乗検定と同等の結果になる
Freeman-Tukey残差 アークサイン変換を用いた残差による検定。小セル度数に頑健

期待確率の設定

  • 等確率: 全カテゴリが同じ確率で出現する仮説(例: サイコロ)
  • カスタム確率: 各カテゴリに任意の期待確率を指定(例: 理論値・先行研究の値)

順序ありカテゴリの検定

カテゴリに順序がある場合(例: 軽症・中等症・重症)、順序情報を活用した検定が可能です。

手法 説明
Cochran-Armitage傾向検定 順序スコアを用いて単調な傾向を検定する
N-1カイ二乗検定(順序無視) 参考として順序を無視した通常の検定も実施
Page検定 Cochran-Armitage傾向検定で代替

順序スコアは「等間隔 (1, 2, 3, …)」「重み付けスコア」「カスタムスコア」から選択でき、ドラッグ&ドロップでカテゴリ順序を変更できます。

効果量

  • Cramer's V: カイ二乗統計量をサンプルサイズとカテゴリ数で標準化した効果量
  • Cohen's w: 観測確率と期待確率の乖離を表す効果量(0.1 = 小, 0.3 = 中, 0.5 = 大)

その他の出力

  • 調整済み残差: 各カテゴリが全体の乖離にどの程度貢献しているかを示す
  • 観測度数・期待度数・確率の一覧表: 各カテゴリの詳細を確認できる
  • 視覚化: 観測度数と期待度数の棒グラフ比較

データ要件と推奨事項

  • 必要なデータ: カテゴリ変数を含む個票データ(または度数カラムを持つ集計データ)
  • 度数カラム: 各行がカテゴリの度数を表すカラムがある場合は指定可能
  • 推奨サンプルサイズ: 全カテゴリの期待度数が5以上であることが推奨(期待度数5未満の場合は警告を表示)
  • カテゴリ数: 2カテゴリ以上に対応

結果の解釈

結果 解釈
p値 < 0.05 観測分布と期待分布の差は偶然とは考えにくい
p値 ≥ 0.05 観測分布と期待分布の差は偶然の範囲内かもしれない
調整済み残差 > 1.96 そのカテゴリは期待より有意に多い (α = 0.05)
調整済み残差 < -1.96 そのカテゴリは期待より有意に少ない (α = 0.05)

注意事項

  • 期待度数が5未満のカテゴリがある場合、検定の妥当性が低下します。カテゴリの統合を検討してください。
  • p値が小さいことは、差の大きさを意味しません。効果量(Cohen's w など)で実質的な差を評価してください。
  • 統計的有意差があっても、実務的に重要とは限りません。
  • カスタム確率を指定する場合、合計が1.0になるように設定してください。

アプリ

データ

設定

期待確率の設定

結果