分割表の作成と群間の比率の比較

このページでは、データの中から変数を選択し、それを基に分割表を作成して、カイ二乗検定 (Chi-square test) および Fisher の正確確率検定 (Fisher's Exact Test) を行うことができます。

この分割表は、カテゴリカルなデータ間の関連性を視覚的に把握し、分析するのに役立ちます。

  • カイ二乗検定:
    • 得られる p値は近似値です。
    • 大きなサンプルサイズの場合に適しています。
    • 期待度数が十分に大きい(一般的には各セルの期待度数が5以上)場合に適切です。
    • サンプルサイズが大きい場合、近似的なp値は正確です。
  • Fisherの正確確率検定:
    • 得られる p値は正確に計算された値あり、近似値ではありません。
    • 小さいサンプルサイズや、いずれかのセルの期待度数が小さい(5未満)場合に適しているとされます。
      • 特に、データが十分に大きくない場合や、データが非常に不均一な分布を示す場合に有効です。
      • カイ二乗検定の近似が不適切な場合に、より正確な代替手段となります。

一般的なガイドラインとしては、サンプルサイズが大きく、各セルの期待度数が5以上の場合はカイ二乗検定が適切であり、そうでない場合はFisherの正確確率検定が好ましいとされています。

計算時間が問題にならなければ常にFisherの正確確率検定はカイ二乗検定よりも精度が高いと考えられます。 しかし、サンプルサイズが大きく、期待度数が十分にある場合には、カイ二乗検定でも十分な精度が得られます。

  • 2×2より大きなセル数の分割表に対するvFisherの正確確率検定
    • Fisherの正確確率検定は、本来は 2×2分割表に対する検定ですが、それより大きなセル数の表に対する拡張が行われ、クラウド R でも実行することができます。
    • 一般的な統計的手法としてはあまり広く使われていません。その理由は、セルの数が増えると、計算に必要な可能な組み合わせの数が急速に増加し、計算時間が非常に長くなることがあります。
      • 実際に、クラウド R においても、ワークスペースの不足により実行エラーになる場合がしばしば発生します。

2つのカテゴリー間(例えば、成功と失敗)の比率に順序的な傾向が存在するかを評価します。

2 x k (k >=3) の列連関表を使用し、例えば、薬の投与量 (低用量、中用量、高用量) と治療の成功率との間に関連性があるかを検討します。

2 x 2 分割表にて有意差がない場合、検出力やサンプルサイズを計算してみると解釈が容易となることがあります。 すなわち、症例数が足りないから有意差が出ないのか、本当に差が無い可能性が高いのかを考える上で有用です。 ただし、「足りないからあと少し症例を追加して解析をやり直す」ことは適切でないとされています。

2群の比率の比較のための検出力の計算

2群の比率の比較のためのサンプルサイズの計算

群分類 ({{groupName==='X'? '列': '行'}}) カテゴリー変数を選択してください。複数選択すると組み合わされます
項目の順序を drag & drop で変更できます