分割表の説明
カイ二乗検定とFisher の正確確率検定の使い分け
- カイ二乗検定:
- 得られる p値は近似値です。
- 大きなサンプルサイズの場合に適しています。
- 期待度数が十分に大きい(一般的には各セルの期待度数が5以上)場合に適切です。
- サンプルサイズが大きい場合、近似的なp値は正確です。
- Fisherの正確確率検定:
- 得られる p値は正確に計算された値あり、近似値ではありません。
- 小さいサンプルサイズや、いずれかのセルの期待度数が小さい(5未満)場合に適しているとされます。
- 特に、データが十分に大きくない場合や、データが非常に不均一な分布を示す場合に有効です。
- カイ二乗検定の近似が不適切な場合に、より正確な代替手段となります。
計算時間が問題にならなければ常にFisherの正確確率検定はカイ二乗検定よりも精度が高いと考えられます。 しかし、サンプルサイズが大きく、期待度数が十分にある場合には、カイ二乗検定でも十分な精度が得られます。
また、Fisherの正確確率検定は、周辺度数を固定した条件付き検定であるため、可能な配置の組み合わせが制限され、実際の有意水準が名目上の有意水準より小さくなりやすい傾向があります。 すなわち、第一種の過誤 (偽陽性) の確率が低く抑えられる一方で、第二種の過誤 (偽陰性) の確率が増加する傾向があり、実際には差があるケースでも「差がない」と判断してしまう可能性が高くなります。
どちらの検定を選ぶかは、データの大きさと研究の目的に応じて判断するのがよいでしょう。
- 2×2より大きなセル数の分割表に対する Fisherの正確確率検定
- Fisherの正確確率検定は、本来は 2×2分割表に対する検定ですが、それより大きなセル数の表に対する拡張が行われ、クラウド R でも実行することができます。
- 一般的な統計的手法としてはあまり広く使われていません。その理由は、セルの数が増えると、計算に必要な可能な組み合わせの数が急速に増加し、計算時間が非常に長くなることがあります。
- 実際に、クラウド R においても、ワークスペースの不足により実行エラーになる場合がしばしば発生します。
比率の傾向の検定 (Cochran-Armitage検定)
2つのカテゴリー間(例えば、成功と失敗)の比率に順序的な傾向が存在するかを評価します。
2 x k もしくは k x 2 (k >=3) の列連関表を使用し、例えば、薬の投与量 (低用量、中用量、高用量) と治療の成功率との間に関連性があるかを検討します。
順序のある 3 x 3 以上の分割表の分析
行と列の両方に順序がある場合には、Spearmanの順位相関係数、Kendallの順位相関係数、線形併合カイ二乗検定、Goodman-Kruskalのガンマ係数 にて分析を行うことができます。
Spearmanの順位相関係数
2つの順序変数間の単調な関係の強さを測定します。
Kendallの順位相関係数
2つの順序変数間の一致度を測定します。
線形併合カイ二乗検定
行と列の変数間の線形関係の有無を検定します。
線形-線形関連性検定 (Linear-by-Linear Association Test) とも表現されます。
この検定は、順序変数を扱う際に有用な手法です。例えば、治療法の効果と症状の重症度の関係を調べるような場合に使えます。
- 帰無仮説: 変数間に線形関連性がない
- 対立仮説: 変数間に線形関連性がある
- 検定統計量の計算: カイ二乗統計量
- p値の算出: カイ二乗分布に基づいて有意水準と比較し、帰無仮説の採択/棄却を判断
Goodman-Kruskal のガンマ
2つの順序変数の間の順位の一致度を評価します。具体的には、2つの変数がどの程度一貫して順位付けされているかを示します。 ガンマは -1 から +1 の値を取ります
- +1: 完全な正の一致(すべてのペアが一致している)
- 0: 順位の関連性がない
- -1: 完全な負の一致(すべてのペアが不一致)
これらの方法は、カテゴリ間の順序を考慮するため、通常のカイ二乗検定よりも検出力が高くなる可能性があります。
二項検定
分割表が 1×2 または 2×1 になる場合は、確率=0.5 とした二項検定を行います。 二項分布は、同じ条件で何回も試行を繰り返したとき、特定の結果(成功)が起こる回数を予測するものです。
二項分布の特徴:
- 結果は「成功」か「失敗」の2つだけ
- 各試行の成功確率は常に同じ
- 例: コイン投げ
- コインを10回投げるとき、表が出る回数を予測するのに使えます。 例えば、「表が5回出る確率」や「表が7回以上出る確率」を計算できます。
2群の比率の比較のための検出力およびサンプルサイズの計算
2 x 2 分割表にて有意差がない場合、検出力やサンプルサイズを計算してみると解釈が容易となることがあります。 すなわち、症例数が足りないから有意差が出ないのか、本当に差が無い可能性が高いのかを考える上で有用です。 ただし、「足りないからあと少し症例を追加して解析をやり直す」ことは適切でないとされています。