2群の比率の比較のための検出力の計算

2群の比率の比較のための検出力の計算は、統計的検定を実施する前に、手持ちのデータが特定の効果の大きさを検出するのに十分な「力」を持っているかを判断するためのものです。

たとえば、治療方法1が 20% の効果を持っていて、治療方法2がそれよりも 10% 良い、つまり 30% の効果があると想定され、それぞれの患者数がわかっている場合に、その違いを示すことのできる検出力を計算します。

検出力 (1 - βエラー): 実際に差が存在した場合、それを検出できる確率です。 通常は 0.8 程度とします。 βエラー (Type II error rate) は、実際には差が存在する場合に、その差を見逃してしまうリスクです。

比率1, 比率2: それぞれの群で想定される比率です。 この例では、20% と 30% が想定の比率となります。

α エラー: 実は差がないのに「差がある」と誤って判断する確率です。 通常は 0.05 とします。 Type I error rate とも表現します。

サンプルサイズ: 検出力はサンプルサイズに強く影響されます。サンプルサイズが大きいほど、小さな効果でも検出しやすくなります。

検定方法:

  • 両側検定: 両側検定は、新しい治療法の奏効率が標準治療の奏効率と異なるかどうかを検討する場合に適しています。つまり、新しい治療法が標準治療よりも良いだけでなく、悪い可能性も考慮に入れます。この場合、αエラーのリスクは両方向に分散されるため、片側検定に比べてより厳しい基準を設定します。
  • 片側検定: 片側検定は、新しい治療法が標準治療よりも良い(または悪い)ことだけを証明することを目的とする場合に適しています。片側検定は、研究の仮説が特定の方向性を持っている場合に使用されます。

この例では、新しい治療が標準治療よりも優れていることを示すことが目的であれば、「片側検定」が適切です。 ただし、新しい治療が標準治療と異なる効果(良いまたは悪い)を持つ可能性があると考える場合は、「両側検定」を選択します。

カイ2乗検定の連続性補正:

  • 連続性補正あり: 小さいサンプルサイズ (<20) の場合や、分割表にしたときに期待値が小さいセル (<5) が含まれる場合に、カイ二乗検定の近似を改善するために連続性補正が用いられます。
  • 連続性補正なし: サンプルサイズが大きい場合や、全てのセルの期待値が十分に大きい場合は連続性補正は必要ありません。
  • 「私の研究は、指定した効果の大きさを検出するのに十分なサンプルサイズを持っているか?」
  • 「私の研究のサンプルサイズで、どの程度の効果の大きさを検出することができるか?」

以上のように、検出力の計算は、研究の計画段階での重要なステップとなり、資源の適切な配分や研究の有用性を確保するために役立ちます。


有意水準の調整: \[ \alpha_{\text{adjusted}} = \frac{\alpha}{\text{test_method}} \]

z-値の取得: \[ z_{\alpha_{\text{adjusted}}} = qnorm(1 - \alpha_{\text{adjusted}}) \]

群間の平均確率の計算: \[ p_{\text{weighted_mean}} = \frac{p_1 + p_2 \times \text{sample_ratio}}{1 + \text{sample_ratio}} \]

群間の確率の差: \[ \Delta p = |p_1 - p_2| \]

連続性補正の適用: \[ n_{2, \text{adjusted}} = \left( n_1 - \frac{1 + \text{sample_ratio}}{\text{sample_ratio} \times \Delta p} \right) \times \text{sample_ratio} \]

検出力を計算するためのz-値の取得: \[ z_{\beta} = \frac{\sqrt{n_{2, \text{adjusted}} / (1 / \Delta p^2)} - z_{\alpha_{\text{adjusted}}} \times \sqrt{(1 + \text{sample_ratio}) \times p_{\text{weighted_mean}} \times (1 - p_{\text{weighted_mean}})}}{\sqrt{\text{sample_ratio} \times p_1 \times (1 - p_1) + p_2 \times (1 - p_2)}} \]

検出力の計算: \[ \text{power} = pnorm(z_{\beta}) \]