2群の比率の比較のためのサンプルサイズの計算

2群の比率の比較のためのサンプルサイズの計算は、異なる2つの群間での比率に統計的に有意な差があるかを検証したいとき、どれだけのサンプルサイズが必要かを計算します。

具体例

たとえば、治療方法1が20%の効果を持ち、治療方法2がそれよりも10%良い、つまり30%の効果があると想定される場合、その違いを示すには何人の患者さんで調べる必要があるかを計算します。

  • 比率1, 比率2: それぞれの群で想定される比率です。この例では、20% (0.2) と 30% (0.3) が想定の比率となります。
  • α エラー: 実は差がないのに「差がある」と誤って判断する確率です。通常は 0.05 とします。
  • 検出力 (1 - βエラー): 実際に差が存在した場合、それを検出できる確率です。通常は 0.8 程度とします。
  • サンプルサイズ比: 群1のサンプルサイズに対して、群2のサンプルサイズが何倍になるかを入力します。

これらの要素をもとに、研究を行うためのサンプルサイズが計算されます。

  • 検定方法:
    • 両側検定: 新しい治療法の奏効率が標準治療の奏効率と異なるかどうかを検討する場合に適しています。
    • 片側検定: 新しい治療法が標準治療よりも良い(または悪い)ことだけを証明することを目的とする場合に適しています。
  • カイ2乗検定の連続性補正:
    • 連続性補正あり: 小さいサンプルサイズ (<20) の場合や、期待値が小さいセル (<5) が含まれる場合に用いられます。
    • 連続性補正なし: サンプルサイズが大きい場合や、全てのセルの期待値が十分に大きい場合は必要ありません。


クリティカル値の計算:

  • 有意水準 \( \alpha \) の調整(両側検定の場合): \[ \alpha = \frac{\alpha}{2} \]
  • \( \alpha \) に対するクリティカル値: \[ Z_{\alpha} = qnorm(1 - \alpha) \]
  • \( \beta \) に対するクリティカル値: \[ Z_{\beta} = qnorm(\text{desired_power}) \]

中間変数の計算:

  • 加重平均: \[ \bar{p} = \frac{p_1 + r \cdot p_2}{1 + r} \] ここで、 \( r \) はサンプルサイズの比、\( p_1 \) は群1の比率、\( p_2 \) は群2の比率です。
  • 比率の差: \[ d = | p_1 - p_2 | \]

全体のサンプルサイズの計算: \[ n_{\text{total}} = \frac{1}{d^2} \left( Z_{\alpha} \sqrt{(1 + r) \bar{p} (1 - \bar{p})} + Z_{\beta} \sqrt{r p_1 (1 - p_1) + p_2 (1 - p_2)} \right)^2 \]

グループごとのサンプルサイズ:

  • 連続性補正なし: \[ n_1 = \frac{n_{\text{total}}}{r} \] \[ n_2 = n_1 \times r \]
  • 連続性補正あり: \[ n_1 = \frac{n_{\text{total}}}{r} + \frac{1 + r}{r \cdot d} \] \[ n_2 = n_1 \times r \]