1群の比率を既知の比率と比較するためのサンプルサイズの計算

この計算方法は、特定の群における比率(例えば治療の奏効率)を、既知の比率(例えば以前の研究からの治療の奏効率)と比較する際に必要なサンプルサイズを求めるために使用されます。 このような比較は、新しい治療法や介入の効果を既存のものと比較し、その差異を統計的に検証するために行われます。

具体例

たとえば、ある治療の標準治療の奏効率が 20% であるとして、30% の奏効率が想定されている新しい治療法が、標準治療よりも優れていることを確認したい場合、何人の患者さんで調べる必要があるかを計算します。

既知の比率: 以前の研究や情報から得られた比率です。 この例では、20% が既知の比率となります。

想定する比率: 新しい治療で想定される比率です。 この例では、30% が想定の比率となります。

α エラー: 実は差がないのに「差がある」と誤って判断する確率です。 通常は 0.05 とします。 Type I error rate とも表現します。

検出力 (1 - βエラー): 実際に差が存在した場合、それを検出できる確率です。 通常は 0.8 程度とします。 βエラー (Type II error rate) は、実際には差が存在する場合に、その差を見逃してしまうリスクです。

これらの要素をもとに、研究を行うためのサンプルサイズが計算されます。

  • 効果の差が大きいほど、サンプルサイズは小さくて済みます。
  • αやβのリスクを小さくしたい場合、サンプルサイズは大きくなります。

これらの情報をもとに、適切なサンプルサイズを計算し、研究を行うことで、統計的に有意な結果を得られる可能性が高まります。

検定方法:

  • 両側検定: 両側検定は、新しい治療法の奏効率が標準治療の奏効率と異なるかどうかを検討する場合に適しています。つまり、新しい治療法が標準治療よりも良いだけでなく、悪い可能性も考慮に入れます。この場合、αエラーのリスクは両方向に分散されるため、片側検定に比べてより厳しい基準を設定します。
  • 片側検定: 片側検定は、新しい治療法が標準治療よりも良い(または悪い)ことだけを証明することを目的とする場合に適しています。片側検定は、研究の仮説が特定の方向性を持っている場合に使用されます。

この例では、新しい治療が標準治療よりも優れていることを示すことが目的であれば、「片側検定」が適切です。 ただし、新しい治療が標準治療と異なる効果(良いまたは悪い)を持つ可能性があると考える場合は、「両側検定」を選択します。

カイ2乗検定の連続性補正:

  • 連続性補正あり: 小さいサンプルサイズ (<20) の場合や、分割表にしたときに期待値が小さいセル (<5) が含まれる場合に、カイ二乗検定の近似を改善するために連続性補正が用いられます。
  • 連続性補正なし: サンプルサイズが大きい場合や、全てのセルの期待値が十分に大きい場合は連続性補正は必要ありません。


\( N = \frac{\left( Z_{\frac{\alpha}{2}} \times \sqrt{p1 \times (1 - p1)} + Z_{\beta} \times \sqrt{p2 \times (1 - p2)} \right)^2}{(p2 - p1)^2} \)

ここで、
  • \( N \) は必要なサンプルサイズ
  • \( Z_{\frac{\alpha}{2}} \) は所定の有意水準 α での正規分布の両側z値
  • \( Z_{\beta} \) は所定の検出力 (1-β) での正規分布のz値
  • \( p1 \) は帰無仮説の下での母集団の比率
  • \( p2 \) は対立仮説の下での母集団の比率

この公式は、二項分布のサンプル割合の信頼区間の幅を制限するために必要なサンプルサイズを推定するためのものです。

公式の基本的な考え方は、サンプル割合の標準誤差(SE)とZスコアの乗算としての信頼区間の幅を計算し、それが所定の幅(δ)以下になるサンプルサイズを求めることです。