1群の比率の信頼区間をある幅におさめるためのサンプルサイズの計算

この計算は、特定の比率(例えば奏効率や発生率)に対する信頼区間を指定した幅に収めるために必要なサンプルサイズを推定するために使用されます。

必要な入力パラメータは、予測される 比率、希望する 信頼区間の幅、および 信頼水準 です。 一般的には95%の信頼水準が用いられます。

信頼区間の幅を狭くするためには通常、サンプルサイズを増やす必要があります。 サンプルサイズが大きいほど、推定される比率の不確実性は減少し、結果として信頼区間は狭くなります。

具体例

新しいワクチンの効果率を評価する研究を行っているとします。 事前の研究や予備的なデータに基づいて、ワクチンの奏効率が約70%であると予測されています。 研究者はこの奏効率の信頼区間を±5%の幅に保ちたいと考えています。

  • 比率: ワクチンの奏効率として 70%(0.70)が期待されます。
  • 信頼区間の幅: ±5%。つまり、信頼区間は65%から75%であり、その幅は 10% (0.1) とします。
  • 信頼水準: 通常は 95% を指定します。

この設定に基づいて、ワクチンの効果率が70%であると仮定した場合に、信頼区間が±5%の範囲内に収めるために必要なサンプルサイズは 323 と計算されます。

必要なサンプルサイズ \( N \) \[ N = \left\lceil \frac{4 \times Z_{\alpha/2}^2 \times p \times (1-p)}{\Delta^2} \right\rceil \]

ここで、
  • \( Z_{\alpha/2} \) は標準正規分布の上側α/2パーセンタイル
  • \( p \) は期待する母数の割合または確率
  • \( \Delta \) は信頼区間の幅

この公式は、二項分布のサンプル割合の信頼区間の幅を制限するために必要なサンプルサイズを推定するためのものです。

公式の基本的な考え方は、サンプル割合の標準誤差(SE)とZスコアの乗算としての信頼区間の幅を計算し、それが所定の幅(δ)以下になるサンプルサイズを求めることです。