対応のある2群の比較のためのサンプルサイズの計算

厳密には「対応のある2群の個々の差の平均値と0との比較のためのサンプルサイズの計算」です。

同一の個体に対して治療などの介入を行い、その前後での変化を比較する際に、統計的に有意な結果を得るために必要な被験者数を事前に推定する方法です。 例えば、医薬品の効果を評価する際に、同じ患者に対して治療前後での健康状態の変化を比較するケースがこれに該当します。

具体例

糖尿病治療薬の効果を評価するため、患者の治療前後のHbA1c値を比較します。

  • 対応のある値の群間差の平均値: 治療前後でのHbA1c値の平均的な変化が-0.5と仮定する。
  • 対応のある値の群間差の標準偏差: 過去の研究やパイロット研究から、HbA1c値測定の標準偏差は1.0と推定される。
  • α エラー (有意水準): 一般的な5%(0.05)に設定。
  • 検出力 (1-βエラー): 80%(0.8)の検出力に設定。
  • 検定方法: 治療により悪化するとは考えられないため、片側検定を用いる。

サンプルサイズの計算:

これらの情報を基に、適切なサンプルサイズを計算します。HbA1c値の平均的な変化(0.5%)、標準偏差(1.0%)、αエラー(0.05)、検出力(0.8)を用いて計算すると、必要な参加者数が得られます。

例えば、このシナリオでは、統計的な有意性を確保し、かつ、検出力を満たすために27人が必要と推定されます。

このように、事前に検出力を計算することで、研究の設計を最適化し、より信頼性の高い結果を得ることができます。 2群間の値の差が大きいほど、また標準偏差が小さいほど、高い検出力が期待できます。

調整された \( \alpha \)(両側検定の場合): \[ \alpha = \frac{\alpha}{2} \]

サンプルサイズに基づく自由度の計算: \[ \text{df} = \text{サンプルサイズ} - 1 \]

調整された \( \alpha \) に対する臨界 t 値の計算: ここでは、標準正規分布の逆関数を使用して t 値を計算します。 \[ t_{\alpha} = \text{正規分布の逆関数}(1 - \alpha, \text{df}) \]

検出力に対する t 値の計算: \[ t_{\beta} = \frac{\text{平均値の差}}{\text{標準誤差}} - t_{\alpha} \]

計算された検出力の計算: ここでは、標準正規分布関数を使用して計算された検出力を求めます。 \[ \text{検出力} = \text{正規分布関数}(t_{\beta}, \text{df}) \]

二分木探索を用いた最終サンプルサイズの決定: 上記プロセスにて、サンプルサイズ = 2 ~ 10000 の間で二分木探索を行い、所望の検出力に達する最小のサンプルサイズを決定します。