1群の比率を既知の比率と比較するためのサンプルサイズの計算
解説
この計算方法は、特定の群における比率(例えば治療の奏効率)を、既知の比率(例えば以前の研究からの治療の奏効率)と比較する際に必要なサンプルサイズを求めるために使用されます。 このような比較は、新しい治療法や介入の効果を既存のものと比較し、その差異を統計的に検証するために行われます。
具体例
たとえば、ある治療の標準治療の奏効率が 20% であるとして、30% の奏効率が想定されている新しい治療法が、標準治療よりも優れていることを確認したい場合、何人の患者さんで調べる必要があるかを計算します。
既知の比率: 以前の研究や情報から得られた比率です。 この例では、20% が既知の比率となります。
想定する比率: 新しい治療で想定される比率です。 この例では、30% が想定の比率となります。
α エラー: 実は差がないのに「差がある」と誤って判断する確率です。 通常は 0.05 とします。 Type I error rate とも表現します。
検出力 (1 - βエラー): 実際に差が存在した場合、それを検出できる確率です。 通常は 0.8 程度とします。 βエラー (Type II error rate) は、実際には差が存在する場合に、その差を見逃してしまうリスクです。
これらの要素をもとに、研究を行うためのサンプルサイズが計算されます。
- 効果の差が大きいほど、サンプルサイズは小さくて済みます。
- αやβのリスクを小さくしたい場合、サンプルサイズは大きくなります。
これらの情報をもとに、適切なサンプルサイズを計算し、研究を行うことで、統計的に有意な結果を得られる可能性が高まります。
検定方法:
- 両側検定: 両側検定は、新しい治療法の奏効率が標準治療の奏効率と異なるかどうかを検討する場合に適しています。つまり、新しい治療法が標準治療よりも良いだけでなく、悪い可能性も考慮に入れます。この場合、αエラーのリスクは両方向に分散されるため、片側検定に比べてより厳しい基準を設定します。
- 片側検定: 片側検定は、新しい治療法が標準治療よりも良い(または悪い)ことだけを証明することを目的とする場合に適しています。片側検定は、研究の仮説が特定の方向性を持っている場合に使用されます。
この例では、新しい治療が標準治療よりも優れていることを示すことが目的であれば、「片側検定」が適切です。 ただし、新しい治療が標準治療と異なる効果(良いまたは悪い)を持つ可能性があると考える場合は、「両側検定」を選択します。
カイ2乗検定の連続性補正:
- 連続性補正あり: 小さいサンプルサイズ (<20) の場合や、分割表にしたときに期待値が小さいセル (<5) が含まれる場合に、カイ二乗検定の近似を改善するために連続性補正が用いられます。
- 連続性補正なし: サンプルサイズが大きい場合や、全てのセルの期待値が十分に大きい場合は連続性補正は必要ありません。
{{ replaceNewlinesInStrings(replacedScript) }}
R の出力結果
{{ rResult }}
R出力図形
AI による R 出力結果の解説
データ
結果
{{ reasonForNoResults }}
\( N = \frac{\left( Z_{\frac{\alpha}{2}} \times \sqrt{p_1 \times (1 - p_1)} + Z_{\beta} \times \sqrt{p_2 \times (1 - p_2)} \right)^2}{(p_2 - p_1)^2} + \frac{m}{|p_2 - p_1|} \)
ここで、- \( N \) は必要なサンプルサイズ
- \( Z_{\frac{\alpha}{2}} \) は所定の有意水準 α での正規分布の両側z値(片側検定の場合は \( Z_{\alpha} \))
- \( Z_{\beta} \) は所定の検出力 (1-β) での正規分布のz値
- \( p_1 \) は想定する比率
- \( p_2 \) は既知の比率
- \( m \) は検定方法(両側の場合は2、片側の場合は1)
この公式は、二項分布のサンプル割合の差を検出するために必要なサンプルサイズを推定するためのものです。最後の項 \( \frac{m}{|p_2 - p_1|} \) は連続性補正を表し、カイ2乗検定の連続性補正が「あり」の場合に加算されます。
公式の基本的な考え方は、想定する比率と既知の比率の差を検出するために必要な検出力と有意水準を満たすサンプルサイズを求めることです。
クラウド R 分析