2群の比率の差の信頼区間

この統計手法は、2つのグループ間で発生する特定の事象 (例: 病気の罹患率、製品の不良率など) の比率が、本当に異なるのか、それとも偶然の結果として異なるのかを判断するためのものです。

具体的な例:

2つの異なる治療方法AとBの効果を検討する場合を考えます。

  1. データの収集:

    100人の患者に治療Aを施し、そのうち10人が回復。別の300人の患者に治療Bを施し、そのうち50人が回復。

  2. 各治療の回復率の計算:

    治療Aの回復率は \( \frac{10}{100} = 0.10 \) (10%)、治療Bの回復率は \( \frac{50}{300} = 0.1667 \) (16.67%)

  3. 比率の差の計算:

    治療AとBの回復率の差は \( 0.10 - 0.1667 = -0.0667 \) (-6.67%)

  4. 信頼区間の計算:

    2群の比率の差の95%信頼区間を計算します。この計算には、各治療群のサンプルサイズと回復率を用いて、標準誤差とZ値を計算し、信頼区間を導きます。

    ここでは、信頼区間は -13.9% ~ 0.569% となりました。

  5. 結論:

    95%の信頼区間が -13.9% ~ 0.569% なので、治療Aと治療Bの回復率の差は、95%の確率でこの範囲内にあると言えます。
    この信頼区間には 0% が含まれているため、有意な差があるとは言えない、という結論になります。

同様に2群の比率を比較する手法として、2群の比率の比の信頼区間があります。

1. まず、各グループの比率を計算します。
\[ p_1 = \frac{\text{event_group1}}{\text{sample_size_group1}} \]
\[ p_2 = \frac{\text{event_group2}}{\text{sample_size_group2}} \]

2. 次に、2つの比率の差の標準誤差を計算します。
\[ SE = \sqrt{\frac{p_1(1-p_1)}{\text{sample_size_group1}} + \frac{p_2(1-p_2)}{\text{sample_size_group2}}} \]

3. 与えられた信頼水準に基づいて、Z値を求めます。例えば、95%の信頼水準の場合、Z値は約1.96(正規分布の両側5%点に対応)。

4. 信頼区間の上限と下限を計算します。
\[ \text{Lower limit} = (p_1 - p_2) - Z \times SE \]
\[ \text{Upper limit} = (p_1 - p_2) + Z \times SE \]