比率の信頼区間 (直接入力)

比率の信頼区間は、サンプルデータから母集団の真の比率を推定するための統計的手法です。 この手法により、サンプルから得られた比率が持つ不確実性を定量的に評価できます。

  • 信頼区間 - サンプリングを繰り返した場合、指定した確率(例: 95%)で真の母比率を含む区間
  • 信頼水準 - 信頼区間が真の値を含む確率(通常95%を使用)
  • 標本比率 - サンプルデータから計算された比率
  • サンプルは母集団を代表している必要があります
  • サンプルサイズが小さすぎると推定精度が低下します
  • 非無作為抽出の場合、推定結果にバイアスが生じる可能性があります
  • 必要なデータ
    • サンプルサイズ(n)
    • 事象の発生数(x)
    • 信頼水準(通常95%)
  • 計算手順
    • 標本比率(p) = x/n を算出
    • Wilsonのスコア区間を使用して信頼区間を計算

解釈のポイント

  • 正しい解釈: 同様のサンプリングを多数回実施した場合、計算された区間の95%が真の母比率を含む
  • 誤った解釈: 計算された区間に95%の確率で真の母比率が含まれる (間違い)
  • 実務での活用: 推定された区間の幅から、追加のデータ収集が必要かどうかを判断できます

1. データ収集

  • 対象: 1000人の市民
  • 結果: 50人が疾患に罹患

2. 分析手順

  • 標本比率の計算: 50/1000 = 0.05 (5.0%)
  • 95%信頼区間の計算: 0.0381 ~ 0.0653

3. 解釈

  • この信頼区間(3.81%~6.53%)は、同じような標本抽出を多数回繰り返した場合、計算された区間の95%に真の母比率が含まれることを意味する
  • この推定は、サンプルが母集団を適切に代表している場合にのみ有効

0% 2% 4% 6% 8% 標本比率 (5.0%) 3.81% 6.53% 調査対象: 1000人 疾患罹患者: 50人 標本比率: 5.0% 95%信頼区間: 3.81% ~ 6.53% この区間は、同様の調査を 繰り返した場合、95%の確率で 真の比率を含む範囲を示す 疾患罹患率の95%信頼区間 (n=1000)

  • 誤解1: 信頼区間は真の値が含まれる確率を示す
    • 正しい理解: 多数回のサンプリングにおける区間の性質を示す
  • 誤解2: サンプルサイズが大きければ常に正確
    • 正しい理解: サンプリング方法の適切性も重要