平均値の信頼区間 (直接入力)
解説
重要な概念
信頼区間は、母集団の平均値が特定の範囲にあると推測するための統計的手法です。 ただし、信頼区間は個々の区間が母集団平均を含む確率を直接示すものではなく、同じ手順で多数のサンプルを得た場合、計算された信頼区間のうち一定割合 (通常は95%) が母集団平均を含むという性質を持ちます。
母集団からサンプルを抽出する際、サンプルの平均値は確率的に変動します。この変動の大きさは標準誤差として定量化され、サンプルサイズが大きいほど小さくなります。
計算方法と解釈
信頼区間の計算に必要なデータ
- 平均値: サンプルの平均値
- 標準偏差: データのばらつきを示す指標
- サンプルサイズ: 分析対象となるデータの数
- 信頼水準: 通常95%または99%を使用
計算手順
- 標準誤差の計算
- 標準誤差 = \( \frac{\text{標準偏差}}{\sqrt{\text{サンプルサイズ} } } \)
- これはサンプル平均のばらつきを表す
- 信頼係数の決定
- 95%信頼区間の場合、t分布の値を使用
- 自由度 = サンプルサイズ - 1
- 区間の計算
- 信頼区間 = \( \text{平均値} \pm (\text{t値} \times \text{標準誤差}) \)
解釈
統計的な意味
- この区間は母平均の推定範囲を示す
- 同様の手順で多数回の計算を行うと、約95%の区間が母平均を含む
- 個々の区間について、母平均を含む確率は95%ではない
実務での判断
- 区間幅が狭いほど、推定精度が高い
- サンプルサイズを増やすと、通常は区間幅が狭くなる
- 実務上の要求精度と比較して判断
注意点
- データが正規分布に従うことを仮定
- 外れ値の影響を受けやすい
- サンプルサイズが小さい場合、区間が広くなる
具体例
ある地域の中学生から無作為に100人を抽出し、その身長の平均値と標準偏差を求め、次の値となったとする。
- 平均値: 160cm
- 標準偏差: 10cm
- サンプルサイズ: 100人
- 信頼水準: 95%
計算過程
- 標準誤差 = \( \frac{10}{\sqrt{100} } = 1 \) = 1
- 自由度99でのt値 = 1.984
- 95%信頼区間 = \( 160 \pm (1.984 \times 1) \)
- 結果: [158.0, 162.0]
{{title}}
{{title}}
R の出力結果
R出力図形
AI による R 出力結果の解説
データ
結果
クラウド R 分析