1標本の平均値のt検定

解説

1標本のt検定は、1つの標本から得られた平均値が、帰無仮説で指定された母平均と統計的に有意な差があるかを検証するための推測統計手法です。

例えば、「新薬の効果が従来の標準治療と異なるかどうか」といった問いに答えるために使用します。

検定する仮説

帰無仮説 (H₀): 母平均 μ が指定された値 μ₀ と等しい

  • 数式表現: H₀: μ = μ₀

対立仮説 (H₁): 検定の方向性によって以下の3つのパターンがあります。

  • 両側検定: H₁: μ ≠ μ₀ (母平均は指定値と異なる)
  • 片側検定 (上側): H₁: μ > μ₀ (母平均は指定値より大きい)
  • 片側検定 (下側): H₁: μ < μ₀ (母平均は指定値より小さい)

片側検定は両側検定と比べて検出力が高くなりますが、事前に明確な方向性の仮説がある場合に限って適用可能です。

前提条件

この検定を行うには、以下の条件が必要です。

  • 母集団が正規分布に従っている
  • もしくは標本サイズが十分に大きい(中心極限定理により、n ≥ 30が目安)
  • 標本が無作為に抽出されている

これらの前提条件が満たされていない場合、検定結果の信頼性が低下するため、注意が必要です。

p値による判断

p値は、検定結果を判断する重要な指標です。これは、帰無仮説が真であると仮定したとき、「観測されたt統計量と同じか、それ以上に極端な値が得られる確率」として定義されます。

  • p値が小さいほど、帰無仮説と矛盾する証拠が強いことを示唆します
  • 一般的に有意水準は0.05に設定されます
  • ただし、p値が有意水準未満であっても、帰無仮説を棄却するに留まり、対立仮説が「真」であることを証明するものではありません
  • また、p値は効果の大きさや実践的な重要性を直接示すものではありません

信頼区間による解釈

信頼区間は、得られた結果の不確実性を評価する重要な指標です。

  • 得られた標本平均から真の母平均が存在すると考えられる範囲を示します
  • 95%信頼区間は、同様の方法で標本抽出と区間の計算を繰り返した場合、計算された区間の95%に真の母平均が含まれることを意味します
    • 「真の母平均がこの特定の区間内にある確率が95%」という解釈は誤りです
  • 信頼区間が帰無仮説で指定された値を含まない場合、有意水準5%で帰無仮説は棄却されます

効果量の評価

効果量は、検出された差異の実質的な大きさを示す指標です。

  • 1標本のt検定では、一般的にCohenのdを使用
  • 観測された平均値と帰無仮説で指定された値との差を標準偏差で割った値

効果量の目安

  • |d| = 0.2 → 小さな効果
  • |d| = 0.5 → 中程度の効果
  • |d| = 0.8 → 大きな効果

p値は標本サイズに強く依存するため、効果量と併せて解釈することで、より実質的な意味のある結論を導くことができます。

具体例

ある降圧薬の臨床試験を考えてみましょう。

  • 既存の標準治療: 投与3ヶ月後の収縮期血圧の平均低下値が15mmHg
  • 新薬の治験 (n=100)
    • 平均低下値: 17.5 mmHg
    • 標準偏差: 8mmHg

仮説の設定

  • 帰無仮説(H₀): μ = 15 (新薬の効果は標準治療と同じ)
  • 対立仮説(H₁): μ ≠ 15 (新薬の効果は標準治療と異なる)
  • 両側検定を採用(効果の方向性について事前の確信がないため)

分析結果

仮説設定と結果
帰無仮説新薬の平均低下値 = 15mmHg (標準治療と等しい)
t統計量3.13
p値0.001
95%信頼区間[15.9, 19.1] mmHg
効果量(Cohen's d)0.31(小から中程度の効果)

この結果の解釈

  • p値が0.001と小さいため、有意水準0.05で統計的に有意な差があると判断できます
  • 95%信頼区間の下限が15.9mmHgであることから、少なくとも0.9mmHg以上の改善が期待できます
  • 効果量は0.31と比較的小さく、臨床的意義については、副作用やコストなども考慮した総合的な判断が必要です
  • この結果は統計的な有意性を示すものであり、臨床的な重要性は別途評価する必要があります

5 10 15 20 25 標準治療 (15mmHg) 新薬平均低下値 (17.5mmHg) 15.9 19.1 臨床試験データ: ・被験者数: 100人 ・新薬の平均低下値: 17.5mmHg ・標準偏差: 8mmHg ・95%信頼区間: 15.9 ~ 19.1mmHg t統計量: 3.13 p値: 0.001 効果量(d): 0.31 降圧薬の臨床試験結果 (n=100)

データ

設定

 μ = μ0

結果