1標本の平均値のt検定
解説
1標本のt検定は、1つの標本から得られた平均値が、帰無仮説で指定された母平均と統計的に有意な差があるかを検証するための推測統計手法です。
例えば、「新薬の効果が従来の標準治療と異なるかどうか」といった問いに答えるために使用します。
検定する仮説
帰無仮説 (H₀): 母平均 μ が指定された値 μ₀ と等しい
- 数式表現: H₀: μ = μ₀
対立仮説 (H₁): 検定の方向性によって以下の3つのパターンがあります。
- 両側検定: H₁: μ ≠ μ₀ (母平均は指定値と異なる)
- 片側検定 (上側): H₁: μ > μ₀ (母平均は指定値より大きい)
- 片側検定 (下側): H₁: μ < μ₀ (母平均は指定値より小さい)
片側検定は両側検定と比べて検出力が高くなりますが、事前に明確な方向性の仮説がある場合に限って適用可能です。
前提条件
この検定を行うには、以下の条件が必要です。
- 母集団が正規分布に従っている
- もしくは標本サイズが十分に大きい(中心極限定理により、n ≥ 30が目安)
- 標本が無作為に抽出されている
これらの前提条件が満たされていない場合、検定結果の信頼性が低下するため、注意が必要です。
p値による判断
p値は、検定結果を判断する重要な指標です。これは、帰無仮説が真であると仮定したとき、「観測されたt統計量と同じか、それ以上に極端な値が得られる確率」として定義されます。
- p値が小さいほど、帰無仮説と矛盾する証拠が強いことを示唆します
- 一般的に有意水準は0.05に設定されます
- ただし、p値が有意水準未満であっても、帰無仮説を棄却するに留まり、対立仮説が「真」であることを証明するものではありません
- また、p値は効果の大きさや実践的な重要性を直接示すものではありません
信頼区間による解釈
信頼区間は、得られた結果の不確実性を評価する重要な指標です。
- 得られた標本平均から真の母平均が存在すると考えられる範囲を示します
- 95%信頼区間は、同様の方法で標本抽出と区間の計算を繰り返した場合、計算された区間の95%に真の母平均が含まれることを意味します
- 「真の母平均がこの特定の区間内にある確率が95%」という解釈は誤りです
- 信頼区間が帰無仮説で指定された値を含まない場合、有意水準5%で帰無仮説は棄却されます
効果量の評価
効果量は、検出された差異の実質的な大きさを示す指標です。
- 1標本のt検定では、一般的にCohenのdを使用
- 観測された平均値と帰無仮説で指定された値との差を標準偏差で割った値
効果量の目安
- |d| = 0.2 → 小さな効果
- |d| = 0.5 → 中程度の効果
- |d| = 0.8 → 大きな効果
p値は標本サイズに強く依存するため、効果量と併せて解釈することで、より実質的な意味のある結論を導くことができます。
具体例
ある降圧薬の臨床試験を考えてみましょう。
- 既存の標準治療: 投与3ヶ月後の収縮期血圧の平均低下値が15mmHg
- 新薬の治験 (n=100)
- 平均低下値: 17.5 mmHg
- 標準偏差: 8mmHg
仮説の設定
- 帰無仮説(H₀): μ = 15 (新薬の効果は標準治療と同じ)
- 対立仮説(H₁): μ ≠ 15 (新薬の効果は標準治療と異なる)
- 両側検定を採用(効果の方向性について事前の確信がないため)
分析結果
仮説設定と結果 | 値 |
---|---|
帰無仮説 | 新薬の平均低下値 = 15mmHg (標準治療と等しい) |
t統計量 | 3.13 |
p値 | 0.001 |
95%信頼区間 | [15.9, 19.1] mmHg |
効果量(Cohen's d) | 0.31(小から中程度の効果) |
この結果の解釈
- p値が0.001と小さいため、有意水準0.05で統計的に有意な差があると判断できます
- 95%信頼区間の下限が15.9mmHgであることから、少なくとも0.9mmHg以上の改善が期待できます
- 効果量は0.31と比較的小さく、臨床的意義については、副作用やコストなども考慮した総合的な判断が必要です
- この結果は統計的な有意性を示すものであり、臨床的な重要性は別途評価する必要があります
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
削除対象の行
データ入力
R の出力結果
R出力図形
AI による R 出力結果の解説
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2)
, "体重" / ("身長" * "身長")
{{ column }}
{{title}}
データ
設定
結果
クラウド R 分析