相関係数の検定のためのサンプルサイズの計算
解説
2つの変数の間に相関があるかどうかを統計的に検定する際に、十分な統計的検出力を得るために必要なサンプル数を計算します。 例えば、「身長と体重の間に相関があるか」「勉強時間とテストの点数に関係があるか」といった研究を行う前に、何人分のデータを集めればよいかを事前に計画できます。
パラメータ
期待相関係数 r
検出したい相関の強さを表します。過去の研究や理論から予想される値を設定します。
目安となる基準:
- 小さな相関: r = 0.1~0.3 (例:性格と学習成績の関係)
- 中程度の相関: r = 0.3~0.5 (例:身長と体重の関係)
- 大きな相関: r = 0.5以上 (例:同じテストの再テスト結果)
α エラー (有意水準)
「本当は相関がないのに、有意と判定してしまう確率」です。一般的に0.05 (5%) に設定します。これは「100回中5回までは間違いを許容する」という意味です。
検出力 (1-β エラー)
「本当に相関がある場合に、それを正しく検出できる確率」です。一般的に0.8 (80%) または0.9 (90%) に設定します。
使用例
研究例:「運動時間と睡眠の質の関係を調べたい」
設定:
- 期待相関係数:r = 0.3 (中程度の相関を予想)
- 有意水準:α = 0.05
- 検出力:80%
- 検定方法:両側検定
結果:約84名が必要
解釈:84名のデータを集めれば、真の相関が0.3の場合、80%の確率で統計的に有意な結果を得られます。
注意事項
前提条件
- データが正規分布に近い形をしている
- 測定値に大きな誤りがない
- 変数間に直線的な関係がある
計算の限界
- 非線形な関係 (曲線的な関係) には適用できません
- 外れ値の影響は考慮されていません
- 複数の相関を同時に検定する場合は、別途多重比較の調整が必要です
アプリ
Reactive stat ロゴ について
チケットが有効の場合には ロゴ は表示されません
{{title}}
{{title}}
AI による R コードの解説
R の出力結果
R出力図形
AI による R 出力結果の解説
データ
結果
{{ reasonForNoResults }}
クラウド R 分析