相関係数の検定のためのサンプルサイズの計算

2つの変数の間に相関があるかどうかを統計的に検定する際に、十分な統計的検出力を得るために必要なサンプル数を計算します。 例えば、「身長と体重の間に相関があるか」「勉強時間とテストの点数に関係があるか」といった研究を行う前に、何人分のデータを集めればよいかを事前に計画できます。

期待相関係数 r

検出したい相関の強さを表します。過去の研究や理論から予想される値を設定します。

目安となる基準

  • 小さな相関: r = 0.1~0.3 (例:性格と学習成績の関係)
  • 中程度の相関: r = 0.3~0.5 (例:身長と体重の関係)
  • 大きな相関: r = 0.5以上 (例:同じテストの再テスト結果)

α エラー (有意水準)

「本当は相関がないのに、有意と判定してしまう確率」です。一般的に0.05 (5%) に設定します。これは「100回中5回までは間違いを許容する」という意味です。

検出力 (1-β エラー)

「本当に相関がある場合に、それを正しく検出できる確率」です。一般的に0.8 (80%) または0.9 (90%) に設定します。

研究例:「運動時間と睡眠の質の関係を調べたい」

設定

  • 期待相関係数:r = 0.3 (中程度の相関を予想)
  • 有意水準:α = 0.05
  • 検出力:80%
  • 検定方法:両側検定

結果:約84名が必要

解釈:84名のデータを集めれば、真の相関が0.3の場合、80%の確率で統計的に有意な結果を得られます。

前提条件

  • データが正規分布に近い形をしている
  • 測定値に大きな誤りがない
  • 変数間に直線的な関係がある

計算の限界

  • 非線形な関係 (曲線的な関係) には適用できません
  • 外れ値の影響は考慮されていません
  • 複数の相関を同時に検定する場合は、別途多重比較の調整が必要です