相関係数の検定のための検出力の計算

すでに決まっているサンプル数 (例: 予算の制約、利用可能なデータ数、実験の制限など) において、期待される相関を統計的に検出できる確率 (統計的検出力) を計算します。 これにより、「計画している研究で意味のある結果が得られる可能性はどのくらいか」を事前に評価できます。

サンプルサイズ

実際に収集可能な、または既に収集したデータの数を入力します。最低4以上である必要があります。

期待相関係数 r

検出したい相関の強さを表します。過去の研究や理論的背景から設定します。

現実的な効果量の目安:

  • 教育研究: 学習方法と成績の関係 → r = 0.2~0.4
  • 心理学研究: 性格特性間の関係 → r = 0.1~0.3
  • 医学研究: 生理指標間の関係 → r = 0.3~0.6
  • 身体測定: 身長と体重の関係 → r = 0.7~0.9

α エラー(有意水準)

統計検定で使用する有意水準です。一般的に0.05 (5%) に設定します。より厳格な基準を求める場合は0.01を使用することもあります。

検定方法

  • 両側検定: 相関の存在を調べる (正負どちらの方向でも)
  • 片側検定: 特定の方向の相関を調べる

例: 教育研究

状況: 「授業態度と成績の関係を調べたい。クラスの生徒30名のデータが利用可能」

設定:

  • サンプルサイズ: 30名
  • 期待相関係数: r = 0.4 (中程度の関係を予想)
  • 有意水準: α = 0.05
  • 検定方法: 両側検定

結果: 検出力 = 約72%

解釈: 真の相関が0.4の場合、72%の確率で統計的に有意な結果を得られます。理想的な80%には届かないものの、予備的研究としては実施する価値があります。

計算の前提

  • データが二変量正規分布に従う
  • 線形関係を仮定
  • 測定誤差が小さい

実際の研究での考慮点

  • 効果量の不確実性: 予想した相関係数が実際と異なる可能性
  • データの質: 欠損値や外れ値の影響
  • 多重比較: 複数の相関を検定する場合の補正の必要性