重回帰分析の検出力の計算

重回帰分析の検出力計算は、既に決定されたサンプルサイズにおいて、指定した効果サイズを統計的に検出できる確率を算出します。研究の実施前に検出力を確認することで、研究設計の妥当性を評価できます。

本アプリでは、個別の回帰係数の検定 (t検定) において、特定の回帰係数が0でないかの検定が対象です。

: 血圧 = β₀ + β₁×年齢 + β₂×性別 + β₃×BMI + ε のモデルで、「年齢の回帰係数β₁が0でない」という仮説の検定

すべての回帰係数が同時に0かどうかというモデル全体の検定 (F検定) には対応していません。

本アプリではCohen's f² を効果サイズの指標として使用します。

Cohen's f² の定義と解釈

f² = R²/(1 - R²)

R: 重相関係数
R²: 重相関係数の二乗 = 決定係数
効果サイズ R²換算 解釈
小効果 f² = 0.02 R² ≈ 0.02 わずかな説明力
中効果 f² = 0.15 R² ≈ 0.13 中程度の説明力 (一般的な目標)
大効果 f² = 0.35 R² ≈ 0.26 高い説明力

効果サイズの決定方法

  • 先行研究: 類似研究でのR²値を参考にf²を算出
  • 実用的重要性: 研究分野での実用的に意味のある説明力
  • 予備分析: パイロット研究での回帰分析結果
要因 検出力への影響 重回帰分析での特徴
効果サイズ (f²) 大きいほど検出力↑ R²/(1-R²)で算出、分野により大きく異なる
サンプルサイズ (n) 大きいほど検出力↑ 予測変数数に応じた最小値が存在
検定対象変数数 多いほど検出力↓ 同時検定する回帰係数の個数
その他の予測変数数 多いほど検出力↓ モデルの複雑さが検出力を低下させる

検定対象の予測変数数

定義: 仮説検定で関心のある回帰係数の個数

重回帰分析での例:

  • 年齢の効果のみを検定 → 1
  • 教育手法 (3群) の効果を検定 → 2 (ダミー変数2個)
  • 年齢と性別の効果を同時検定 → 2

その他の予測変数数

定義: モデルに含むが検定の主対象でない統制変数の個数

重要性: この値が大きいほど検出力は低下します。

: 年齢の効果を検証する際に性別・BMI・収入で調整

  • 検定対象: 年齢 (1変数)
  • その他: 性別、BMI、収入 (3変数)

サンプルサイズの制約

最小要件: n > 検定対象変数数 + その他変数数 + 1

この制約により、複雑なモデルほど多くのサンプルが必要になります。

例1: 単一変数の効果検定

研究: 年齢が血圧に与える影響 (性別・BMIで調整)

設定:

  • サンプルサイズ: 50名
  • 検定対象: 年齢の効果 (1変数)
  • その他変数: 性別、BMI (2変数)
  • 期待効果サイズ: f² = 0.15

結果: 検出力 = 74.8%

解釈: やや不足だが実行可能性を考慮して研究実施

例2: 複雑なモデルでの検出力低下

研究: 治療効果の検証 (多数の共変量で調整)

設定:

  • サンプルサイズ: 50名
  • 検定対象: 治療効果 (1変数)
  • その他変数: 年齢、性別、重症度、施設、既往歴 (5変数)
  • 期待効果サイズ: f² = 0.15

結果: 検出力 = 71.9%

問題点: 統制変数が多すぎて検出力が低下

改善策:

  • 統制変数の絞り込み (3変数に削減) → 検出力 = 79%
  • サンプルサイズ増加 (120名) → 検出力 = 81%

例3: 非有意結果の事後的検出力分析

状況: n=60の研究で非有意結果 (p=0.12)

事後分析:

  • 検定対象変数: 1個
  • その他変数: 2個
  • 観察された効果サイズ: f² = 0.08
  • 計算された検出力: 48.4%

解釈: 検出力不足により真の効果を見逃した可能性

提言: n≈120での追試を推奨 (検出力: 86.2%)

モデルの簡素化

方法: 不必要な統制変数の除去

効果: 自由度の増加により検出力向上

注意: 理論的に重要な変数は保持

測定精度の向上

方法: より精密な測定器具・手法の使用

効果: 測定誤差の削減により効果サイズ増大

: 血圧測定での複数回測定の平均値使用

共変量の事前測定

方法: ベースライン値を共変量として投入

効果: 個人差の統制により検出力向上

: 介入前後比較でのベースライン値調整

R の pwr パッケージの pwr.f2.test() 関数を使用しています。 pwrパッケージは統計的検出力とサンプルサイズ計算のための標準的なライブラリです。

pwr パッケージについて

  • 公式ページ: CRAN - pwr
  • 詳細ドキュメント: pwr Package Manual
  • 対応する統計手法: t検定、ANOVA、回帰分析、相関分析、比率検定など多数の手法に対応
  • 特徴: Cohen (1988) の統計的検出力分析の理論に基づく標準的なライブラリ

重回帰分析特有の制約

  • 多重共線性: 予測変数間の高い相関が検出力に影響
  • モデル選択: 変数選択により検出力が変動
  • 効果サイズの推定: 先行研究が少ない場合の推定困難

計算の限界

  • 線形関係の仮定: 非線形関係は考慮されない
  • 交互作用効果: 変数間の相互作用は含まれない
  • 誤差分布: 正規性の仮定

重回帰分析の検出力計算は、限られたサンプルサイズでの研究実行可能性を評価する重要なツールですが、モデルの複雑さと検出力の トレードオフを理解して活用することが重要です。