マクネマー検定の検出力の計算

マクネマー検定 (McNemar test) は、対応のある2つの二項変数の周辺確率が等しいかどうかを検定する統計手法です。このページでは、既定のサンプルサイズにおいて、マクネマー検定で期待される統計的検出力を計算できます。

マクネマー検定は以下のような研究デザインで使用されます。

  • 前後比較: 同一被験者の治療前後での反応比較 (例: 症状改善の有無)
  • ペア比較: 一対一でマッチングした被験者間の反応比較 (例: 兄弟間での疾患発症)
  • 診断法比較: 同一症例に対する2つの診断方法の一致度評価

マクネマー検定では、以下の2×2表を分析します。

後の状態
前の状態 陽性 陰性
陽性 a人 (一致) b人 (不一致)
陰性 c人 (不一致) d人 (一致)

重要な要素

  • a, d: 一致セル(前後で反応が同じ)
  • b, c: 不一致セル(前後で反応が異なる) → 検定の対象
  • 検定統計量: χ² = (|b - c|)² / (b + c)
項目 通常のカイ二乗検定 マクネマー検定
対象 独立な2群の比較 対応のある2つの測定の比較
検定統計量 4つのセル全てを使用 不一致セル(b, c)のみ使用
自由度 df = 1 df = 1
仮定 各セルの独立性 対応のあるデータ

本アプリでは不一致率を効果サイズの指標として使用します。

不一致率の定義

  • 不一致率 b/N: 全体に占める「陽→陰」変化の割合
  • 不一致率 c/N: 全体に占める「陰→陽」変化の割合
  • 総不一致率: (b + c)/N = 不一致セルの合計割合
  • 効果の大きさ: |c/N - b/N| = 不一致率の差

不一致率の解釈例

研究例 b/N (陽→陰) c/N (陰→陽) 解釈
治療効果 0.05 0.25 治療により20%の改善効果
診断一致度 0.10 0.10 診断方法間で系統的差なし
副作用発現 0.15 0.03 治療により12%の副作用増加

両側検定

  • 帰無仮説: H₀: b = c (不一致率に差がない)
  • 対立仮説: H₁: b ≠ c (不一致率に差がある)
  • 使用場面: 変化の方向を特定しない場合

片側検定

  • 帰無仮説: H₀: b ≤ c (または b ≥ c)
  • 対立仮説: H₁: b > c (または b < c)
  • 使用場面: 変化の方向が理論的に予想できる場合

例1: 治療効果の評価

研究目的: 新薬の症状改善効果

  • 測定: 治療前後での症状の有無
  • 不一致率: b/N = 0.1 (改善→悪化)、c/N = 0.3 (悪化→改善)
  • 効果サイズ: |0.3 - 0.1| = 0.2 (20%の純改善効果)
  • 検定: 両側検定、α = 0.05、サンプルサイズ = 49名

結果: 期待される検出力 = 80%

例2: 診断方法の比較

研究目的: 2つの診断方法の一致度評価

  • 測定: 診断法Aと診断法Bでの診断結果
  • 不一致率: b/N = 0.08、c/N = 0.12
  • 効果サイズ: |0.12 - 0.08| = 0.04 (4%の系統的差)
  • 検定: 両側検定、α = 0.05、サンプルサイズ = 800名

結果: 期待される検出力 = 65%

検出力の評価基準

  • 検出力 ≥ 80%: 十分な検出力(研究実施推奨)
  • 60% ≤ 検出力 < 80%: 中程度の検出力(サンプルサイズ増加を検討)
  • 検出力 < 60%: 不十分な検出力(研究計画の見直し必要)

検出力向上の方法

  • サンプルサイズの増加: 最も確実だが費用・時間が増加
  • 効果サイズの見直し: より現実的な不一致率の設定
  • 測定精度の向上: 分類エラーの減少により真の効果を検出しやすく
  • 研究対象の絞り込み: より均質な集団で効果を明確化

効果サイズの設定

  • 先行研究の参考: 類似研究の効果量を参考にする
  • 臨床的意義: 統計学的検出だけでなく実用的重要性を考慮
  • 最小重要差: 検出すべき最小の変化量を明確化

研究の実現可能性

  • 予算・時間制約: 利用可能なリソースとのバランス
  • 対象者確保: 必要な特性を持つ被験者の入手可能性
  • 脱落率の考慮: 縦断研究では10-15%の脱落を見込む

結果の解釈

  • 事前検出力: 研究開始前の理論値
  • 事後検出力: 実際の結果に基づく実現値
  • 効果量の報告: オッズ比やリスク比による効果量の併記
  • 信頼区間: 点推定だけでなく区間推定の重要性

計算上の制約

  • 不一致率の合計: (b + c)/N ≤ 1.0 である必要
  • 効果サイズ: b/N ≠ c/N である必要(差がゼロでは計算不可)
  • 最小サンプル: 期待不一致セル数が5以上を推奨

統計的仮定

  • 大標本近似: カイ二乗分布への近似が前提
  • 独立性: 各対の測定が独立である必要
  • 安定した確率: 測定期間中の不一致率が一定

検出力計算の補足

  • 標準法: カイ二乗近似を用い、中~大規模サンプル (n > 100) や中程度の不一致率 (b/N, c/N > 0.1) に適する
  • 連続性補正: 小サンプル (n < 50) や低い不一致率 (b/N, c/N < 0.1) で近似誤差を軽減。検出力がやや低下
  • 正確検定: 小サンプルや極端な不一致率で二項分布を用いる。より正確だが保守的
  • Mid-p法: 正確検定の保守性を軽減。特殊な場合に使用するが、計算は複雑
  • 推奨: サンプルサイズが十分 (例: n > 100) かつ不一致率が中程度の場合、標準法で十分


後の状態 陽性 陰性 前の状態 陽性 陰性 陽→陽 (一致) a 陽→陰 (不一致) b 陰→陽 (不一致) c 陰→陰 (一致) d