マクネマー検定のサンプルサイズの計算

マクネマー検定 (McNemar test) は、対応のある2つの二項変数の周辺確率が等しいかどうかを検定する統計手法です。このページでは、マクネマー検定を実施するために必要なサンプルサイズを計算できます。

マクネマー検定は以下のような研究デザインで使用されます。

  • 前後比較: 同一被験者の治療前後での反応比較 (例: 症状改善の有無)
  • ペア比較: 一対一でマッチングした被験者間の反応比較 (例: 兄弟間での疾患発症)
  • 診断法比較: 同一症例に対する2つの診断方法の一致度評価

マクネマー検定では、以下の2×2表を分析します。

後の状態
前の状態 陽性 陰性
陽性 a人 (一致) b人 (不一致)
陰性 c人 (不一致) d人 (一致)

重要な要素

  • a, d: 一致セル(前後で反応が同じ)
  • b, c: 不一致セル(前後で反応が異なる) → 検定の対象
  • 検定統計量: χ² = (|b - c|)² / (b + c)
項目 通常のカイ二乗検定 マクネマー検定
対象 独立な2群の比較 対応のある2つの測定の比較
検定統計量 4つのセル全てを使用 不一致セル(b, c)のみ使用
自由度 df = 1 df = 1
仮定 各セルの独立性 対応のあるデータ

本アプリでは不一致率を効果サイズの指標として使用します。

不一致率の定義

  • 不一致率 b/N: 全体に占める「陽→陰」変化の割合
  • 不一致率 c/N: 全体に占める「陰→陽」変化の割合
  • 総不一致率: (b + c)/N = 不一致セルの合計割合
  • 効果の大きさ: |c/N - b/N| = 不一致率の差

不一致率の解釈例

研究例 b/N (陽→陰) c/N (陰→陽) 解釈
治療効果 0.05 0.25 治療により20%の改善効果
診断一致度 0.10 0.10 診断方法間で系統的差なし
副作用発現 0.15 0.03 治療により12%の副作用増加

両側検定

  • 帰無仮説: H₀: b = c (不一致率に差がない)
  • 対立仮説: H₁: b ≠ c (不一致率に差がある)
  • 使用場面: 変化の方向を特定しない場合

片側検定

  • 帰無仮説: H₀: b ≤ c (または b ≥ c)
  • 対立仮説: H₁: b > c (または b < c)
  • 使用場面: 変化の方向が理論的に予想できる場合

例1: 治療効果の評価

研究目的: 新薬の症状改善効果

  • 測定: 治療前後での症状の有無
  • 不一致率: b/N = 0.1 (改善→悪化)、c/N = 0.3 (悪化→改善)
  • 効果サイズ: |0.3 - 0.1| = 0.2 (20%の純改善効果)
  • 検定: 両側検定、α = 0.05、検出力 = 80%

結果: 必要サンプルサイズ = 49名

例2: 診断方法の比較

研究目的: 2つの診断方法の一致度評価

  • 測定: 診断法Aと診断法Bでの診断結果
  • 不一致率: b/N = 0.08、c/N = 0.12
  • 効果サイズ: |0.12 - 0.08| = 0.04 (4%の系統的差)
  • 検定: 両側検定、α = 0.05、検出力 = 80%

結果: 必要サンプルサイズ = 1225名

サンプルサイズ計算時の考慮点

  • 不一致率の現実性: 過度に楽観的な効果サイズの設定を避ける
  • 脱落率の考慮: 縦断研究では10-15%の脱落を見込む
  • 一致セルの扱い: 検定には使用しないが、全体のパワー計算に影響

研究デザインの最適化

  • 測定タイミング: 理論的に妥当な前後測定間隔の設定
  • 対象者選定: ベースライン特性の均質性確保
  • 測定精度: 二項分類の信頼性・妥当性の検証

結果の解釈

  • 連続性補正: 小標本では連続性補正を適用(Yates補正)
  • 効果量の報告: オッズ比やリスク比による効果量の併記
  • 臨床的意義: 統計的有意性と実用的重要性の両面評価

計算上の制約

  • 不一致率の合計: (b + c)/N ≤ 1.0 である必要
  • 効果サイズ: b/N ≠ c/N である必要(差がゼロでは計算不可)
  • 最小サンプル: 期待不一致セル数が5以上を推奨

統計的仮定

  • 大標本近似: カイ二乗分布への近似が前提
  • 独立性: 各対の測定が独立である必要
  • 安定した確率: 測定期間中の不一致率が一定

サンプルサイズ計算の補足

  • 標準法: カイ二乗近似を用い、中~大規模サンプル (n > 100) や中程度の不一致率 (b/N, c/N > 0.1) に適する
  • 連続性補正: 小サンプル (n < 50) や低い不一致率 (b/N, c/N < 0.1) で近似誤差を軽減。必要サンプルサイズがやや増加
  • 正確検定: 小サンプルや極端な不一致率で二項分布を用いる。保守的で必要サンプルサイズが増加
  • Mid-p法: 正確検定の保守性を軽減。特殊な場合に使用するが、計算は複雑
  • 推奨: サンプルサイズが十分 (例: n > 100) かつ不一致率が中程度の場合、標準法で十分


後の状態 陽性 陰性 前の状態 陽性 陰性 陽→陽 (一致) a 陽→陰 (不一致) b 陰→陽 (不一致) c 陰→陰 (一致) d