対応のある比率の比較(McNemar検定)

McNemar検定は、関連する二値変数(例えば、前後の治療効果や診断法の効果など)において、それらの間での変化や差を統計的に評価するための手法です。 この検定は特に、同じサンプルに対して2回異なる条件や時点での測定を行った際に、その前後の変化を調査するのに適しています。

例: 新しい診断法の評価

ある疾患に対する新規診断法Aについて、既存の診断法Bと比較して、その効果を評価する場合を想定します。 100名の患者に対する、両方の診断法の結果は以下の通りです。

方法B: 陽性 方法B: 陰性
方法A: 陽性 40 5
方法A: 陰性 10 45

このテーブルから、以下の情報を読み取ることができます:

  • 40人は両方の方法で陽性と診断されました。
  • 45人は両方の方法で陰性と診断されました。
  • 5人は方法Aで陽性、方法Bで陰性と診断されました。
  • 10人は方法Aで陰性、方法Bで陽性と診断されました。

McNemar検定では、主に対角線上にないセルの値(この例では5と10)の違いに注目します。 これらのセルは、異なる方法で異なる結果が得られたケースを表しています。 一方、対角線上のセルは、両方の方法で同じ結果(陽性または陰性)が得られた患者の数を示しており、McNemar検定ではこの部分の値の差異には注目しません。 つまり、McNemar検定は、異なる方法によって結果が変わったケース対して行われます。

検定の実施

補正なしの場合: \[ χ^2 = \frac{(5 - 10)^2}{(5 + 10)} = \frac{25}{15} = 1.67 \]

小さいサンプルサイズで、連続性の補正(Yatesの補正)を適用する場合: \[ χ^2 = \frac{(|5 - 10| - 1)^2}{(5 + 10)} = \frac{16}{15} = 1.0667 \] (ここでは補正値として 1 を引いていますが、0.5 を用いる場合も多いです。R の mcnemar.test に合わせてここでは 1 にしています。)

この結果はカイ二乗分布の自由度1のもとで評価されます。 ここで得られた値が有意水準 (例えば0.05) よりも小さい場合、方法Aと方法Bの間に有意な差があると結論付けることができます。

解釈

この例では、5人と10人の間には5人の差があるので、新しい診断方法Aが既存の方法Bと異なる可能性が示唆されます。 しかし、McNemar検定 (補正あり) の結果、χ2統計量: 1.0667, p値: 0.3017 となりますので、有意差はありません。

注意点

  • McNemar検定は、サンプルがマッチしたペア(たとえば、同じ患者の前後の治療結果)である場合や、同一対象者に対する反復測定のデータに適用されます。
  • 独立した2つのサンプル群(例えば、異なる患者群間の比較)に対しては使用することは適切ではありません。

Bowker検定は、3値以上のカテゴリーを持つ対応のあるデータに適用できるように Bowker検定は、同じ対象に対して2回測定を行った際の結果が3値以上のカテゴリーを持つ場合に、これらのカテゴリー間での変化が偶然によるものかどうかを検定する手法で、McNemar検定を拡張したものです。 すなわち、McNemar検定が2×2の分割表に対して用いられるのに対し、Bowkerのテストは3×3またはそれ以上の分割表に対して用いることができます。

例: ある治療法の結果の評価

例えば、ある治療法が3つの異なる結果(改善、不変、悪化)を生じさせる可能性がある場合、同一の患者群に対して治療前後での状態変化を3×3のテーブルで表し、治療による効果の有無を統計的に評価します。

方法B: 改善 方法B: 不変 方法B: 悪化
方法A: 改善 12 18 10
方法A: 不変 9 8 29
方法A: 悪化 8 13 10

注意点

  • 小さいサンプルサイズでは、統計的な検出力が低下する可能性があります。

検定に用いる共通な値を2つ以上選択してください