対応のある比率の比較 (McNemar検定) [直接入力]
解説
McNemar検定
McNemar検定は、関連する二値変数(例えば、前後の治療効果や診断法の効果など)において、それらの間での変化や差を統計的に評価するための手法です。 この検定は特に、同じサンプルに対して2回異なる条件や時点での測定を行った際に、その前後の変化を調査するのに適しています。
例: 新しい診断法の評価
ある疾患に対する新規診断法Aについて、既存の診断法Bと比較して、その効果を評価する場合を想定します。 100名の患者に対する、両方の診断法の結果は以下の通りです。
方法B: 陽性 | 方法B: 陰性 | |
---|---|---|
方法A: 陽性 | 40 | 5 |
方法A: 陰性 | 10 | 45 |
このテーブルから、以下の情報を読み取ることができます:
- 40人は両方の方法で陽性と診断されました。
- 45人は両方の方法で陰性と診断されました。
- 5人は方法Aで陽性、方法Bで陰性と診断されました。
- 10人は方法Aで陰性、方法Bで陽性と診断されました。
McNemar検定では、主に対角線上にないセルの値(この例では5と10)の違いに注目します。 これらのセルは、異なる方法で異なる結果が得られたケースを表しています。 一方、対角線上のセルは、両方の方法で同じ結果(陽性または陰性)が得られた患者の数を示しており、McNemar検定ではこの部分の値の差異には注目しません。 つまり、McNemar検定は、異なる方法によって結果が変わったケース対して行われます。
検定の実施
補正なしの場合: \[ χ^2 = \frac{(5 - 10)^2}{(5 + 10)} = \frac{25}{15} = 1.67 \]
小さいサンプルサイズで、連続性の補正(Yatesの補正)を適用する場合: \[ χ^2 = \frac{(|5 - 10| - 1)^2}{(5 + 10)} = \frac{16}{15} = 1.0667 \] (ここでは補正値として 1 を引いていますが、0.5 を用いる場合も多いです。R の mcnemar.test に合わせてここでは 1 にしています。)
この結果はカイ二乗分布の自由度1のもとで評価されます。 ここで得られた値が有意水準 (例えば0.05) よりも小さい場合、方法Aと方法Bの間に有意な差があると結論付けることができます。
解釈
この例では、5人と10人の間には5人の差があるので、新しい診断方法Aが既存の方法Bと異なる可能性が示唆されます。 しかし、McNemar検定 (補正あり) の結果、χ2統計量: 1.0667, p値: 0.3017 となりますので、有意差はありません。
注意点
- McNemar検定は、サンプルがマッチしたペア(たとえば、同じ患者の前後の治療結果)である場合や、同一対象者に対する反復測定のデータに適用されます。
- 独立した2つのサンプル群(例えば、異なる患者群間の比較)に対しては使用することは適切ではありません。
Bowker検定 (McNemar-Bowkerの対称検定)
Bowker検定は、3値以上のカテゴリーを持つ対応のあるデータに適用できる検定手法で、McNemar検定を拡張したものです。 Bowker検定は、同じ対象に対して2回以上の測定を行った際の結果が3値以上のカテゴリーを持つ場合に、これらのカテゴリー間での変化が偶然によるものかどうかを検定します。 すなわち、McNemar検定が2×2の分割表に対して用いられるのに対し、Bowker検定は3×3またはそれ以上の分割表に対して用いることができます。
例: ある治療法の結果の評価
例えば、ある治療法が3つの異なる結果(改善、不変、悪化)を生じさせる可能性がある場合、同一の患者群に対して治療前後での状態変化を3×3のテーブルで表し、治療による効果の有無を統計的に評価します。
方法B: 改善 | 方法B: 不変 | 方法B: 悪化 | |
---|---|---|---|
方法A: 改善 | 12 | 18 | 10 |
方法A: 不変 | 9 | 8 | 29 |
方法A: 悪化 | 8 | 13 | 10 |
注意点
- 小さいサンプルサイズでは、統計的な検出力が低下する可能性があります。
{{colNames[colIdx-1]}} | |
---|---|
{{rowNames[rowIdx-1]}} {{colNames[rowIdx-1]}} |
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
欠損値を含むカラムを選択
カラムを選択
削除対象の行
データ入力
R の出力結果
{{ rResult }}
R出力図形
AI による R 出力結果の解説
{{legendX}} | ||
---|---|---|
{{legendY}} | 合計 | |
{{ tableData.data[rowIdx-1][colIdx-1] || 0}}
|
{{ tableSum.rows[rowIdx-1] }}
|
|
{{ tableSum.cols[colIdx-1] }}
|
{{ tableSum.total }}
|
データ
設定
結果
McNemar検定の結果
Bowker検定 (McNemarの検定の拡張, McNemar-Bowkerの対称検定) の結果
Bowker検定は2x2より大きな表のためのMcNemarの検定の一般化されたバージョンです。この検定は、表の主対角線に関する対称性を検定します。
Bowker検定を使用する場合、サンプルサイズが十分であることを確認することが重要です。サンプルサイズが小さい場合、カイ二乗の近似が信頼できない可能性があります。
補正なし
補正あり
この2x2表では、非対角要素が等しいため、連続性の補正は適用されません。
3x3以上の表では、連続性の補正は適用されません。
クラウド R 分析