対応のある3群以上の比率の比較 (Cochran Q 検定)
解説
Cochran Q 検定とは
Cochran Q検定は、3つ以上の関連する二項変数(例: 陽性/陰性, 有効/無効)の間の差異を評価するための統計手法です。 この検定は、同じサンプル群に対して異なる条件や時点での測定が行われた際の前後の変化を調査するのに特に適しています。
検定対象
医学研究において、ある疾患や状態の診断をする際の様々な診断方法の精度や感度を比較する場面が存在します。 このとき、複数の診断方法が同じサンプルに対してどれだけ一致するのか、またどの診断方法が最も信頼性が高いのかを知りたい場合に用います。
その他、様々な分野で関連する二項変数間の差異を調べるのに使用できます。
具体的な例
ある疾患の診断を行うための3つの異なる診断方法A、B、Cが存在するとします。 同じ患者グループの100人を対象に、これら3つの診断方法で疾患の有無を診断します。
結果は以下の通りでした
- 診断方法A:陽性 40人、陰性 60人
- 診断方法B:陽性 45人、陰性 55人
- 診断方法C:陽性 42人、陰性 58人
この結果から、3つの診断方法の診断能力に差異があるのかどうかを調べるため、Cochran Q 検定で評価します。
なお、この検定は集計結果からだけでは計算ができません。 元データ、すなわち各患者の個別の診断結果が必要になります。
要点
この検定の仮説は以下の通りです:
- 帰無仮説 (H0): 3つの診断方法間に有意な差異はない。
- 対立仮説 (H1): 少なくとも1つの診断方法が他の方法と異なる結果を示す。
検定では、Q値を計算し、カイ二乗分布を用いて統計的に評価します。 計算されたQ値と対応するカイ二乗分布のp値を比較して、帰無仮説を受け入れるか、対立仮説を受け入れるかを決定します。
注意点
Cochran Q検定は、マッチしたペアまたは反復測定が行われる場合にのみ適用されます。 独立した2つのサンプルに対しては使用できません。
また、検定の統計的パワーは、比率の差が小さい場合やサンプルサイズが小さい場合には低下する可能性があります。
Reactive stat の特徴
多くの統計パッケージでは、データの値は 0, 1 しか受け付けないので、事前にそのようにデータを変換しておく必要があり、意外と敷居が高いものです。 また、例えば 陽性/陰性, 有効/無効 ではなく「不明」が一つでもあると扱うことができなくなります。
しかし、Reactive stat では、0/1 以外のカテゴリー変数であってもそのまま処理できますし、「不明」などを自動的に除去することができます。 事前準備がほぼ必要ありませんので、手軽に検定することが可能です。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
欠損値を含むカラムを選択
カラムを選択
削除対象の行
元データ
id | カラム1 | カラム2 |
---|---|---|
1 | A | B |
2 | C | D |
変換後のデータ
id | データ名 | 値 |
---|---|---|
1 | カラム1 | A |
1 | カラム2 | B |
2 | カラム1 | C |
2 | カラム2 | D |
{{ replaced_script }}
R の出力結果
{{ rResult }}
R output figures
AI による R 出力結果の解説
{{legendX}} | ||
---|---|---|
{{legendY}} | 集計 | |
{{ tableData.data[rowIdx-1][colIdx-1] || 0}}
|
{{ tableSum.rows[rowIdx-1] }}
|
|
{{ tableSum.cols[colIdx-1] }}
|
{{ tableSum.total }}
|
データ
設定
結果
集計
検定用整形データ
Cochran Q 検定の結果
Cochran Q 検定のQ統計量は以下のように計算します。
\[ Q = \frac{k(k-1) \sum_{i=1}^{k} \left( XJ_i - \frac{N}{k} \right)^2 }{\sum_{j=1}^{b} XI_j (k - XI_j)} \]ここで:
- \( k \) は治療法(または条件)の数です。
- \( b \) は被験者の数です。
- \( XJ_i \) は治療法 \( i \) における反応の合計です。
- \( XI_j \) は被験者 \( j \) の反応の合計です。
- \( N \) は全ての反応の合計です。
p値の計算:
得られたQ統計量を、自由度 \( k - 1 \) の \( \chi^2 \) 分布と比較してp値を求めます。
\[ p = 1 - F_{\chi^2(k-1)}(Q) \]ここで \( F_{\chi^2(k-1)} \) は自由度 \( k-1 \) の \( \chi^2 \) 分布の累積分布関数を示します。