対応のある3群以上のカテゴリカルデータの分析
解説
概要
このアプリケーションは、3つ以上の関連するカテゴリカルデータの分析を行います。 選択された値の数に応じて、以下の検定方法を自動的に適用します。
- Cochran Q検定: 2値データ (例: 陽性/陰性) の場合
- Bowker検定/Stuart-Maxwell検定: 3値以上のカテゴリカルデータの場合
Cochran Q検定 (2値データ)
Cochran Q検定は、3つ以上の関連する二項変数(例: 陽性/陰性, 有効/無効)の間の差異を評価するための統計手法です。 この検定は、同じサンプル群に対して異なる条件や時点での測定が行われた際の前後の変化を調査するのに特に適しています。
検定対象
医学研究において、ある疾患や状態の診断をする際の様々な診断方法の精度や感度を比較する場面が存在します。 このとき、複数の診断方法が同じサンプルに対してどれだけ一致するのか、またどの診断方法が最も信頼性が高いのかを知りたい場合に用います。
その他、様々な分野で関連する二項変数間の差異を調べるのに使用できます。
具体例
ある疾患の診断を行うための3つの異なる診断方法A、B、Cが存在するとします。 同じ患者グループの100人を対象に、これら3つの診断方法で疾患の有無を診断します。
Cochran Q 検定では、各患者について3つの診断方法それぞれの結果 (陽性/陰性) を記録した個別データから、3つの診断方法の診断能力に差異があるのかどうかを評価します。
例えば以下のような個別データが必要です。
患者ID | 診断A | 診断B | 診断C |
---|---|---|---|
1 | 陽性 | 陽性 | 陰性 |
2 | 陰性 | 陽性 | 陽性 |
3 | 陽性 | 陽性 | 陽性 |
… | … | … | … |
なお、以下のような集計結果だけからは、検定を実施することはできません。
- 診断方法A:陽性 40人、陰性 60人
- 診断方法B:陽性 45人、陰性 55人
- 診断方法C:陽性 42人、陰性 58人
この検定の仮説は以下の通りです。
- 帰無仮説 (H0): 3つの診断方法間に有意な差異はない。
- 対立仮説 (H1): 少なくとも1つの診断方法が他の方法と異なる結果を示す。
検定では、Q値を計算し、カイ二乗分布を用いて統計的に評価します。 計算されたQ値と対応するカイ二乗分布のp値を比較して、帰無仮説を受け入れるか、対立仮説を受け入れるかを決定します。
注意点
Cochran Q検定は、マッチしたペアまたは反復測定が行われる場合にのみ適用されます。 独立した2つのサンプルに対しては使用できません。
また、検定の統計的パワーは、比率の差が小さい場合やサンプルサイズが小さい場合には低下する可能性があります。
Reactive stat の特徴
多くの統計パッケージでは、データの値は 0, 1 しか受け付けないので、事前にそのようにデータを変換しておく必要があり、意外と敷居が高いものです。 また、例えば 陽性/陰性, 有効/無効 ではなく「不明」が一つでもあると扱うことができなくなります。
しかし、Reactive stat では、0/1 以外のカテゴリー変数であってもそのまま処理できますし、「不明」などを自動的に除去することができます。 事前準備がほぼ必要ありませんので、手軽に検定することが可能です。
Bowker検定 / Stuart-Maxwell検定 (3値以上)
Bowker検定と Stuart-Maxwell検定の解説は、対応のある分割表の説明ページ を参照してください。
これを3群以上に適用するため、組み合わせ (A, B, C の3群であれば A-B, A-C, B-C) の各々に検定を行い、得られた p値に対して多重比較の補正を行います。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
欠損値を含むカラムを選択
カラムを選択
削除対象の行
データ入力
R の出力結果
R出力図形
AI による R 出力結果の解説
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2)
, "体重" / ("身長" * "身長")
{{ column }}
{{legendX}} | ||
---|---|---|
{{legendY}} | 合計 | |
{{ tableData.data[rowIdx-1][colIdx-1] || 0}}
|
{{ tableSum.rows[rowIdx-1] }}
|
|
{{ tableSum.cols[colIdx-1] }}
|
{{ tableSum.total }}
|
データ
設定
結果
集計
検定用整形データ
Cochran Q 検定の結果
McNemar 検定を用いたペアワイズ比較
Cochran Q 検定にて p < 0.05 となりましたので、事後検定としてどのペアに差があるのか、McNemar 検定を用いたペアワイズ比較を行いました。
多重比較の調整が必要です。補正なしの P値は非推奨です。
グループの比較 | p 値 (補正なし; 非推奨) |
p 値 (Bonferroni 補正) |
p 値 (Holm 補正) |
---|---|---|---|
{{ settings.targetColumns[item.position[0]] + ' vs. ' + settings.targetColumns[item.position[1]] }} | {{ item.pValue.cp2 }} | {{ bonferroniMethodP[idx].cp2 }} | {{ holmMethodP[idx].cp2 }} |
Bowker検定 / Stuart-Maxwell検定 (ペアワイズ比較)
{{tableInfo.columns[0]}} vs {{tableInfo.columns[1]}}
{{tableInfo.columns[1]}} | ||
---|---|---|
{{val}} | ||
{{tableInfo.columns[0]}} | {{selectedCommonVals[rowIdx]}} | {{cell}} |
Bowker検定
Stuart-Maxwell検定
比較 | p値 (補正なし) | p値 (Bonferroni補正) | p値 (Holm補正) |
---|---|---|---|
{{result.pair[0]}} vs {{result.pair[1]}} | {{result.bowker.pValue.cp3}} | {{result.bowkerAdjustedP.bonferroni.cp3}} | {{result.bowkerAdjustedP.holm.cp3}} |
注意: 補正なしのp値は参考値として表示されています。Bonferroni補正, Holm補正 は代表的な多重比較補正です。
比較 | p値 (補正なし) | p値 (Bonferroni補正) | p値 (Holm補正) |
---|---|---|---|
{{result.pair[0]}} vs {{result.pair[1]}} | {{result.stuartMaxwell.pValue.cp3}} | {{result.stuartMaxwellAdjustedP.bonferroni.cp3}} | {{result.stuartMaxwellAdjustedP.holm.cp3}} |
注意: 補正なしのp値は参考値として表示されています。Bonferroni補正, Holm補正 は代表的な多重比較補正です。
クラウド R 分析