ROC曲線
解説
ROC曲線 (Receiver Operating Characteristic curve) は、医療テストやその他のシステムにおける性能評価を視覚的に表現するものです。 診断目的の検査における、検査の感度と特異度を可視化することで、そのパフォーマンスを評価することができます。
感度・特異度・偽陽性・偽陰性
- 真陽性 (True Positive: TP): 病気と診断され、実際に病気であるケース
- 偽陽性 (False Positive: FP): 病気と診断され、実際には病気でないケース
- 真陰性 (True Negative: TN): 病気でないと診断され、実際に病気でないケース
- 偽陰性 (False Negative: FN): 病気でないと診断され、実際には病気であるケース
以下の指標がROC曲線作成に用いられます。
- 感度 (Sensitivity): 実際に病気の人を、テストがどれだけ正しく病気と診断できるか
\[感度 (Sensitivity) = \frac{TP}{TP + FN}\]
- 特異度 (Specificity): 実際に病気でない人を、テストがどれだけ正しく病気でないと診断できるか
\[特異度 (Specificity) = \frac{TN}{TN + FP}\]
ROC曲線の特徴と読み方
- ROC曲線は、横軸に特異度、縦軸に感度を配置します。
- カーブが左上隅に近いほどテストの精度が高いとされます。
- カーブ下の面積を AUC (Area Under the Curve) と呼び、0.5から1の範囲をとります。AUCが1に近いほどテストの精度が高いとされます。
閾値について
検査において、閾値 (それ以上であれば陽性とする値) を調整することで、感度と特異度は変化し、それぞれのポイントがROC曲線上の一点を形成します。
例えば、血液検査で特定のマーカーの量が6以上で「陽性」とするか、8以上で「陽性」とするかで、感度と特異度は変わります。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
欠損値を含むカラムを選択
カラムを選択
削除対象の行
データ入力
{{ replaceNewlinesInStrings(replacedScript) }}
R の出力結果
{{ rResult }}
R output figures
AI による R 出力結果の解説
データ
設定
...(候補が多すぎます)
結果
ROC曲線
ROC曲線は、医学研究などにおいて診断目的の検査などのパフォーマンスを評価するために広く使用されます。 この曲線は、感度(真陽性率)と1-特異度(偽陽性率)をプロットします。
感度は、次のように定義されます:
\[ \text{感度} = \frac{\text{真陽性}}{\text{真陽性} + \text{偽陰性}} \]1-特異度(偽陽性率)は、次のように定義されます:
\[ 1 - \text{特異度} = \frac{\text{偽陽性}}{\text{偽陽性} + \text{真陰性}} \]検査の異なるカットオフ値に対して感度と1-特異度を計算し、これらの点をプロットしてROC曲線を描きます。
ROC曲線の下の面積はAUC(Area Under Curve)と呼ばれ、検査の全体的なパフォーマンスを定量化するために使用されます。 AUCの値は0から1の範囲で、高い値は優れた診断能力を示します。
AUCが 1 の場合、検査はすべての陽性と陰性のケースを正確に識別できることを意味します (感度 100%、特異度 100%)。 AUCが 0.5 の場合、検査のパフォーマンスはランダムな推測と等価です。 AUC が 0.5 未満の場合には、陽性の判定基準を反転させる必要があります。
カットオフ値を変更することで、感度と特異度のバランスを調整し、異なる臨床的状況に最適な操作点を見つけることができます。
閾値シミュレーション
{{groupName}}
クラウド R 分析
各検査法に対する AUC (曲線下面積; Area Under the Curve), 閾値の評価