ROC曲線

ROC曲線 (Receiver Operating Characteristic curve) は、医療テストやその他のシステムにおける性能評価を視覚的に表現するものです。 診断目的の検査における、検査の感度と特異度を可視化することで、そのパフォーマンスを評価することができます。

  • 真陽性 (True Positive: TP): 病気と診断され、実際に病気であるケース
  • 偽陽性 (False Positive: FP): 病気と診断され、実際には病気でないケース
  • 真陰性 (True Negative: TN): 病気でないと診断され、実際に病気でないケース
  • 偽陰性 (False Negative: FN): 病気でないと診断され、実際には病気であるケース

以下の指標がROC曲線作成に用いられます。

  • 感度 (Sensitivity): 実際に病気の人を、テストがどれだけ正しく病気と診断できるか

\[感度 (Sensitivity) = \frac{TP}{TP + FN}\]

  • 特異度 (Specificity): 実際に病気でない人を、テストがどれだけ正しく病気でないと診断できるか

\[特異度 (Specificity) = \frac{TN}{TN + FP}\]

  • ROC曲線は、横軸に特異度、縦軸に感度を配置します。
  • カーブが左上隅に近いほどテストの精度が高いとされます。
  • カーブ下の面積を AUC (Area Under the Curve) と呼び、0.5から1の範囲をとります。AUCが1に近いほどテストの精度が高いとされます。

検査において、閾値 (それ以上であれば陽性とする値) を調整することで、感度と特異度は変化し、それぞれのポイントがROC曲線上の一点を形成します。

例えば、血液検査で特定のマーカーの量が6以上で「陽性」とするか、8以上で「陽性」とするかで、感度と特異度は変わります。

真の結果のカラムを選択 (カテゴリカル変数)

...(候補が多すぎます)