傾向スコアマッチング後の比例ハザードモデルを用いた生存分析

層別化比例ハザード回帰傾向スコアマッチングを組み合わせることで、観察データ(ランダム化されていないデータ)における生存時間の分析を行います。 このアプローチは、特に医療研究での生存率や生存時間に対する治療効果を評価する際に役立ちます。

事前に行われた傾向スコアマッチングにより、治療群と対照群の間で共変量(年齢、性別、病気の種類など)のバランスを取り、これらの共変量が生存時間に与える影響を制御します。 層別化比例ハザードモデルを用いることで、時間依存のリスクやハザード率を考慮したうえで、治療効果の推定を行うことができます。

この手法は、ランダム化比較試験(RCT)が実施できない、または難しい場合に特に有用です。 たとえば、倫理的な制約によりランダム化が不可能な場合や、既存の観察データを用いた研究で使用されます。 このアプローチにより、観察データにおける選択バイアスを最小化し、因果関係をより信頼性高く推定することが可能になります。

利点

  • 時間依存性の考慮: 層別化比例ハザードモデルは、時間と共に変化するリスクやハザード率を考慮するため、生存時間データに特に適しています。
  • 選択バイアスの軽減: 傾向スコアマッチングによって治療群と対照群間の共変量をバランスさせることで、選択バイアスを減らすことができます。

欠点

  • データの要件: 十分な量のデータと適切な共変量のバランスが必要です。不十分な場合、分析の質が低下します。
  • データの減少: マッチングプロセスにより、使用可能なデータが減少する可能性があります。
  • 隠れたバイアス: 測定されていない共変量や観察されていない変数によるバイアスは、この手法では制御できません。

Reactive stat では、傾向スコアマッチング で作成した “__matched_paird__” カラムを利用してこの検定を行います。

傾向スコアマッチング の情報

...(候補が多すぎます)

...(候補が多すぎます)

統計モデル詳細設定
比例ハザード性分析
変数選択