傾向スコアマッチング後の条件付ロジスティック回帰

条件付ロジスティック回帰と傾向スコアマッチングを組み合わせ、観察データ(ランダム化されていないデータ)から因果関係を推定します。 この手法は、特に医療研究において、治療群と対照群の間で予めバランスを取った後、治療がアウトカムにどのような影響を持つかを分析します。

事前のマッチングにより、治療群と対照群の間の共変量(年齢、性別、病気の種類など)のバランスを取り、これらの共変量が結果に与える影響を制御し、治療効果の推定を改善します。

この手法は、ランダム化比較試験(RCT)が不可能または実行不可能な場合に特に有用です。 例えば、倫理的な理由でランダム化ができない医療研究や、過去の観察データを用いた疫学研究などで使用されます。 この手法により、観察データにおける選択バイアスを最小限に抑え、因果関係をより信頼性高く推定できます。

利点

  • 選択バイアスの軽減: 傾向スコアマッチングにより、治療群と対照群間の共変量のバランスを取ることで、選択バイアスを軽減します。
  • 因果推論の強化: 条件付ロジスティック回帰は、マッチングされたデータに基づいて行われるため、治療効果の推定が改善され、因果関係の推論が強化されます。

欠点

  • データの要件: 傾向スコアマッチングは、十分な量のデータと、治療群と対照群の間で共変量が十分にバランスが取れていることを要求します。これが不足している場合、分析の質が低下します。
  • データの減少: マッチングプロセスにより、分析に使用できるデータ量が減少することがあります。これは、特定のケースがマッチングの基準を満たさず捨てられてしまう場合に発生します。通常の多変量解析にはこれがありません。
  • 隠れたバイアス: この手法では、測定されていない共変量や観察されていない変数によるバイアスを制御できません。

Reactive stat では、傾向スコアマッチング で作成した “__matched_paird__” カラムを利用してこの検定を行います。

傾向スコアマッチング の情報
応答変数 を選択 (カテゴリカル変数)

...(候補が多すぎます)

目的変数 を選択 (二値変数)

...(候補が多すぎます)