傾向スコアマッチング後の比例ハザードモデルを用いた生存分析
層別化比例ハザード回帰と傾向スコアマッチングを組み合わせることで、観察データ(ランダム化されていないデータ)における生存時間の分析を行います。 このアプローチは、特に医療研究での生存率や生存時間に対する治療効果を評価する際に役立ちます。
事前に行われた傾向スコアマッチングにより、治療群と対照群の間で共変量(年齢、性別、病気の種類など)のバランスを取り、これらの共変量が生存時間に与える影響を制御します。 層別化比例ハザードモデルを用いることで、時間依存のリスクやハザード率を考慮したうえで、治療効果の推定を行うことができます。
この手法は、ランダム化比較試験(RCT)が実施できない、または難しい場合に特に有用です。 たとえば、倫理的な制約によりランダム化が不可能な場合や、既存の観察データを用いた研究で使用されます。 このアプローチにより、観察データにおける選択バイアスを最小化し、因果関係をより信頼性高く推定することが可能になります。
利点
- 時間依存性の考慮: 層別化比例ハザードモデルは、時間と共に変化するリスクやハザード率を考慮するため、生存時間データに特に適しています。
- 選択バイアスの軽減: 傾向スコアマッチングによって治療群と対照群間の共変量をバランスさせることで、選択バイアスを減らすことができます。
欠点
- データの要件: 十分な量のデータと適切な共変量のバランスが必要です。不十分な場合、分析の質が低下します。
- データの減少: マッチングプロセスにより、使用可能なデータが減少する可能性があります。
- 隠れたバイアス: 測定されていない共変量や観察されていない変数によるバイアスは、この手法では制御できません。
Reactive stat では、傾向スコアマッチング で作成した “__matched_paird__” カラムを利用してこの検定を行います。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
欠損値を含むカラムを選択
カラムを選択
削除対象の行
データ入力
{{ replaceNewlinesInStrings(replacedScript) }}
R の出力結果
{{ rResult }}
R出力図形
AI による R 出力結果の解説
データ
設定
{{ psSettings.responseVariableColumn }} = "{{ psSettings.valTreated }}" が case で、その他の値は control です。
層別化比例ハザードモデルでは、応答変数を群分類の変数として扱います。 マッチング情報は "__matched_pairs__" カラムに保存されています。
これは、{{ psExplanatoryColumns.join(', ') }} をマッチさせた結果です。 事前の傾向スコアマッチングの情報がありません。
傾向スコアマッチング に引き続いて実行する場合には、情報が読み込まれます。
...(候補が多すぎます)
...(候補が多すぎます)
結果
クラウド R 分析