傾向スコアマッチング後の条件付ロジスティック回帰
解説
条件付ロジスティック回帰と傾向スコアマッチングを組み合わせ、観察データ(ランダム化されていないデータ)から因果関係を推定します。 この手法は、特に医療研究において、治療群と対照群の間で予めバランスを取った後、治療がアウトカムにどのような影響を持つかを分析します。
事前のマッチングにより、治療群と対照群の間の共変量(年齢、性別、病気の種類など)のバランスを取り、これらの共変量が結果に与える影響を制御し、治療効果の推定を改善します。
この手法は、ランダム化比較試験(RCT)が不可能または実行不可能な場合に特に有用です。 例えば、倫理的な理由でランダム化ができない医療研究や、過去の観察データを用いた疫学研究などで使用されます。 この手法により、観察データにおける選択バイアスを最小限に抑え、因果関係をより信頼性高く推定できます。
利点
- 選択バイアスの軽減: 傾向スコアマッチングにより、治療群と対照群間の共変量のバランスを取ることで、選択バイアスを軽減します。
- 因果推論の強化: 条件付ロジスティック回帰は、マッチングされたデータに基づいて行われるため、治療効果の推定が改善され、因果関係の推論が強化されます。
欠点
- データの要件: 傾向スコアマッチングは、十分な量のデータと、治療群と対照群の間で共変量が十分にバランスが取れていることを要求します。これが不足している場合、分析の質が低下します。
- データの減少: マッチングプロセスにより、分析に使用できるデータ量が減少することがあります。これは、特定のケースがマッチングの基準を満たさず捨てられてしまう場合に発生します。通常の多変量解析にはこれがありません。
- 隠れたバイアス: この手法では、測定されていない共変量や観察されていない変数によるバイアスを制御できません。
利用するカラム
Reactive stat では、傾向スコアマッチング で作成した “__matched_paird__” カラムを利用してこの検定を行います。
{{title}}
{{title}}
{{ item.full }}
{{title}}
{{group}}
{{title || 'カラム選択'}}
{{title || 'カラム選択'}}
{{ title }} カテゴリー変数を選択してください。複数選択すると組み合わされます
...(選択肢が多すぎます)
それぞれに設定する値を入力してください。異なる分類に同じ値を設定することもできます。順位の数値を入れれば、順序カテゴリカル変数として扱えるようになります。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
新しい列 (カラム) 名:
ここで設定した値に完全一致するデータを欠損値として扱います。
新しい列 (カラム) 名:
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
計算結果プレビュー:
新しい列 (カラム) 名:
チェックされた行が削除対象となります
データがありません
欠損値を含むカラムを選択
カラムを選択
削除対象の行
削除対象の行はありません
データ入力
{{ errorMessage || dataStatus + 'です'}}
設定とオプション
データがありません
R の出力結果
R出力図形
AI による R 出力結果の解説
変換設定:
(
変換元の単位:
変換先の単位:
)
変換結果プレビュー:
新しい列 (カラム) 名:
計算式の入力:
数式:
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2)
, "体重" / ("身長" * "身長")
利用可能なカラム:
{{ column }}
変換結果プレビュー:
{{ errorMessage }}
新しい列 (カラム) 名:
区切り文字の選択:
欠損値の処理:
プレビュー:
{{ preview }}
新しい列 (カラム) 名:
確認
データがありません
データ
設定
傾向スコアマッチング の情報
傾向スコアマッチングのペア情報を含むカラム {{matchedPairsColumnName}} がありません。
{{ psSettings.responseVariableColumn }} を応答変数とした 傾向スコアマッチング が実行されています。
{{ psSettings.responseVariableColumn }} = "{{ psSettings.valTreated }}" が処理群で、その他の値は対照群(コントロール)です。
層別化条件付ロジスティック回帰では、応答変数を説明変数として扱います。 マッチング情報は "__matched_pairs__" カラムに保存されています。
これは、{{ psExplanatoryColumns.join(', ') }} をマッチさせた結果です。 事前の傾向スコアマッチングの情報がありません。
傾向スコアマッチング に引き続いて実行する場合には、情報が読み込まれます。
{{ psSettings.responseVariableColumn }} = "{{ psSettings.valTreated }}" が処理群で、その他の値は対照群(コントロール)です。
層別化条件付ロジスティック回帰では、応答変数を説明変数として扱います。 マッチング情報は "__matched_pairs__" カラムに保存されています。
これは、{{ psExplanatoryColumns.join(', ') }} をマッチさせた結果です。 事前の傾向スコアマッチングの情報がありません。
傾向スコアマッチング に引き続いて実行する場合には、情報が読み込まれます。
...(候補が多すぎます)
...(候補が多すぎます)
結果
クラウド R 分析