線形混合効果モデル (LMM)
解説
線形混合効果モデル(Linear Mixed Effects Model, LMM)は、統計モデリングの一種で、データ解析において非常に有用なツールです。 LMMは、データの中に階層構造やクラスター構造がある場合や、データが時間依存性を持つ場合など、様々な応用で利用されます。
LMM の特徴
- 固定効果とランダム効果の組み合わせ
- 固定効果は、研究全体で一般化可能な系統的な効果を表します(例:治療効果、性別の影響)
- ランダム効果は、データの階層構造から生じる変動を表します(例:個体差、施設間差)
- これらを組み合わせることで、複雑なデータ構造を適切にモデル化できます
- 階層データの取り扱い
- 被験者内の反復測定
- グループ内のクラスタリング
- マルチレベル構造
- 時間依存性データの解析
- 経時測定データの分析
- 不均衡なデータにも対応
- 変化パターンの個体差を考慮
- 欠損値への対応
- 完全なデータセットが不要
- 不完全データでも解析可能
- MAR(Missing At Random)を仮定
データ形式
本アプリケーションでは、以下の2つのデータ形式に対応しています:
長い形式 (Long Format)
各行が1つの観測値を表す形式です。 時系列データの自然な表現に適しています。
ID | 治療 | 経過日数 | 値 |
---|---|---|---|
1 | A | 0 | 10 |
1 | A | 1 | 15 |
1 | A | 2 | 20 |
2 | B | 0 | 5 |
2 | B | 1 | 7 |
2 | B | 2 | 9 |
広い形式 (Wide Format)
1行に全測定値が含まれる形式です。 複数の時点での測定値が別々の列として表現されます。
ID | 治療 | 第0日 | 第1日 | 第2日 |
---|---|---|---|---|
1 | A | 10 | 15 | 20 |
2 | B | 5 | 7 | 9 |
モデルの設定
固定効果の指定
- 実験条件や介入(治療群/対照群)
- 共変量(年齢、性別など)
- 時間要因(測定時点、経過期間)
- 数値型の場合:
- 連続変数として扱う(例:年齢、体重)
- カテゴリ変数として扱う(例:グレード、ステージ)
ランダム効果の指定
- 被験者要因(患者ID、個体ID)
- クラスター要因(施設ID、医師ID)
- 必ずカテゴリカル変数を指定
- 十分なサンプルサイズが必要
ランダム効果の構造
- ランダム切片のみ
- グループごとのベースラインの違いを考慮
- 最もシンプルなモデル
- 変数との交互作用を含める
- グループごとの傾きの違いを考慮
- より複雑なモデル
- 十分なデータ数が必要
パラメータ推定方法
- 制限最尤法 (REML)
- ランダム効果の推定に適している
- 小サンプルでも信頼性が高い
- 最尤法 (ML)
- モデル比較に適している
- AIC/BICによるモデル選択が可能
欠損値の取り扱い
線形混合モデル(LMM)では、欠損値の取り扱いについて2つの方法を選択することができます。
1. 欠損値を含むデータのまま解析を行う場合
LMMの重要な特徴の一つとして、不完全なデータセットでも適切な解析が可能であることが挙げられます。
データの有効活用
- 一部の時点でデータが欠損していても、その被験者の他の時点のデータを活用できます
- サンプルサイズの減少を最小限に抑えることができます
前提条件
- 欠損メカニズムがMAR(Missing At Random:ランダムな欠損)であることを仮定します
- 観測されたデータに基づいて、欠損が生じる確率が決まると考えます
利点
- 統計的検出力の維持が期待できます
- より多くの情報を活用した推定が可能です
2. 欠損値を含む行を除外して解析を行う場合
データが揃っている被験者のみを対象とした解析を行います。
Wide format の場合には、内部的に Long format に変換した後に、データが揃った行を選択します。 したがって、複数回の測定のうち一部が欠損値となっていても、それ以外のデータは有効になります。
完全ケース分析
- 欠損のない完全なデータセットでの解析となります
- より保守的な結果が得られる可能性があります
注意点
- サンプルサイズが減少します
- 統計的検出力が低下する可能性があります
- 選択バイアスが生じる可能性があります
注意事項
以下の点について、十分な検討を行うことをお勧めします。
- 欠損値の発生パターンを十分に検討してください
- 欠損メカニズムの仮定が妥当かどうかを検討してください
- 解析結果の解釈には、選択した欠損値の取り扱い方法を考慮してください
- 必要に応じて、両方の方法で解析を行い、結果を比較することをお勧めします
注意: いずれの方法を選択した場合でも、LMMは欠損値の自動的な補完は行いません。欠損値の補完が必要な場合は、別途適切な方法で行う必要があります。
数学的表現
一般的な線形混合効果モデルは以下のように表現されます:
\[ Y = X\beta + Z\gamma + \epsilon \]
ここで、\(Y\) は従属変数、\(X\) と \(Z\) はそれぞれ固定効果とランダム効果に対応するデザイン行列、\(\beta\) は固定効果の係数、\(\gamma\) はランダム効果の係数、\(\epsilon\) は誤差項です。
注意事項
特殊なカラム名について
以下のカラム名は内部処理用に予約されているため、使用を避けてください:
- LMM_TIME
- LMM_RESPONSES
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
欠損値を含むカラムを選択
カラムを選択
削除対象の行
データ入力
R の出力結果
R出力図形
AI による R 出力結果の解説
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2)
, "体重" / ("身長" * "身長")
{{ column }}
データ
設定
{{ column }}
...(要素が多すぎます)
結果
クラウド R 分析