線形混合効果モデル (LMM)

解説

線形混合効果モデル(Linear Mixed Effects Model, LMM)は、統計モデリングの一種で、データ解析において非常に有用なツールです。 LMMは、データの中に階層構造やクラスター構造がある場合や、データが時間依存性を持つ場合など、様々な応用で利用されます。

LMM の特徴

  • 固定効果とランダム効果の組み合わせ
    • 固定効果は、研究全体で一般化可能な系統的な効果を表します(例:治療効果、性別の影響)
    • ランダム効果は、データの階層構造から生じる変動を表します(例:個体差、施設間差)
    • これらを組み合わせることで、複雑なデータ構造を適切にモデル化できます
  • 階層データの取り扱い
    • 被験者内の反復測定
    • グループ内のクラスタリング
    • マルチレベル構造
  • 時間依存性データの解析
    • 経時測定データの分析
    • 不均衡なデータにも対応
    • 変化パターンの個体差を考慮
  • 欠損値への対応
    • 完全なデータセットが不要
    • 不完全データでも解析可能
    • MAR(Missing At Random)を仮定

データ形式

本アプリケーションでは、以下の2つのデータ形式に対応しています:

長い形式 (Long Format)

各行が1つの観測値を表す形式です。 時系列データの自然な表現に適しています。

ID 治療 経過日数
1 A 0 10
1 A 1 15
1 A 2 20
2 B 0 5
2 B 1 7
2 B 2 9

広い形式 (Wide Format)

1行に全測定値が含まれる形式です。 複数の時点での測定値が別々の列として表現されます。

ID 治療 第0日 第1日 第2日
1 A 10 15 20
2 B 5 7 9

モデルの設定

固定効果の指定

  • 実験条件や介入(治療群/対照群)
  • 共変量(年齢、性別など)
  • 時間要因(測定時点、経過期間)
  • 数値型の場合:
    • 連続変数として扱う(例:年齢、体重)
    • カテゴリ変数として扱う(例:グレード、ステージ)

ランダム効果の指定

  • 被験者要因(患者ID、個体ID)
  • クラスター要因(施設ID、医師ID)
  • 必ずカテゴリカル変数を指定
  • 十分なサンプルサイズが必要

ランダム効果の構造

  • ランダム切片のみ
    • グループごとのベースラインの違いを考慮
    • 最もシンプルなモデル
  • 変数との交互作用を含める
    • グループごとの傾きの違いを考慮
    • より複雑なモデル
    • 十分なデータ数が必要

パラメータ推定方法

  • 制限最尤法 (REML)
    • ランダム効果の推定に適している
    • 小サンプルでも信頼性が高い
  • 最尤法 (ML)
    • モデル比較に適している
    • AIC/BICによるモデル選択が可能

欠損値の取り扱い

線形混合モデル(LMM)では、欠損値の取り扱いについて2つの方法を選択することができます。

1. 欠損値を含むデータのまま解析を行う場合

LMMの重要な特徴の一つとして、不完全なデータセットでも適切な解析が可能であることが挙げられます。

データの有効活用

  1. 一部の時点でデータが欠損していても、その被験者の他の時点のデータを活用できます
  2. サンプルサイズの減少を最小限に抑えることができます

前提条件

  1. 欠損メカニズムがMAR(Missing At Random:ランダムな欠損)であることを仮定します
  2. 観測されたデータに基づいて、欠損が生じる確率が決まると考えます

利点

  1. 統計的検出力の維持が期待できます
  2. より多くの情報を活用した推定が可能です

2. 欠損値を含む行を除外して解析を行う場合

データが揃っている被験者のみを対象とした解析を行います。

Wide format の場合には、内部的に Long format に変換した後に、データが揃った行を選択します。 したがって、複数回の測定のうち一部が欠損値となっていても、それ以外のデータは有効になります。

完全ケース分析

  1. 欠損のない完全なデータセットでの解析となります
  2. より保守的な結果が得られる可能性があります

注意点

  1. サンプルサイズが減少します
  2. 統計的検出力が低下する可能性があります
  3. 選択バイアスが生じる可能性があります

注意事項

以下の点について、十分な検討を行うことをお勧めします。

  1. 欠損値の発生パターンを十分に検討してください
  2. 欠損メカニズムの仮定が妥当かどうかを検討してください
  3. 解析結果の解釈には、選択した欠損値の取り扱い方法を考慮してください
  4. 必要に応じて、両方の方法で解析を行い、結果を比較することをお勧めします

注意: いずれの方法を選択した場合でも、LMMは欠損値の自動的な補完は行いません。欠損値の補完が必要な場合は、別途適切な方法で行う必要があります。

数学的表現

一般的な線形混合効果モデルは以下のように表現されます:

\[ Y = X\beta + Z\gamma + \epsilon \]

ここで、\(Y\) は従属変数、\(X\) と \(Z\) はそれぞれ固定効果とランダム効果に対応するデザイン行列、\(\beta\) は固定効果の係数、\(\gamma\) はランダム効果の係数、\(\epsilon\) は誤差項です。

注意事項

特殊なカラム名について

以下のカラム名は内部処理用に予約されているため、使用を避けてください:

  • LMM_TIME
  • LMM_RESPONSES

データ

設定

データ形式:
欠損値:
統計モデル詳細設定
固定効果のデータタイプ:
{{ column }}

...(要素が多すぎます)

交互作用をモデルに入れる:
固定効果のパラメータを推定での制限最尤法 (REML) 適用:
ランダム効果の構造:
{{counter}}