対応分析 / 多重対応分析

(CA / MCA)

解説

対応分析とは

対応分析 (Correspondence Analysis; CA) は、クロス集計表の行変数と列変数の関係を2次元空間に可視化する探索的多変量解析手法です。行と列のカテゴリを同一空間上に配置し、近い位置にあるカテゴリほど共起頻度が高いことを示します。

多重対応分析 (Multiple Correspondence Analysis; MCA) は、3変数以上のカテゴリ変数に対応分析を一般化したもので、複数のカテゴリ変数間の関係構造を可視化します。心理学・マーケティング・医学研究などで広く使用されます。

本アプリでサポートする機能

対応分析 (CA)

  • 2つのカテゴリ変数のクロス集計表から対応分析(各変数3カテゴリ以上)
  • 各次元の慣性(説明割合)の表示
  • 各カテゴリの表現品質 (cos2) の表示
  • ゼロセル・小頻度カテゴリの自動警告
  • バイプロット(行・列カテゴリの同時描画)

多重対応分析 (MCA)

  • 3変数以上のカテゴリ変数から多重対応分析
  • 分析する次元数の指定
  • 補足変数(分析には使わず図に重ねる変数)の設定
  • 変数別の寄与率・補足変数の座標表示
  • バイプロット(補足変数を矢印で重ねて描画)

データの準備

  • CA: 行変数・列変数ともに3カテゴリ以上のカテゴリ変数(2値変数の場合は分割表分析を使用)
  • MCA: 3変数以上のカテゴリ変数。連続変数はあらかじめカテゴリ化してください
  • サンプルサイズの目安: 各セルに期待度数5以上を推奨(ゼロセルが多い場合は警告が表示されます)

結果の解釈

バイプロット

  • プロット上で近い位置にある行・列カテゴリは共起頻度が高い
  • 原点から遠いカテゴリほど特徴的な分布を持つ

慣性(説明割合)

  • 第1・第2次元の説明割合の合計が高いほど、2次元プロットによる情報損失が少ない
  • 合計が50〜60%以上あれば、バイプロットの解釈に十分な情報が含まれている

cos2(表現品質)

  • 各カテゴリがバイプロット上にどれだけ正確に表現されているかを示す指標(0〜1)
  • cos2 < 0.5 のカテゴリはバイプロット上の位置が不安定であり、解釈に注意が必要

注意事項

  • 対応分析は探索的手法であり、仮説検定の代替ではありません
  • カテゴリ数が多い場合や サンプルサイズが小さい場合は結果が不安定になりやすい
  • 2値×2値の場合はカイ二乗検定・オッズ比が適切です

アプリ

データ

設定

手法の選択