対応分析 / 多重対応分析
(CA / MCA)
解説
対応分析とは
対応分析 (Correspondence Analysis; CA) は、クロス集計表の行変数と列変数の関係を2次元空間に可視化する探索的多変量解析手法です。行と列のカテゴリを同一空間上に配置し、近い位置にあるカテゴリほど共起頻度が高いことを示します。
多重対応分析 (Multiple Correspondence Analysis; MCA) は、3変数以上のカテゴリ変数に対応分析を一般化したもので、複数のカテゴリ変数間の関係構造を可視化します。心理学・マーケティング・医学研究などで広く使用されます。
本アプリでサポートする機能
対応分析 (CA)
- 2つのカテゴリ変数のクロス集計表から対応分析(各変数3カテゴリ以上)
- 各次元の慣性(説明割合)の表示
- 各カテゴリの表現品質 (cos2) の表示
- ゼロセル・小頻度カテゴリの自動警告
- バイプロット(行・列カテゴリの同時描画)
多重対応分析 (MCA)
- 3変数以上のカテゴリ変数から多重対応分析
- 分析する次元数の指定
- 補足変数(分析には使わず図に重ねる変数)の設定
- 変数別の寄与率・補足変数の座標表示
- バイプロット(補足変数を矢印で重ねて描画)
データの準備
- CA: 行変数・列変数ともに3カテゴリ以上のカテゴリ変数(2値変数の場合は分割表分析を使用)
- MCA: 3変数以上のカテゴリ変数。連続変数はあらかじめカテゴリ化してください
- サンプルサイズの目安: 各セルに期待度数5以上を推奨(ゼロセルが多い場合は警告が表示されます)
結果の解釈
バイプロット
- プロット上で近い位置にある行・列カテゴリは共起頻度が高い
- 原点から遠いカテゴリほど特徴的な分布を持つ
慣性(説明割合)
- 第1・第2次元の説明割合の合計が高いほど、2次元プロットによる情報損失が少ない
- 合計が50〜60%以上あれば、バイプロットの解釈に十分な情報が含まれている
cos2(表現品質)
- 各カテゴリがバイプロット上にどれだけ正確に表現されているかを示す指標(0〜1)
- cos2 < 0.5 のカテゴリはバイプロット上の位置が不安定であり、解釈に注意が必要
注意事項
- 対応分析は探索的手法であり、仮説検定の代替ではありません
- カテゴリ数が多い場合や サンプルサイズが小さい場合は結果が不安定になりやすい
- 2値×2値の場合はカイ二乗検定・オッズ比が適切です
アプリ
Reactive stat ロゴ について
ログインしていただければロゴは表示されなくなります
{{title}}
{{title}}
{{ item.full }}
{{title}}
{{group}}
{{title || 'カラム選択'}}
{{title || 'カラム選択'}}
{{ title }} カテゴリー変数を選択してください。複数選択すると組み合わされます
...(選択肢が多すぎます)
それぞれに設定する値を入力してください。異なる分類に同じ値を設定することもできます。順位の数値を入れれば、順序カテゴリカル変数として扱えるようになります。
| 分類内容 | 値 | |
| {{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
新しい列 (カラム) 名:
ここで設定した値に完全一致するデータを欠損値として扱います。
新しい列 (カラム) 名:
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
計算結果プレビュー:
新しい列 (カラム) 名:
チェックされた行が削除対象となります
削除対象の行
データ入力
{{ errorMessage || dataStatus + 'です'}}
設定とオプション
AI による R コードの解説
R の出力結果
R出力図形
AI による R 出力結果の解説
変換設定:
(
変換元の単位:
変換先の単位:
)
変換結果プレビュー:
新しい列 (カラム) 名:
計算式の入力:
数式:
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2), "体重" / ("身長" * "身長")
利用可能なカラム:
{{ column }}
変換結果プレビュー:
{{ errorMessage }}
新しい列 (カラム) 名:
区切り文字の選択:
欠損値の処理:
プレビュー:
{{ preview }}
新しい列 (カラム) 名:
確認
変換結果プレビュー:
新しい列 (カラム) 名:
{{title}}
データがありません
{{title}}
...(選択肢が多すぎます)
{{filteringText}}
{{ title || '対象データ' }}
({{ matchedRowCount }}件 / 元データ{{ originalRowCount }}件)
除外レコードあり
ダウンロード(CSV)
{{group}}
データ
設定
手法の選択
分析する次元数