因子分析 (Factor Analysis)
解説
因子分析とは
因子分析 (Factor Analysis) は、多数の観測変数の間の相関関係を、より少数の潜在的な因子(共通因子)によって説明する統計手法です。観測された変数が直接測定できない潜在的な概念(因子)の影響を受けていると仮定し、その因子構造を推定します。
主成分分析がデータの分散を最大限保持する合成変数を作成するのに対し、因子分析は変数間の共通分散(共通因子に起因する分散)のみを対象とし、潜在的な構造を推定します。
因子分析は教師なし手法であり、目的変数と説明変数の区別はありません。分析対象の変数群を「説明変数」として入力します。
主な用途:
- 心理尺度・質問紙の構造分析と尺度開発
- アンケート調査データの構造探索
- テスト項目の分析と項目群の分類
- データの背後にある概念的構造の発見
- 変数のグルーピングと削減
本アプリでサポートする機能
| 機能 | 詳細 | 特徴 |
|---|---|---|
| 因子分析 | factanal() による最尤法 | 統計的検定が可能 |
| 因子数の指定 | 1 〜 (変数数 - 3) | ユーザーが指定 |
| 因子の回転 | なし、Varimax(直交)、Promax(斜交) | 3種類の回転法に対応 |
| 因子スコア | なし、回帰法、Bartlett法 | 2種類のスコア推定法 |
| 適合度検定 | カイ二乗検定 | 因子数の妥当性を統計的に評価 |
| 独自性 | 各変数の独自分散の割合 | 因子で説明されない分散 |
因子の回転
因子分析では、因子の解釈を容易にするために回転を行います:
| 回転法 | 特徴 | 適用場面 |
|---|---|---|
| なし | 回転なし | 回転前の解を確認する場合 |
| Varimax 回転(直交回転) | 因子間の相関を0に固定 | 因子が独立と仮定できる場合 |
| Promax 回転(斜交回転) | 因子間の相関を許容 | 因子間に相関がある場合(一般的に推奨) |
回転法の選択指針
- 心理学・社会科学では因子間に相関があることが多いため、Promax回転(斜交回転)が推奨されます
- 因子の独立性が理論的に仮定できる場合は、Varimax回転が適切です
因子スコアの推定法
| 推定法 | 特徴 |
|---|---|
| 回帰法 | 因子スコアと観測変数の相関を最大化。最も一般的 |
| Bartlett法 | 因子スコアの独自性を最小化。因子の独立性を保持 |
データ要件と推奨事項
変数の要件
- 目的変数: 不要(教師なし手法)
- 説明変数(分析対象変数): 連続変数 3つ以上(カテゴリカル変数は使用不可)
サンプルサイズの目安
| 分析の種類 | 最低限 | 推奨 | 理想 |
|---|---|---|---|
| 探索的分析 | 変数数×5件以上 | 変数数×10件以上 | 300件以上 |
| 安定した推定 | 100件以上 | 200件以上 | 500件以上 |
因子数の指定
因子数はユーザーが指定する必要があります。以下の基準を参考にしてください:
- カイザー基準: 固有値 > 1 の因子数を採用
- スクリープロット: 固有値の減少が緩やかになる位置
- 理論的根拠: 事前の理論や先行研究に基づく因子数
- 適合度検定: カイ二乗検定が有意でない(p > 0.05)最小の因子数
結果の解釈
因子負荷量の解釈
| 負荷量の絶対値 | 解釈 |
|---|---|
| ≥ 0.7 | 強い関連(当該因子に明確に属する) |
| 0.4 - 0.69 | 中程度の関連(許容可能) |
| < 0.4 | 弱い関連(因子への所属が不明確) |
独自性 (Uniqueness) の解釈
- 独自性: 各変数の分散のうち、共通因子では説明されない割合
- 共通性 = 1 - 独自性: 共通因子により説明される割合
- 独自性が高い変数(> 0.6)は、どの因子とも関連が弱く、分析から除外を検討
累積寄与率
| 累積寄与率 | 解釈 |
|---|---|
| ≥ 60% | 良好な因子構造 |
| 50 - 59% | 許容可能 |
| < 50% | 因子数の再検討が必要 |
適合度検定 (カイ二乗検定)
- p > 0.05: 指定した因子数でデータを十分に説明できる(適合が良好)
- p ≤ 0.05: 因子数が不十分。因子数を増やすことを検討
- サンプルサイズが大きい場合、わずかな不適合でも有意になりやすいため注意
注意事項
- 最尤法の前提: 本アプリでは最尤法 (ML) を使用しており、多変量正規性を仮定します。リッカート尺度などの順序データには、確認的因子分析 (CFA) のWLSMV推定法がより適切な場合があります
- 探索的 vs 確認的: 本ページの因子分析は探索的因子分析 (EFA) です。事前に因子構造の仮説がある場合は、確認的因子分析 (CFA) を使用してください
- 因子数の決定: 因子数の選択は結果に大きく影響します。複数の基準を総合的に判断してください
- 交差負荷: 1つの変数が複数の因子に高い負荷を示す場合、解釈が難しくなります。回転法の変更や変数の除外を検討してください
- サンプルサイズ: サンプルサイズが小さい場合、因子構造が不安定になります
他の多変量解析手法
複数の説明変数によるデータ分析 (多変量解析) ページでは、本手法を含む10種類の多変量解析手法の概要と比較をご覧いただけます。
下のアプリでは、入力されたデータの目的変数・説明変数のタイプを自動判定し、適用可能な統計手法をすべて提示します。 そのため、本ページの手法以外の結果も表示されることがあります。これは同じデータ設定で複数の分析を比較検討できる仕組みです。
アプリ
| 分類内容 | 値 | |
| {{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
削除対象の行
データ入力
AI による R コードの解説
R の出力結果
R出力図形
AI による R 出力結果の解説
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2), "体重" / ("身長" * "身長")
{{ column }}
{{title}}
入力されたデータの目的変数・説明変数のタイプを自動判定し、適用可能な統計手法をすべて提示します。 これは同じデータ設定で複数の分析を比較検討できる仕組みです。
{{calledFromSubPage? '本アプリで統合的に実行可能な': ''}}分析法の特徴一覧
| 手法 | 英語名 | 目的変数のタイプ | 説明変数のタイプ | 特徴 | Wikipedia |
|---|---|---|---|---|---|
| {{ method.japaneseName }} | {{ method.englishName }} | {{ method.dependentVariableType }} | {{ method.independentVariableType }} | {{ method.characteristic }} |
データ
設定
統計手法
| 変数名 | 数値 | 連続変数 | カテゴリカル /離散変数 |
|||
|---|---|---|---|---|---|---|
| {{ variable }} | {{ type.numerical ? '〇' : '-' }} | {{ type.originallyContinuous ? '〇' : '-' }} | {{ type.originallyCategorical ? '〇' : '-' }} |
データの分類は以下のルールに従っています
変数タイプは手動で調整できます
- : 有効 / : 無効
- クリックすると切り替わり、各統計手法に渡されるデータ形式を明示できます。
| 手法 | 目的変数のタイプ | 説明変数のタイプ | 適用 |
|---|---|---|---|
| {{ method.japaneseName }} | {{ method.dependentVariableType }} | {{ method.independentVariableType }} | {{ method.reason }} |
結果
{{method.japaneseName}} ({{method.englishName}})
- {{ warning }}