重回帰分析 (Multiple Regression)

重回帰分析は、複数の説明変数（連続変数またはカテゴリカル変数）を用いて連続変数の目的変数を予測する統計手法です。変数選択法（ステップワイズ法、前向き選択法、後向き選択法）にも対応しています。

解説

重回帰分析とは

重回帰分析 (Multiple Regression) は、複数の説明変数を用いて1つの連続変数（目的変数）を予測する線形モデルです。各説明変数が目的変数にどの程度影響するかを回帰係数として推定し、予測式を構築します。

単回帰分析が1つの説明変数のみを扱うのに対し、重回帰分析は2つ以上の説明変数を同時に扱い、他の変数の影響を制御した上での各変数の独立した効果を評価できます。

主な用途:

予測モデルの構築: 連続的なアウトカムの予測
影響要因の同定: 目的変数に影響する要因の特定と定量化
交絡因子の調整: 他の変数を制御した上での特定の変数の効果推定
予測式の導出: 回帰式による定量的予測

本アプリでサポートする機能

機能	詳細	特徴
モデル推定	lm() による最小二乗法	フルモデルの推定
変数選択	step() による自動変数選択	3種類の選択法に対応
効果量	R²（決定係数）と Cohen's f²	モデル全体の説明力
診断プロット	4種類の回帰診断プロット	モデルの前提条件を視覚的に確認
外れ値検出	Cook's Distance	影響力の大きい観測値の特定

変数選択法

手法	概要	適用場面
ステップワイズ法	変数の追加と除去を繰り返し最適モデルを探索	一般的な変数選択（デフォルト）
前向き選択法	最も有意な変数を順に追加	変数が多い場合
後向き選択法	全変数から有意でない変数を順に除去	フルモデルから不要な変数を削除

変数選択は AIC (赤池情報量規準) に基づいて行われます。AICが最も低くなるモデルが最適モデルとして選択されます。

データ要件と推奨事項

変数の要件

目的変数: 連続変数 1つ
説明変数: 連続変数またはカテゴリカル変数（混在可）、2つ以上必須

サンプルサイズの目安

分析の種類	最低限	推奨
基本モデル	説明変数1個あたり10件以上	説明変数1個あたり20件以上
変数選択を行う場合	説明変数1個あたり15件以上	説明変数1個あたり30件以上

前提条件

線形性: 説明変数と目的変数の関係が線形であること
正規性: 残差が正規分布に従うこと
等分散性: 残差の分散が一定であること（均一分散）
独立性: 残差が独立であること（系列相関なし）
多重共線性の回避: 説明変数間に強い相関がないこと

4種類の診断プロット

プロット	確認内容	理想的なパターン
残差 vs 予測値	線形性と等分散性	ランダムに散布（パターンなし）
正規Q-Qプロット	残差の正規性	点が直線に沿って並ぶ
尺度-位置プロット	等分散性の詳細確認	水平な傾向線
Cook's Distance	影響力の大きい観測値	4/n 以下が理想

結果の解釈

回帰係数の解釈

回帰係数 (β): 他の変数を一定にしたとき、その説明変数が1単位増加すると目的変数がβだけ変化
標準化係数: 変数間の相対的な重要度の比較に使用
p値: 各回帰係数が0でないことの統計的有意性

決定係数 R²

R²	説明力
≥ 0.75	優秀
0.50 - 0.74	良好
0.25 - 0.49	中程度
< 0.25	低い

Cohen's f² (効果量)

f²	効果の大きさ
≥ 0.35	大
0.15 - 0.34	中
0.02 - 0.14	小

Cook's Distance による外れ値の判定

一般的に Cook's D > 4/n（n = サンプルサイズ）を外れ値の閾値とします
外れ値が検出された場合、その観測値を除外した上での再分析を検討してください

注意事項

多重共線性: VIF (分散拡大要因) > 10 の変数がある場合、推定が不安定になります。相関の高い変数の一方を除外するか、主成分分析を検討してください
変数選択の限界: ステップワイズ法はデータに過剰適合する傾向があります。結果の解釈には注意が必要です
外挿の危険性: 学習データの範囲外での予測は信頼性が低くなります
因果推論: 重回帰分析は変数間の関連性を示すものであり、因果関係の証明には研究デザインの検討が必要です
カテゴリカル変数のダミー変数化: カテゴリカル変数はRの内部でダミー変数に自動変換されます。基準カテゴリの設定が結果の解釈に影響します

他の多変量解析手法

複数の説明変数によるデータ分析 (多変量解析) ページでは、本手法を含む10種類の多変量解析手法の概要と比較をご覧いただけます。

下のアプリでは、入力されたデータの目的変数・説明変数のタイプを自動判定し、適用可能な統計手法をすべて提示します。そのため、本ページの手法以外の結果も表示されることがあります。これは同じデータ設定で複数の分析を比較検討できる仕組みです。

アプリ

入力されたデータの目的変数・説明変数のタイプを自動判定し、適用可能な統計手法をすべて提示します。これは同じデータ設定で複数の分析を比較検討できる仕組みです。

{{calledFromSubPage? '本アプリで統合的に実行可能な': ''}}分析法の特徴一覧

手法	英語名	目的変数のタイプ	説明変数のタイプ	特徴	Wikipedia
{{ method.japaneseName }}	{{ method.englishName }}	{{ method.dependentVariableType }}	{{ method.independentVariableType }}	{{ method.characteristic }}

データ

設定

基準値の選択

{{ column }}

分類内容	値
{{ item.tag }}

データ可視化・探索的分析

名義変数の解析

連続変数の解析

統計的モデリング

クラスタ分析

生存期間の解析

メタアナリシス

検査の正確度

傾向スコアによる解析

比率(割合)のサンプルサイズ

平均値のサンプルサイズ

生存時間のサンプルサイズ

重回帰分析 (Multiple Regression)

解説

重回帰分析とは

本アプリでサポートする機能

変数選択法

データ要件と推奨事項

変数の要件

サンプルサイズの目安

前提条件

4種類の診断プロット

結果の解釈

回帰係数の解釈

決定係数 R²

Cohen's f² (効果量)

Cook's Distance による外れ値の判定

注意事項

他の多変量解析手法

アプリ

{{title}}

データの取り扱い

クラウド R を利用する時のデータ送信

AI による解説を利用する時のデータ送信

チェックされた行が削除対象となります

削除対象の行

データ入力

AI による R コードの解説

R の出力結果

R出力図形

AI による R 出力結果の解説

シートを選択してください

{{calledFromSubPage? '本アプリで統合的に実行可能な': ''}}分析法の特徴一覧

データ

設定

統計手法

結果

{{method.japaneseName}} ({{method.englishName}})

目的変数の順序:

クラウド R 分析