複数の説明変数によるデータ分析 (多変量解析)
解説
複数の説明変数を用いて、一つまたは複数の従属変数を分析します。 分析手法として、
- 多元配置分散分析 (Analysis of Variance, ANOVA)
- ロジスティック回帰モデル (Logistic Regression Model)
- 分散共分散分析 (Analysis of Covariance, ANCOVA)
- 重回帰分析 (Multiple Regression)
- 多変量分散分析 (Multivariate Analysis of Variance, MANOVA)
- 主成分分析 (Principal Component Analysis, PCA)
- 因子分析 (Factor Analysis)
を準備しています。
適用可能な手法の判定
多変量解析は、複数の説明変数を用いて、一つまたは複数の目的変数を分析する統計手法です。
構築したい予測モデルに応じて、まず統計手法を選択し、適切な形式のデータを用意する必要があります。 データ形式が間違っていると、分析結果の解釈が難しくなるだけでなく、誤った結論に至る可能性があります。
Reactive stat では、発想を変えて、 「どのデータから」「何が知りたいか」 を設定することで、適用可能な手法を判定し、各々について解析を行えるようにしました。
R による分析
Reactive stat の内部には、上記分析手法の独自コードは内蔵しておりません。 全て、クラウドの R で分析を実行することになります。
R では、基本ライブラリにて分析を実行します。 そのため、目的変数や説明変数の型制限の拡張などには対応していません。
より高度な統計分析を行う場合には、R のスクリプトコードをクリップボード経由でコピーして、R studio に貼付してご利用頂くことができます。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
削除対象の行
データ入力
R の出力結果
R出力図形
AI による R 出力結果の解説
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2)
, "体重" / ("身長" * "身長")
{{ column }}
分析法の特徴一覧
手法 | 英語名 | 目的変数のタイプ | 説明変数のタイプ | 特徴 | Wikipedia |
---|---|---|---|---|---|
{{ method.japaneseName }} | {{ method.englishName }} | {{ method.dependentVariableType }} | {{ method.independentVariableType }} | {{ method.characteristic }} |
データ
設定
対象データ
統計手法
変数名 | 数値 | 連続変数 | カテゴリカル /離散変数 |
|||
---|---|---|---|---|---|---|
{{ variable }} | {{ type.numerical ? '〇' : '-' }} | {{ type.originallyContinuous ? '〇' : '-' }} | {{ type.originallyCategorical ? '〇' : '-' }} |
データの分類は以下のルールに従っています
変数タイプは手動で調整できます
- :有効 / :無効
- クリックすると切り替わり、各統計手法に渡されるデータ形式を明示できます。
手法 | 英語名 | 目的変数のタイプ | 説明変数のタイプ | 特徴 | 適用 |
---|---|---|---|---|---|
{{ method.japaneseName }} | {{ method.englishName }} | {{ method.dependentVariableType }} | {{ method.independentVariableType }} | {{ method.characteristic }} | {{ method.reason }} |
結果
{{method.japaneseName}} ({{method.englishName}})
目的変数の順序:
クラウド R 分析