連続変数の要約
(基礎統計)
解説
基礎統計量
データ総数, 数値データの個数, 最小値, 第1四分位数, 中央値, 第3四分位数, 最大値, 四分位範囲, 外れ値, 平均値, 分散 (不偏分散), 標準偏差 (不偏標準偏差), 標本分散, 標本標準偏差, 平均の標準誤差, 歪度, 尖度 を計算します。
グラフ
- ヒストグラム: データの分布を視覚化します。各ビン(区間)にデータがどれだけ含まれているかを示します。
- 箱ひげ図: データの分布、中央値、四分位数、外れ値を視覚化します。
- バイオリンプロット: 箱ひげ図の分布情報に密度情報を加えたグラフです。データの密度分布を同時に示します。
- ランクプロット: 各データ点の順位をプロットします。データの順序関係を視覚化します。
- 累積分布関数プロット: ある値以下のデータ点の割合を示します。データの累積分布を視覚化します。
- 正規確率プロット: データが正規分布に従っているかを視覚的に評価します。データの正規性を確認するために使用されます。
統計計算
- Kolmogorov-Smirnov検定: データが特定の確率分布(多くの場合、正規分布)に従っているかを検定します。経験分布関数と理論分布関数の最大偏差を評価します。特にサンプルサイズが大きい場合に有用です。クラウド R で分析します。
- Shapiro–Wilk検定: データが正規分布に従っているかを検定します。正規分布の適合度をテストします。クラウド R にて分析します。
- Smirnov-Grubbs検定: 外れ値を検出するための検定です。データセットから極端に離れた値を識別します。クラウド R にて分析します。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
削除対象の行
データ入力
AI による R コードの解説
R の出力結果
R出力図形
AI による R 出力結果の解説
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2)
, "体重" / ("身長" * "身長")
{{ column }}
{{title}}
グループの比較 | p 値 (補正なし; 非推奨) |
p 値 (Bonferroni 補正) |
p 値 (Holm 補正) |
---|---|---|---|
{{ groupNames[item.position[0]] + ' vs. ' + groupNames[item.position[1]] }} | {{ item.pValue?.cp2 }} | {{ bonferroniResults[idx]?.cp2 }} | {{ holmResults[idx]?.cp2 }} |
データ
設定
値を変化させて感度分析や仮説検証の探索的分析を行うための機能です。
値のシフトは行われていません
結果
ヒストグラム (度数分布)
箱ひげ図
バイオリンプロット
ランクプロット
累積分布関数プロット
正規確率プロット
基礎統計
- {{obj.jp}} ({{obj.en}})
- {{obj.description}}
{{obj.mathjax}}
- {{obj.description}}
クラウド R 分析
正規性の検定と外れ値
クラウド R 分析
- 歪度・尖度
- Kolmogorov-Smirnov検定
- Shapiro–Wilk検定
- Smirnov-Grubbs 検定による外れ値の判定
パラメトリック検定結果 (順序あり)
基礎統計量
群 | N | 平均値 | 標準偏差 | 分散 |
---|---|---|---|---|
{{ groupName }} | {{ groupedObject[groupName].length }} | {{ jStat.mean(groupedObject[groupName])?.cp4 }} | {{ jStat.stdev(groupedObject[groupName])?.cp4 }} | {{ jStat.variance(groupedObject[groupName])?.cp4 }} |
全体 | {{ targetData.length }} | {{ jStat.mean(targetData)?.cp4 }} | {{ jStat.stdev(targetData)?.cp4 }} | {{ jStat.variance(targetData)?.cp4 }} |
Welch の t検定 (等分散を仮定しない)
事前検定 (F検定) は行わず、はじめから Welch の t検定 を行うことが推奨されます。
Student の t検定 (等分散を仮定)
Student の t検定の{{ msgVarianceAssumptionViolated }}
F検定 (等分散性の検定)
等分散性の検定 (Levene検定)
ANOVA + 線形傾向分析
ANOVA (分散分析)
基本ANOVA結果 (参考)
順序を考慮していません
ANOVA (等分散を仮定)
{{ msgVarianceAssumptionViolated }}
Welch の ANOVA (等分散を仮定しない)
群の数が多すぎます
線形傾向分析結果
群の順序: {{ groupNames.join(' → ') }}
3群以上の等分散性の検定 (Bartlett検定)
群の数が3未満です
等分散性の検定 (Levene検定)
群分類数が多すぎます
事後検定 - 全ペア比較
Tukey's HSD (ANOVA用)
等分散性を仮定する事後検定です。すべての群が同じ分散を持つという前提でペアワイズ比較を行います。
注意: 線形傾向分析と事後検定は異なる仮説を検証するため、解釈には注意が必要です。線形傾向分析は順序関係を、Tukey HSDは任意のペア間の差を検定します。
グループの比較 | p値 |
---|---|
{{ groupedObjectKeys[item[0][0]] + ' vs. ' + groupedObjectKeys[item[0][1]] }} | {{ item[1]?.cp2 }} |
Games-Howell検定 (Welch の ANOVA用)
等分散性を仮定しない事後検定です。各群の分散を個別に考慮してペアワイズ比較を行います。
注意: 線形傾向分析と事後検定は異なる仮説を検証するため、解釈には注意が必要です。線形傾向分析は順序関係を、Games-Howell検定は各群の分散を個別に考慮した任意のペア間の差を検定します。
グループの比較 | p値 |
---|---|
{{ groupedObjectKeys[item.position[0]] + ' vs. ' + groupedObjectKeys[item.position[1]] }} | {{ item.pValue?.cp2 }} |
クラウド R 分析 (線形傾向分析含む)
{{ msgVarianceAssumptionViolated }}
推奨: 線形傾向分析により順序関係を検証してください。
ノンパラメトリック検定結果 (順序あり)
基礎統計量
群 | N | 中央値 | 範囲 | 第1四分位数 | 第3四分位数 |
---|---|---|---|---|---|
{{ groupName }} | {{ groupedObject[groupName].length }} | {{ jStat.median(groupedObject[groupName]) }} | {{ jStat.min(groupedObject[groupName]) }} - {{ jStat.max(groupedObject[groupName]) }} | {{ jStat.quartiles(groupedObject[groupName])[0] }} | {{ jStat.quartiles(groupedObject[groupName])[2] }} |
全体 | {{ targetData.length }} | {{ jStat.median(targetData) }} | {{ jStat.min(targetData) }} - {{ jStat.max(targetData) }} | {{ jStat.quartiles(targetData)[0] }} | {{ jStat.quartiles(targetData)[2] }} |
Brunner-Munzel 検定
二群の差が極端に大きいため、Brunner-Munzel検定の統計量が正常に計算できませんでした。
Mann-Whitney のU検定
正規近似法で計算し、連続性補正と同順位の補正を行っています
Jonckheere-Terpstra 検定
群の順序: {{ groupNames.join(' → ') }}
Kruskal-Wallis検定 (参考)
順序を考慮していません
Kruskal-Wallis検定
群分類数が多すぎます
ペアワイズ比較 (全ペア比較)
Brunner-Munzel 検定を用いたペアワイズ比較
Mann-Whitney のU検定を用いたペアワイズ比較
クラウド R 分析
推奨: Jonckheere-Terpstra検定により順序関係を検証してください。
同等性検定 (パラメトリック)
二群の差の信頼区間が完全に (-δ, δ) の範囲内にある場合、2群は同等であると判断されます。
同等性マージンが設定されていません