対応のない群間の検定 [直接入力]
解説
対応のない群間の検定は、異なるグループ間で連続変数の平均値や分布に統計的な違いがあるかを検定する方法です。
これらの検定は、異なるサンプル群(例えば、異なる治療法を受けた患者群や異なる年齢層の人々)から得られたデータに適用されます。
グラフ
- ヒストグラム: データの分布を視覚化します。各ビン(区間)にデータがどれだけ含まれているかを示します。
- 箱ひげ図: データの分布、中央値、四分位数、外れ値を視覚化します。
- バイオリンプロット: 箱ひげ図の分布情報に密度情報を加えたグラフです。データの密度分布を同時に示します。
- ランクプロット: 各データ点の順位をプロットします。データの順序関係を視覚化します。
- 累積分布関数プロット: ある値以下のデータ点の割合を示します。データの累積分布を視覚化します。
- 正規確率プロット: データが正規分布に従っているかを視覚的に評価します。データの正規性を確認するために使用されます。
統計計算
- t検定: 二群間の平均値の差が統計的に有意かどうかを検定します。
- Welchのt検定: 二群間の平均値の差を検定します。分散が等しくないことを仮定し、Studentのt検定よりもロバストです。F検定を事前に行わずに使用することが推奨されます。
- ANOVA (分散分析): 三つ以上の群間で平均値に差があるかを検定します。一元配置分散分析 (One-Way ANOVA) と同義です。
- WelchのANOVA: 三つ以上の群間で平均値の差を検定します。等分散性を仮定しないため、Bartlett検定やLevene検定で等分散性が否定された場合に適しています。
- 線形傾向分析: 順序付き群(例:低用量 < 中用量 < 高用量)において、線形および二次(曲線的)傾向を検定します。群に明確な順序関係がある場合の検定法で、F値、p値、傾き係数、95%信頼区間を提供します。等分散・不等分散両方に対応しています。
- F検定: 二つの群の分散が等しいかどうかを検定します。特に Student t検定の前提条件として使用されます (非推奨: Welch t検定を用いるべき)。
- Bartlett検定: 三つ以上の群の分散が等しいかどうかを検定します。ANOVAの前提条件の一つです。
- Levene検定: 二つ以上の群の分散が等しいかどうかを検定します。Bartlett検定と比べ、正規性の仮定からの逸脱に対して頑健です。ANOVAやt検定の前提条件の一つとして使用されます。
- Tukey HSD (Tukeyの正直有意差法): ANOVAの後に行われる、群間の具体的な差異を検証するための検定です。これは本来は等サンプルサイズを前提とした手法ですので、R および Reactive stat では、サンプルサイズが異なる場合には自動的に Tukey-Kramer法が適用されます。
- Games-Howell法: ANOVAの後に行われる多重比較検定の一つです。等分散性を仮定しないため、分散が等しくないと考えられる場合に適しています。Tukey HSDよりも保守的な結果になりやすいです。クラウド R で実行できます。
- Tamhane's T2検定: ANOVAの後に行われる多重比較検定の一つです。等分散性を仮定しない検定法で、Games-Howell法と同様に分散が等しくない場合に利用できます。Games-Howell法よりもさらに保守的な傾向があります。クラウド R で実行できます。
- Dunnett検定: ANOVAの後に行われる多重比較検定で、特定の基準群と他の全ての群を比較する場合に使用します。全ペア比較ではなく基準群との比較のみを行うため、統計的検出力が向上します。等分散・不等分散両方に対応しています。
- Mann-Whitney U検定: 二つの独立した群間で、中央値に差があるかを検定します (非推奨: Brunner-Munzel検定を用いるべき)。
- Brunner-Munzel検定: 二つの独立したグループ間の確率的優越性を比較するためのノンパラメトリック検定です。データの分布や分散の等質性に関する仮定が少なく、順序尺度のデータにも適用可能です。特に、小サンプルサイズや非対称分布、外れ値を含むデータに対して有効です。
- Kruskal-Wallis検定: 三つ以上の独立した群間で、分布に差があるかを検定します。特に、中央値の違いに敏感な検定です。
- Jonckheere-Terpstra検定: 順序付き群において単調な傾向(増加・減少)があるかを検定するノンパラメトリック手法です。群に明確な順序関係がある場合に、Kruskal-Wallis検定よりも適しています。両側検定、単調増加検定、単調減少検定に対応しています。
- Dunn検定: Kruskal-Wallis検定の後に行われるノンパラメトリック多重比較検定です。基準群との比較または全ペア比較が可能で、様々な多重比較補正法(Bonferroni、Holm等)に対応しています。
- 同等性の検定: あらかじめ適切に設計された臨床試験において、新しい治療法や介入の効果を既存の標準治療と比較する目的で、同等性の検定を行うことができます。
- 同等性試験は、新しい治療法が既存の治療法と同等の効果を持つことを示すために使用されます。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
削除対象の行
データ入力
AI による R コードの解説
R の出力結果
R出力図形
AI による R 出力結果の解説
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2)
, "体重" / ("身長" * "身長")
{{ column }}
{{title}}
グループの比較 | p 値 (補正なし; 非推奨) |
p 値 (Bonferroni 補正) |
p 値 (Holm 補正) |
---|---|---|---|
{{ groupNames[item.position[0]] + ' vs. ' + groupNames[item.position[1]] }} | {{ item.pValue?.cp2 }} | {{ bonferroniResults[idx]?.cp2 }} | {{ holmResults[idx]?.cp2 }} |
データ
設定
値を変化させて感度分析や仮説検証の探索的分析を行うための機能です。
値のシフトは行われていません
結果
ヒストグラム (度数分布)
箱ひげ図
バイオリンプロット
ランクプロット
累積分布関数プロット
正規確率プロット
基礎統計
- {{obj.jp}} ({{obj.en}})
- {{obj.description}}
{{obj.mathjax}}
- {{obj.description}}
クラウド R 分析
正規性の検定と外れ値
クラウド R 分析
- 歪度・尖度
- Lilliefors 検定 (改良 Kolmogorov-Smirnov検定)
- Shapiro–Wilk検定
- Smirnov-Grubbs 検定による外れ値の判定
パラメトリック検定結果 (順序あり)
基礎統計量
群 | N | 平均値 | 標準偏差 | 不偏分散 |
---|---|---|---|---|
{{ groupName }} | {{ groupedObject[groupName].length }} | {{ jStat.mean(groupedObject[groupName])?.cp4 }} | {{ jStat.stdev(groupedObject[groupName])?.cp4 }} | {{ jStat.variance([...groupedObject[groupName]], true)?.cp4 }} |
全体 | {{ targetData.length }} | {{ jStat.mean(targetData)?.cp4 }} | {{ jStat.stdev(targetData)?.cp4 }} | {{ jStat.variance([...targetData], true)?.cp4 }} |
Welch の t検定 (等分散を仮定しない)
事前検定 (F検定) は行わず、はじめから Welch の t検定 を行うことが推奨されます。
Student の t検定 (等分散を仮定)
Student の t検定の{{ msgVarianceAssumptionViolated }}
F検定 (等分散性の検定)
等分散性の検定 (Levene検定)
ANOVA + 線形傾向分析
ANOVA (分散分析)
基本ANOVA結果 (参考)
順序を考慮していません
ANOVA (等分散を仮定)
{{ msgVarianceAssumptionViolated }}
Welch の ANOVA (等分散を仮定しない)
群の数が多すぎます
線形傾向分析結果
群の順序: {{ groupNames.join(' → ') }}
3群以上の等分散性の検定 (Bartlett検定)
群の数が3未満です
等分散性の検定 (Levene検定)
群分類数が多すぎます
事後検定 - ペアワイズ比較 (全ペア比較)
Tukey's HSD (ANOVA用)
等分散性を仮定する事後検定です。すべての群が同じ分散を持つという前提でペアワイズ比較を行います。
注意: 線形傾向分析と事後検定は異なる仮説を検証するため、解釈には注意が必要です。線形傾向分析は順序関係を、Tukey HSDは任意のペア間の差を検定します。
グループの比較 | p値 |
---|---|
{{ groupedObjectKeys[item[0][0]] + ' vs. ' + groupedObjectKeys[item[0][1]] }} | {{ item[1]?.cp2 }} |
Games-Howell検定 (Welch の ANOVA用)
等分散性を仮定しない事後検定です。各群の分散を個別に考慮してペアワイズ比較を行います。
注意: 線形傾向分析と事後検定は異なる仮説を検証するため、解釈には注意が必要です。線形傾向分析は順序関係を、Games-Howell検定は各群の分散を個別に考慮した任意のペア間の差を検定します。
グループの比較 | p値 |
---|---|
{{ groupedObjectKeys[item.position[0]] + ' vs. ' + groupedObjectKeys[item.position[1]] }} | {{ item.pValue?.cp2 }} |
事後検定 - 基準群との比較
Dunnett検定
クラウドR にて Dunnett検定 を実行できます。クラウド R 分析 (線形傾向分析含む)
{{ msgVarianceAssumptionViolated }}
推奨: 線形傾向分析により順序関係を検証してください。
ノンパラメトリック検定結果 (順序あり)
基礎統計量
群 | N | 中央値 | 範囲 | 第1四分位数 | 第3四分位数 |
---|---|---|---|---|---|
{{ groupName }} | {{ groupedObject[groupName].length }} | {{ jStat.median(groupedObject[groupName]) }} | {{ jStat.min(groupedObject[groupName]) }} - {{ jStat.max(groupedObject[groupName]) }} | {{ jStat.quartiles(groupedObject[groupName])[0] }} | {{ jStat.quartiles(groupedObject[groupName])[2] }} |
全体 | {{ targetData.length }} | {{ jStat.median(targetData) }} | {{ jStat.min(targetData) }} - {{ jStat.max(targetData) }} | {{ jStat.quartiles(targetData)[0] }} | {{ jStat.quartiles(targetData)[2] }} |
Brunner-Munzel 検定
二群の差が極端に大きいため、Brunner-Munzel検定の統計量が正常に計算できませんでした。
Mann-Whitney のU検定
正規近似法で計算し、連続性補正と同順位の補正を行っています
Jonckheere-Terpstra 検定
群の順序: {{ groupNames.join(' → ') }}
Kruskal-Wallis検定 (参考)
順序を考慮していません
Kruskal-Wallis検定
群分類数が多すぎます
事後検定 - ペアワイズ比較 (全ペア比較)
Brunner-Munzel 検定を用いたペアワイズ比較
Mann-Whitney のU検定を用いたペアワイズ比較
事後検定 - 基準群との比較
Dunn検定
クラウドR にて Dunnett検定 を実行できます。クラウド R 分析
推奨: Jonckheere-Terpstra検定により順序関係を検証してください。
同等性検定 (パラメトリック)
二群の差の信頼区間が完全に (-δ, δ) の範囲内にある場合、2群は同等であると判断されます。
同等性マージンが設定されていません