分割表 (クロス集計表)
データから2つの変数を選択して分割表 (クロス集計表) を作成し、統計的検定を行います。 分割表のサイズと変数の順序によって、使える検定が自動的に表示されます。
解説
使える検定・指標
| 分割表のサイズ | 使える検定・指標 |
|---|---|
| 1×2 または 2×1 | 二項検定 (確率=0.5) |
| 2×2 | カイ二乗検定、Fisher正確確率検定 オッズ比、リスク比、リスク差 |
| 2×k または k×2 | カイ二乗検定、Fisher正確確率検定 |
| 2×k または k×2 (順序あり) | カイ二乗検定、Fisher正確確率検定 Cochran-Armitage検定(比率の傾向) |
| 3×3 以上 | カイ二乗検定、Fisher正確確率検定 |
| 3×3 以上 (両方に順序あり) | 上記に加えて: Spearman順位相関係数、Kendall順位相関係数 線形併合カイ二乗検定、Goodman-Kruskalのガンマ |
カイ二乗検定とFisher正確確率検定の使い分け
- カイ二乗検定:サンプルサイズが大きく、各セルの期待度数が5以上の場合
- Fisher正確確率検定:サンプルサイズが小さい、または期待度数が5未満のセルがある場合
- 詳しくは解説ページをご覧ください。
関連機能
サマリー表 (Table One) の作成
複数の分割表をまとめたサマリー表を作成できます。
検出力とサンプルサイズの計算
2×2分割表で有意差がない場合、検出力やサンプルサイズを計算すると解釈が容易になります。
アプリ
| {{colNames[colIdx-1]}} | |
|---|---|
| {{rowNames[rowIdx-1]}} {{colNames[rowIdx-1]}} |
| 分類内容 | 値 | |
| {{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
削除対象の行
データ入力
AI による R コードの解説
R の出力結果
R出力図形
AI による R 出力結果の解説
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2), "体重" / ("身長" * "身長")
{{ column }}
{{title}}
| {{legendX}} | ||
|---|---|---|
| {{legendY}} | 合計 | |
|
{{ tableData.data[rowIdx-1][colIdx-1] || 0}}
|
{{ tableSum.rows[rowIdx-1] }}
|
|
|
{{ tableSum.cols[colIdx-1] }}
|
{{ tableSum.total }}
|
データ
設定
結果
カイ二乗検定 (Chi-Square test)
カイ二乗検定 (補正無し)
カイ二乗検定 (Yates' の補正あり)
Yates' の補正は2×2の分割表にのみ適用される補正です。
クラウド R 分析
Fisher の正確確率検定
クラウド R 分析
セルの数が大きすぎて Fisher の正確確率検定に計算時間がかかりすぎる懸念があるため、クラウド R 分析を実行できません。
二項検定
クラウド R 分析
オッズ比・リスク比・リスク差 (2x2分割表)
| a = {{tableData.data[0][0]}} | b = {{tableData.data[0][1]}} |
| c = {{tableData.data[1][0]}} | d = {{tableData.data[1][1]}} |
{{ method }}を用いた計算結果
| 指標 | 値 | 95%信頼区間 | p値 |
|---|---|---|---|
| {{ item }} | {{ val.estimate.cp3 }} | [{{ val.ci[0].cp3 }}, {{ val.ci[1].cp3 }}] | {{ val.pValue.cp3 }} |
計算に失敗しました。クラウド R で実行してください。
クラウド R 分析
リスク差 の 同等性検定 (2x2分割表)
被験群のリスク: {{equivalence.riskTest.cp4}}
対照群のリスク: {{equivalence.riskControl.cp4}}
リスク差: {{(equivalence.riskTest - equivalence.riskControl).cp4}}
二群の差の信頼区間が完全に (-δ, δ) の範囲内にある場合、2群は同等であると判断されます。
同等性マージンが設定されていません
クラウド R 分析
比率の傾向の検定 (Cochran-Armitage検定)
群別変数 ({{ legendX }}) に、{{ joinedColNames }} 群別変数 ({{ legendY }}) に、{{ joinedRowNames }} の順序があると仮定して比率の傾向の検定を行います。(順序は設定にて変更できます)
表の 上段を「有効」、下段を「無効」 左列を「有効」、右列を「無効」 として扱います。(実際は入れ替わっていても結果は同じになります)
| {{ tableData.rowNames.length === 2 ? legendX : legendY }} | {{ replaceBrTag(categoryName) }} |
|---|---|
| スコア値 |
デフォルトは等間隔 (1, 2, 3, ...) です。
使用例
• 薬剤用量: 0, 5, 10, 20 (mg) など
• 年齢層: 25, 45, 65, 85 (歳) など
• 重症度スコア: 軽度=1, 中等度=3, 重度=10 など
※ 等間隔スコア (1,2,3 や 0,1,2 や 10,20,30) では統計的結果は同じになります
クラウド R 分析
順序のある分割表の分析
行と列の両方に順序があると仮定して、Spearmanの順位相関係数、Kendallの順位相関係数、線形併合カイ二乗検定、Goodman-Kruskalのガンマ係数 にて分析を行います。(順序は設定にて変更できます)
群分類に複数のカラムを選択して組み合わせた場合には、組み合わせ全体に順序があると仮定します。
例えば、群分類が [A, B, C] で副群分類が [1, 2] の場合、[A1, A2, B1, B2, C1, C2] の順序を想定します。
それぞれのカラムの順序を層別化しての検定には対応していませんので注意してください。