サマリー表 (Table 1) の作成
サマリー表とは
データ分析を行った場合に、そのデータの背景の概要を表にしたものです。
論文では、多くの場合 表1 (Table 1) として提示されるものです。 学会発表においても、データ集計を行った場合には、必須の表となります。
機能
医学統計や生物統計で頻繁に使用されるサマリー表 (概要表, Summary Tables) を、グラフィカルインターフェースを通じて直感的かつ効率的に作成することができます。
作成した表は、クリップボード経由でエクセルなどに貼り付けて利用することができます。
{{ replaceNewlinesInStrings(replacedScript) }}
R の出力結果
{{ rResult }}
R出力図形
AI による R 出力結果の解説
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
欠損値を含むカラムを選択
カラムを選択
削除対象の行
データ入力
-
...(選択肢が多すぎます){{ nansMessage(columnsAttr[column].values) }}
データ
設定
データが読み込まれていません
結果 (サマリーテーブル)
ライセンスは、右上のログイン表示のボタンからご購入いただけます。
{{op.showGroupName ? settings.grouping.column: ''}} | {{ i18n('全体') }} | {{ group }} | {{ i18n('全体') }} | {{ i18n('p値') }} | ||||
---|---|---|---|---|---|---|---|---|
{{op.showGroupName ? settings.subGrouping.column: ''}} | {{ isSubGrouped ? groupingItem.value[1] : groupingItem.value }} | |||||||
{{op.showGroupName ? settings.grouping.column: ''}} | {{ i18n('全体') }} | {{ isSubGrouped ? groupingItem.value[1] : groupingItem.value }} | {{ i18n('全体') }} | {{ i18n('p値') }} | ||||
N | {{stats.totalN}} | {{n}} | {{stats.totalN}} | |||||
{{ data.rowTop.header }} | ||||||||
{{ row.header }} | (カテゴリカル変数の種類が多すぎます) | |||||||
{{ data.rowBottom.header }} | ||||||||
{{ methodStarsAnnotation }} |
統計解析には {{ RVersion }} を使用した。 (R Core Team, 2024)
Statistical analyses were performed using {{ RVersion }} (R Core Team, 2024).
R Core Team (2024). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.
p値の計算内容について
p値は各分割表の数値からクラウドRにて計算しています。({{ RVersion }})
設定に従い、行列とも順序がある 3x3 以上の分割表に対して {{ ordinalAssocTestName }} を用いています。
{{ tooltips.hoveringOnPValue }}
カテゴリカル変数の順序について
カテゴリカル変数に順序がある場合、順序を前提とした統計解析を選択できますが、誤った手法を選択しないよう、十分な注意が必要です。多くの場合、Table 1 においては、順序を前提としない通常の解析方法が行われているようです。
順序を考慮した統計解析は、以下の場合に選択可能になります:
- 分析対象とする列 (カラム) のカテゴリカル変数に順序がある場合
- 群分類 (主分類) に順序がある場合 (副分類も指定された場合は、組み合わせ全体が順序を持つという前提になります)
順序を考慮した統計解析の選択肢:
- 連続変数の場合 (群分類に順序がある場合):
- パラメトリック手法: 線形回帰分析を選択できます。これは群間の傾向 (増加または減少) を評価するのに適しています。
- ノンパラメトリック手法: Jonckheere-Terpstra傾向検定を選択できます。これは群間の単調な傾向を評価するのに適しています。
- カテゴリカル変数に順序がある場合:
- 順序のある 2×k分割表: Cochran-Armitage検定を選択できます。これは二項反応と順序カテゴリ間の関連を評価します。この検定は、分析対象の列または群分類のいずれかに順序がある場合に適用可能です。
- 行列とも順序のある 3×3以上の分割表: 以下の順序関連の検定を選択できます。これらは分析対象の列と群分類の両方に順序がある場合に適用可能です。
- Spearmanの順位相関係数: 順位に基づく相関を評価します。
- Kendallの順位相関係数: 順位の一致と不一致に基づく関連性を評価します。
- 線形併合カイ二乗検定: 順序カテゴリ間の線形関連を評価します。
注意点:
- 順序の指定は慎重に行ってください。不適切な順序指定は誤った結論につながる可能性があります。
-
副群分類を指定した場合には、(主)群分類との組み合わせ全体に順序があると仮定しますので、表示順序が実際の順序関係を反映していることを確認してください。
例えば、群分類が [A, B, C] で副群分類が [1, 2] の場合、[A1, A2, B1, B2, C1, C2] の順序を想定します。この順序関係が成り立たない場合、順序を前提とした統計解析は適切ではありません。
層別化した2つの順序を考慮した検定には対応していません。 - 順序ありとして扱う場合、「その他」のカテゴリは統計処理から除外されます。これは「その他」に明確な順序がないためです。
- 結果の解釈には注意が必要です。順序を考慮した分析は傾向の有無を示すものであり、各群間の個別の差を直接示すものではありません。
- データの性質や研究目的に応じて適切な手法を選択することが重要です。順序を考慮しない通常の解析方法と比較することで、より包括的な理解が得られる場合もあります。