Table One 作成アプリ 詳細ユーザーガイド
設定項目
基本設定
表記言語
- 日本語: 項目名が日本語で表示されます
- 英語: 項目名が英語で表示されます
文字サイズ
表示される文字の大きさを調整できます。印刷やプレゼンテーションに合わせて選択してください。
表示設定
全体(Overall)の列を表示
設定 | 結果 | 使用場面 |
---|---|---|
表示 | 全対象者の統計が表示される | グループ比較と全体把握の両方が必要な場合 |
非表示 | グループ別の統計のみ表示 | グループ間比較に集中したい場合 |
位置設定: 左端または右端を選択できます。
連続変数による列追加
適用条件: 群分類を指定しない場合のみ利用可能
設定内容 | 表示結果 | 使用場面 |
---|---|---|
連続変数を選択 | 各対象変数と連続変数の関係が列として表示される | 変数間の関連性を探索的に分析したい場合 |
未選択 | 通常の全体統計のみ表示 | 単純な記述統計を求める場合 |
表示内容:
- 連続×連続: 相関係数(Pearson r またはSpearman ρ)
- カテゴリ×連続: 各カテゴリでの連続変数の統計量(平均±SD または中央値[IQR])
データ数(N)の表示オプション
オプション | 表示場所 | 内容 |
---|---|---|
最初の行にデータ数を表示 | 表の最上段 | 各グループの総データ数 |
連続変数にデータ数を表示 | 各連続変数の下 | その変数の有効データ数 |
データ数に欠損値数を表示 | N表示部分 | N = 100 (欠損 5) の形式 |
「その他」の表示設定
対象列の非選択項目を「その他」として表示
例:血液型でA型、B型のみ選択した場合 ✅ 有効: O型、AB型が「その他」として集計表示される ❌ 無効: O型、AB型は表から除外される
群分類の非選択項目を「その他」として表示
例:治療群で群A、群Bのみ選択した場合 ✅ 有効: 群C、群Dが「その他」として集計表示される ❌ 無効: 群C、群Dのデータは表から除外される
欠損値の表示設定
設定項目 | 対象 | 表示内容 |
---|---|---|
対象列の欠損値数を表示 | 分析対象の変数 | 各変数の欠損値数を最下行に表示します |
群分類の欠損値を表示 | グループ分類変数 | 群が不明なデータを別列に表示します |
統計手法設定
デフォルト統計手法
連続変数の統計手法は、各変数の個別設定が最優先され、個別設定がない場合にここで指定したデフォルト設定が適用されます。
選択肢 | 連続変数の表示 | 連続変数の検定 |
---|---|---|
パラメトリック | 平均 ± 標準偏差 | Welch t検定/ANOVA |
ノンパラメトリック | 中央値 (範囲/IQR) | Mann-Whitney/Kruskal-Wallis |
選択の指針:
- データが正規分布に近い場合はパラメトリックを選択します
- データが偏っている、外れ値が多い場合はノンパラメトリックを選択します
- データの分布は「ミニヒストグラム」で確認できます
パラメトリック/ノンパラメトリック検定の詳細についてはこちらを参照してください。
中央値の範囲表示
設定 | 表示形式 | 使用場面 |
---|---|---|
範囲 | 中央値 (最小値-最大値) | 全データの範囲を知りたい場合 |
IQR | 中央値 (Q1-Q3) | 外れ値の影響を避けたい場合 |
カテゴリ変数の表示形式
設定 | 表示例 | 特徴 |
---|---|---|
n (%) | 40 (25.0%) | 一般的な形式です |
% (n/N) | 25.0% (40/160) | 分母が明確に示されます |
統計表示オプション(パラメトリック連続変数)
オプション | 表示例 | 説明 |
---|---|---|
標準偏差(SD) | 平均 ± SD | 最も一般的な形式です |
標準誤差(SEM) | 平均 (SEM) | 平均の精度を示します |
信頼区間(CI) | 平均 (95% CI) | 母集団平均の推定範囲を示します |
複数選択時は 平均 (SD, SEM, 95% CI)
の形式で表示されます。
p値・統計検定設定
p値の表示
- 有効: 各変数でグループ間比較のp値を計算・表示します
- 無効: p値は計算・表示されません
注: 群分類を指定しない場合、p値は表示されません。
統計手法の注釈
- 有効: p値に記号(*, †, ‡など)を付けて使用した検定方法を脚注で説明します
- 無効: p値のみ表示されます
特殊な検定の設定
2群ノンパラメトリック検定
選択肢 | 特徴 | 推奨度 |
---|---|---|
Brunner-Munzel検定 | 分布形状が異なっても使用可能 | 強く推奨 |
Mann-Whitney U検定 | 分布形状が同じことを仮定・脆弱な検定法 | 非推奨 |
カイ二乗検定の補正・代替
設定項目 | 適用条件 | 効果 |
---|---|---|
Yates補正 | 期待度数5以下のセルがある場合 | より保守的な検定になります |
Fisher正確確率検定 | 2×2分割表の場合 | 正確なp値が得られます |
二項検定 | 1×2または2×1分割表の場合 | 正確なp値が得られます |
順序変数の特殊検定
検定方法 | 適用条件 | 目的 |
---|---|---|
Cochran-Armitage検定 | 2×k分割表で順序がある場合 | 傾向の検定を行います |
線形回帰分析 | 連続変数で群に順序がある場合 | 線形傾向の検定を行います |
Jonckheere-Terpstra検定 | 連続変数(ノンパラ)で群に順序がある場合 | 単調傾向の検定を行います |
統計検定の選択ルール
統計検定の選択は複雑な階層構造になっており、複数の条件が段階的にチェックされて最適な検定方法が自動選択されます。
連続変数の検定選択ルール
連続変数の統計手法は、以下の要素によって決定されます:
- パラメトリック/ノンパラメトリックの指定(個別設定 → 全体設定の順で適用)
- 比較する群の数
- 群に順序があるかどうか
- 特定の検定方法の設定
パラメトリック検定(連続変数)
群数 | 群の順序 | 「線形回帰分析を使用」設定 | 選択される検定方法 |
---|---|---|---|
2群 | - | - | Welch t検定 (両側検定) |
3群以上 | なし | - | Welch ANOVA (一元配置分散分析) |
3群以上 | あり | オン | 線形回帰分析 |
3群以上 | あり | オフ | Welch ANOVA (一元配置分散分析) |
ノンパラメトリック検定(連続変数)
群数 | 群の順序 | 設定 | 選択される検定方法 |
---|---|---|---|
2群 | - | Brunner-Munzel検定を選択 | Brunner-Munzel検定 |
2群 | - | Mann-Whitneyの検定を選択 | Mann-WhitneyのU検定 |
3群以上 | なし | - | Kruskal-Wallis検定 |
3群以上 | あり | Jonckheere-Terpstra検定を使用: オン | Jonckheere-Terpstra傾向検定 |
3群以上 | あり | Jonckheere-Terpstra検定を使用: オフ | Kruskal-Wallis検定 |
相関計算(群分類なしの場合)
群分類を指定せず、連続変数による列追加を使用した場合の統計計算:
対象変数のタイプ | 連続変数との関係 | 計算内容 |
---|---|---|
連続変数(数値) | 連続変数 | Pearson相関係数(パラメトリック)またはSpearman順位相関係数(ノンパラメトリック) |
カテゴリカル変数 | 連続変数 | 各カテゴリでの連続変数の統計量(平均±SD または中央値[IQR]) |
相関係数の表示例: r = 0.67
(パラメトリック)、ρ = 0.54
(ノンパラメトリック)
カテゴリカル変数の検定選択ルール
カテゴリカル変数の場合、複数の条件が階層的にチェックされ、最初に一致した条件に対応する検定方法が選択されます。
検定選択の優先順位
1. 両方に順序のある3×3以上の分割表
条件 | 設定 | 選択される検定方法 |
---|---|---|
行と列の両方に順序あり、かつ3×3以上の分割表 | 順序のある分割表の検定: Spearmanの順位相関係数 | Spearmanの順位相関係数 |
行と列の両方に順序あり、かつ3×3以上の分割表 | 順序のある分割表の検定: Kendallの順位相関係数 | Kendallの順位相関係数 |
行と列の両方に順序あり、かつ3×3以上の分割表 | 順序のある分割表の検定: 線形併合カイ二乗検定 | 線形併合カイ二乗検定 |
2. 一方に順序のある2×kまたはk×2分割表
条件 | 設定 | 選択される検定方法 |
---|---|---|
対象カラムに順序あり、かつ2×k分割表 | Cochran-Armitage検定を使用: オン | Cochran-Armitage検定 |
群分類に順序あり、かつk×2分割表 | Cochran-Armitage検定を使用: オン | Cochran-Armitage検定 (データを転置して適用) |
3. 特殊な分割表サイズに対する検定
分割表のサイズ | 設定 | 選択される検定方法 |
---|---|---|
2×2 | Fisherの正確確率検定を使用: オン | Fisherの正確確率検定 |
1×2または2×1 | 二項検定を使用: オン | 二項検定 |
4. デフォルトの検定方法
条件 | 設定 | 選択される検定方法 |
---|---|---|
その他すべてのケース | Yates補正: オン、かつ期待度数5以下のセルあり | Yates補正を適用したカイ二乗検定 |
その他すべてのケース | Yates補正: オフ、または期待度数5以下のセルなし | 通常のカイ二乗検定 |
統計検定選択フローチャート
連続変数
連続変数 ├── 2群比較 │ ├── パラメトリック → Welch t検定 │ └── ノンパラメトリック │ ├── Brunner-Munzel設定 → Brunner-Munzel検定 ⭐推奨 │ └── Mann-Whitney設定 → Mann-Whitney U検定 └── 3群以上比較 ├── パラメトリック │ ├── 群に順序あり + 線形回帰オン → 線形回帰分析 │ └── その他 → Welch ANOVA └── ノンパラメトリック ├── 群に順序あり + Jonckheere-Terpstraオン → Jonckheere-Terpstra検定 └── その他 → Kruskal-Wallis検定
カテゴリカル変数
カテゴリカル変数 (優先順位順にチェック) ├── 行列とも順序あり(3×3以上) │ ├── Spearman順位相関 │ ├── Kendall順位相関 │ └── 線形併合カイ二乗検定 ├── 順序あり2×k分割表 → Cochran-Armitage検定 ├── 2×2分割表 │ ├── Fisher設定有効 → Fisher正確確率検定 │ └── Fisher設定無効 → カイ二乗検定 ├── 1×2または2×1分割表 │ ├── 二項検定設定有効 → 二項検定 │ └── 二項検定設定無効 → カイ二乗検定 └── その他 → カイ二乗検定 (Yates補正の適用判定あり)
「その他」グループの取り扱い
基本ルール
検定の種類 | 「その他」の扱い | 理由 |
---|---|---|
順序を前提としない検定 | 統計計算に含める | 1つの独立したグループとして扱います |
順序を前提とする検定 | 統計計算から除外 | 「その他」には順序がないためです |
具体例
Case 1: カイ二乗検定(順序なし)
血液型の比較: A型、B型を選択、O型・AB型を「その他」表示設定 結果: - A型: 50人 (31.3%) - B型: 60人 (37.5%) - その他: 50人 (31.3%) ← O型・AB型の合計 - p値: 0.123 (A型、B型、その他の3群で計算)
Case 2: Cochran-Armitage検定(順序あり)
病期の比較: I期、II期を選択、III期・IV期を「その他」表示設定 病期に順序ありと設定 結果: - I期: 30人 (42.9%) - II期: 40人 (57.1%) - その他: 20人 (表示されるが統計計算からは除外) - p値: 0.045 (I期、II期の2群のみで計算)
重要な注意点
- 「その他」表示設定の影響
- 表示設定OFF → 「その他」に該当するデータは完全に除外されます
- 表示設定ON → 「その他」が表示されますが、検定方法により計算への包含が決まります
- サブグループ設定時の「その他」
- メイングループが「その他」の場合、全サブグループ組み合わせが対象となります
- 順序検定では「その他」を含む組み合わせはすべて除外されます
欠損値の処理方法
欠損値の種類と処理
欠損値の種類 | 処理方法 | 表示場所 | 統計計算への影響 |
---|---|---|---|
分析対象変数の欠損 | その変数の分析から除外 | 変数の最下行に表示 | その変数の統計からのみ除外 |
群分類変数の欠損 | 全分析から除外 | 独立した「欠損値」列 | すべての統計計算から除外 |
欠損値表示の詳細
分析対象変数の欠損値表示
設定: 「対象列の欠損値数を表示」有効 結果例: 年齢 (平均 ± SD) ├── 治療群: 65.2 ± 12.3 ├── 対照群: 63.8 ± 11.5 └── 欠損値: 5 (3.1%) ← この行が追加表示
群分類変数の欠損値表示
設定: 「群分類の欠損値を表示」有効 結果例: 治療群 対照群 欠損値 年齢 65.2±12.3 63.8±11.5 64.1±10.2 性別 ├男性 45(60%) 40(55%) 3(60%) └女性 30(40%) 33(45%) 2(40%)
重要な注意事項
- 群分類の欠損値は統計検定から除外されます
- p値の計算には含まれません
- 群不明のデータとして別途表示のみ行われます
- 欠損値数の計算方法:
全データ数 - 有効データ数 = 欠損値数
- 連続変数の部分欠損
- 各変数ごとに独立して欠損値を処理します
- 変数Aで欠損でも変数Bでは使用される場合があります
よくある設定パターンと結果
パターン1: 基本的な臨床試験のTable 1
設定
- 群分類: 治療群/対照群
- 統計手法: パラメトリック
- p値表示: 有効
- 「その他」表示: 無効
結果例
治療群 対照群 p値 (n=100) (n=95) 年齢 (平均 ± SD) 65.2±12.3 63.8±11.5 0.456 性別 (n (%)) ├ 男性 60(60.0) 55(57.9) 0.752 └ 女性 40(40.0) 40(42.1)
パターン2: 多群比較(病期分類)
設定
- 群分類: I期/II期/III期/IV期
- 病期に順序あり: 有効
- Cochran-Armitage検定: 有効
結果例
I期 II期 III期 IV期 p値 (n=50) (n=60) (n=45) (n=30) 年齢 (平均±SD) 58±10 62±12 67±11 70±9 0.023* 治療反応 (n (%)) ├ 反応あり 40(80) 42(70) 27(60) 12(40) 0.001† └ 反応なし 10(20) 18(30) 18(40) 18(60) * 線形回帰分析, † Cochran-Armitage検定
パターン3: サブグループ分析
設定
- 群分類: 治療法(薬物A/薬物B/手術)
- 副群分類: 性別(男性/女性)
- 全体列: 表示
結果例
全体 薬物A 薬物B 手術 男性 女性 男性 女性 男性 女性 年齢 65±12 64±11 66±13 65±10 67±14 63±12 64±11
パターン4: 「その他」グループを含む分析
設定
- 血液型: A型、B型のみ選択
- 「対象列の非選択項目を『その他』として表示」: 有効
結果例
血液型 (n (%)) ├ A型 45(28.1) 40(26.7) 0.234 ├ B型 40(25.0) 45(30.0) └ その他 35(21.9) 35(23.3) (その他はO型・AB型の合計)
パターン5: 群分類なしの探索的分析
設定
- 群分類: なし
- 対象データ列: 年齢、BMI、収縮期血圧
- 連続変数による列追加: HbA1c、総コレステロール
結果例
全体 HbA1c 総コレステロール (n=200) 年齢 (平均±SD) 65.2±12.3 r = 0.34 r = 0.12 BMI (平均±SD) 24.1±3.8 r = 0.28 r = -0.05 収縮期血圧 ├ 正常 80(40.0%) 6.1±0.8 185±25 ├ 軽度高血圧 90(45.0%) 6.4±1.0 195±30 └ 高血圧 30(15.0%) 7.2±1.2 210±35
トラブルシューティング
よくあるエラーと対処法
1. 「連続変数に非数値が含まれています」
原因: 数値として指定した列に文字列が含まれています
対処法:
- データを確認し、数値以外の値を修正してください
- または変数タイプを「カテゴリカル」に変更してください
2. 「p値がN/Aと表示される」
原因: 統計検定に必要な条件が満たされていません
対処法:
- データ数が十分か確認してください(各群2人以上)
- 「その他」表示設定により実質的な群数が変わっていないか確認してください
3. 「期待していた検定方法と異なる」
原因: 複雑な優先順位により意図しない検定が選択されています
対処法:
- p値にマウスをホバーして使用された検定方法を確認してください
- 順序設定や特殊検定設定を見直してください
4. 「『その他』グループの扱いが予想と違う」
原因: 検定方法により「その他」の包含・除外が決まります
対処法:
- 順序を前提とする検定では「その他」は自動的に除外されることを理解してください
- 必要に応じて順序設定を変更してください
5. 「連続変数による列追加が表示されない」
原因: 群分類が設定されている場合は連続変数による列追加は使用できません
対処法:
- 群分類を未選択にしてください
- または群分類による比較と連続変数による探索的分析を別々に実行してください
設定確認のチェックリスト
データ準備段階
- [ ] 欠損値が適切にコーディングされている
- [ ] 数値変数に文字列が混入していない
- [ ] グループ変数のカテゴリが意図通りに設定されている
設定確認段階
- [ ] 統計手法(パラメトリック/ノンパラメトリック)が適切
- [ ] 順序変数の設定が正しい
- [ ] 「その他」表示設定の影響を理解している
- [ ] 欠損値表示設定が目的に合っている
- [ ] 連続変数による列追加の使用目的が明確(探索的分析 vs 群間比較)
結果確認段階
- [ ] 各群のデータ数が期待値と一致している
- [ ] p値の計算に使用された検定方法が意図通りか
- [ ] 「その他」グループの扱いが期待通りか
- [ ] 欠損値の処理が適切に反映されているか
- [ ] 相関係数が適切に表示されているか(連続変数列追加使用時)
よくある質問と回答
Q1. 順序変数を設定したのに通常のカイ二乗検定が実行される
A1. Cochran-Armitage検定は2×k分割表でのみ適用されます。3×3以上の場合は「行列とも順序のある場合」の設定を確認してください。
Q2. 欠損値が多いグループで統計的有意差が出ない
A2. 欠損値は統計計算から除外されるため、実効サンプルサイズが小さくなっている可能性があります。欠損値数を確認してください。
Q3. サブグループ設定時に一部の組み合わせが表示されない
A3. 該当する組み合わせのデータが存在しないか、フィルター設定により除外されている可能性があります。
Q4. 連続変数による列追加で相関係数が表示されない
A4. 対象変数が文字列のカテゴリカル変数の場合、相関係数ではなく各カテゴリでの統計量が表示されます。数値として解釈可能な変数のみ相関係数が計算されます。
Q5. 群分類ありと群分類なしで結果が異なる
A5. これは正常な動作です。群分類ありは群間比較、群分類なしは変数間の関連性探索という異なる分析目的のためです。
参考情報
統計検定の詳細情報
各検定方法の詳細は、p値にマウスをホバーすると表示されるRスクリプトで確認できます。クリックすることでRスクリプトをクラウドRで実行して検証することも可能です。
引用について
アプリが生成する論文記載例を参考に、使用した統計手法を適切に引用してください。特に以下の点に注意が必要です:
- 使用したR version(アプリに表示されます)
- 適用した検定方法(脚注記号で示されます)
- 有意水準の設定(通常α = 0.05)
- 特殊な検定を使用した場合の理由