ここでは、対応のない通常の分割表 について説明します。
分割表 (クロス集計表) とは、2つのカテゴリー変数の関係を表にまとめたものです。
100人の患者を新薬群と対照群に分けて、治療の成功・失敗を調べた結果
| 成功 | 失敗 | 合計 | |
|---|---|---|---|
| 新薬群 | 40 | 10 | 50 |
| 対照群 | 25 | 25 | 50 |
| 合計 | 65 | 35 | 100 |
この表から「新薬群の方が成功率が高いようだが、これは偶然か?」を統計的に検定します。
分割表は「行数×列数」でサイズを表します。サイズによって使える検定が異なります。
実行アプリ: 📊 分割表 (クロス集計表) | 分割表 (クロス集計表) [直接入力]
例: コインを10回投げて、表が7回、裏が3回出た
| 表 | 裏 | |
|---|---|---|
| 回数 | 7 | 3 |
使える検定
例: 上記の治療法と結果の表
| 成功 | 失敗 | |
|---|---|---|
| 新薬群 | 40 | 10 |
| 対照群 | 25 | 25 |
使える検定・指標
→ 検定の選び方の詳細: 2×2分割表の検定 — 現代的推奨手法 (Campbell 2007・Lydersen 2009)
例: 治療法 (3群) と治療結果
| 成功 | 失敗 | |
|---|---|---|
| 治療A | 30 | 20 |
| 治療B | 25 | 25 |
| 治療C | 20 | 30 |
使える検定
例: 薬の用量と治療成功率
| 成功 | 失敗 | |
|---|---|---|
| 低用量 | 10 | 40 |
| 中用量 | 20 | 30 |
| 高用量 | 35 | 15 |
使える検定
例: 教育レベルと収入レベル (どちらも順序あり)
| 収入低 | 収入中 | 収入高 | |
|---|---|---|---|
| 中卒 | 30 | 15 | 5 |
| 高卒 | 20 | 25 | 15 |
| 大卒 | 10 | 20 | 30 |
使える検定
実行アプリ: 📊 分割表 (クロス集計表) | 分割表 (クロス集計表) [直接入力] | 2×2分割表の検定
特徴
使える条件
「2つの変数が独立 (関連がない)」と仮定したときに、各セルに入ると期待される値です。計算式は (行合計 × 列合計) ÷ 総計 です。
上記の治療法の例
| 成功 | 失敗 | 合計 | |
|---|---|---|---|
| 新薬群 | 40 (期待値32.5) | 10 (期待値17.5) | 50 |
| 対照群 | 25 (期待値32.5) | 25 (期待値17.5) | 50 |
| 合計 | 65 | 35 | 100 |
例: 新薬群×成功セルの期待度数 = 50 × 65 ÷ 100 = 32.5
全てのセルで期待度数≧5 なので、カイ二乗検定が使えます。
期待度数は整数とは限りません — 上の例の 32.5 や 17.5 のように、小数になるのが普通です。「期待度数の最小値 < 1」という条件は「0のセルがある」という意味ではなく、0.8 や 0.3 のような 1 を下回る小数値のセルがある 場合を指します。期待度数が実際に 0 になるのは、表の行または列の合計が 0 (= その群の観測値が 1 件もない) という特殊ケースのみです。
特徴
使うべき場合 (現代的観点)
Campbell (2007) および Lydersen et al. (2009) に基づく推奨です。
| 状況 | 推奨 |
|---|---|
| 期待度数の最小値 ≥ 1 (例: 1.3, 2.5, 5.0 など) | N-1 カイ二乗検定 |
| 期待度数の最小値 < 1 (例: 0.8, 0.5, 0.2 など) | Fisher-Irwin 検定 (N-1 が自動代替) |
| より高い検出力が必要な場面 | Fisher mid-p 法 または Boschloo 検定 |
| (旧来: 参考のみ) | Yates 補正・Fisher 条件付き正確検定 (保守的すぎる場合がある) |
2×2 分割表では、期待度数の閾値として “5” がよく引用されますが、これは根拠が薄く現代では推奨されていません。Campbell (2007) は N-1 カイ二乗検定 を標準とし、Fisher 条件付き正確検定は保守的になりすぎると指摘しています。
詳細と実例は → 2×2分割表の検定 — 現代的推奨手法
Fisher検定は本来2×2分割表用ですが、より大きな表にも拡張されています。
問題点
推奨
実行アプリ: 📊 分割表 (クロス集計表) | 分割表 (クロス集計表) [直接入力]
適用場面
検定の目的
| 成功 | 失敗 | |
|---|---|---|
| 低用量 (1錠) | 10 | 40 |
| 中用量 (2錠) | 20 | 30 |
| 高用量 (3錠) | 35 | 15 |
見た目では「用量が増えると成功率が上がる」ように見えます。
測定内容: 2つの順序変数間の単調な関係の強さ
値の範囲: -1 (完全な負の相関) ~ +1 (完全な正の相関)
例
測定内容: 2つの順序変数間の一致度
値の範囲: -1 ~ +1
Spearmanとの違い
検定内容: 行と列の変数間に線形関係があるかを検定
読み方: 線形-線形関連性検定 (Linear-by-Linear Association Test)
測定内容: 2つの順序変数の順位の一致度
値の範囲
適用場面: 1×2 または 2×1 の分割表
検定内容: ある事象が起きる確率が0.5 (50%) かどうかを検定
例1: コイン投げ
例2: 患者の選好
2×2分割表では、行を「群」、列を「イベントあり/なし」として、効果の大きさを測る指標を計算できます。
例: 治療法と合併症
| 合併症あり | 合併症なし | 合計 | |
|---|---|---|---|
| 新治療 | 10 | 90 | 100 |
| 標準治療 | 30 | 70 | 100 |
定義: 「イベントが起きる可能性」の比
計算
解釈: 新治療は標準治療に比べて合併症のオッズが0.26倍 (74%減少)
定義: 「イベントが起きる確率」の比
計算
解釈: 新治療は標準治療に比べて合併症のリスクが0.33倍 (67%減少)
定義: 「イベントが起きる確率」の差
計算
解釈: 新治療により合併症が20%減少する
実行アプリ: 📊 サンプルサイズ計算 (2群の比率の比較) | 検出力計算 (2群の比率の比較)
2×2分割表で「有意差なし (p>0.05)」という結果が出たとき
2つの可能性
1. 本当に差がない 2. 差はあるが、サンプルサイズが足りなくて検出できなかった
検出力: 本当に差があるときに、それを正しく検出できる確率
研究を始める前に「どれくらいのサンプルサイズが必要か」を計算します。
必要な情報
「有意差が出なかったので症例を追加して解析をやり直す」ことは統計的に不適切です。
これは「p値ハッキング」と呼ばれ、偽陽性 (誤った有意差) を増やします。
現代的推奨 (Campbell 2007 / Lydersen 2009) では以下の基準が推奨されています。
「期待度数 5 未満なら Fisher」という古い指針は根拠が薄く、現在は推奨されていません。また Fisher 条件付き正確検定は保守的になりすぎる点に注意してください。
なぜ参考書と内容が異なるのか? 多くの教科書の「期待度数 5 未満なら Fisher」というルールは Cochran (1954) の恣意的な閾値に由来します。Fisher の正確検定は「正確 (exact)」という名前ながら、離散分布の性質により第一種の過誤率が名目水準を大きく下回り、過度に保守的になります。この問題は現代のシミュレーション研究 (Campbell 2007, Lydersen 2009) で示されましたが、教科書への反映が遅れています。詳しくは「Fisher の正確検定を深堀りする」レクチャーをご覧ください。
研究デザインによります。
はい。必ず報告してください。
はい。問題があります。
Reactive stat では、利用者の利便性を優先し、同時に複数の検定を行う場合がありますが、事前に決めた検定方法の結果を採用してください (Reactive stat のこの方針には賛否ありますが敢えて使いやすさを優先しています)。
いいえ。通常の分割表検定は使えません。
いいえ。全く別物です。
はい。特に論文では必須です。
必須要素
1. 分割表そのもの (実測値) 2. 使用した検定名 3. 検定統計量 (χ²値など) 4. 自由度 5. p値 6. 効果量と95%信頼区間 (2×2なら必須)
記述例 「新薬群は対照群に比べて有意に高い成功率を示した (χ²=10.26, df=1, p=0.001, Fisher正確確率検定 p=0.002, オッズ比=4.00, 95%CI: 1.75-9.14)」
問題ありません。
可能ですが推奨されません。
分割表分析の手順
対応のある分割表 (クロス集計表) については、以下のアプリをご利用ください。