2群の比率の差の信頼区間
解説
この統計手法は、2つのグループ間で発生する特定の事象 (例: 病気の罹患率、製品の不良率など) の比率が、本当に異なるのか、それとも偶然の結果として異なるのかを判断するためのものです。
具体的な例:
2つの異なる治療方法AとBの効果を検討する場合を考えます。
-
データの収集:
100人の患者に治療Aを施し、そのうち10人が回復。別の300人の患者に治療Bを施し、そのうち50人が回復。
-
各治療の回復率の計算:
治療Aの回復率は \( \frac{10}{100} = 0.10 \) (10%)、治療Bの回復率は \( \frac{50}{300} = 0.1667 \) (16.67%)
-
比率の差の計算:
治療AとBの回復率の差は \( 0.10 - 0.1667 = -0.0667 \) (-6.67%)
-
信頼区間の計算:
2群の比率の差の95%信頼区間を計算します。この計算には、各治療群のサンプルサイズと回復率を用いて、標準誤差とZ値を計算し、信頼区間を導きます。
ここでは、信頼区間は -13.9% ~ 0.569% となりました。
-
結論:
95%の信頼区間が -13.9% ~ 0.569% なので、治療Aと治療Bの回復率の差は、95%の確率でこの範囲内にあると言えます。
この信頼区間には 0% が含まれているため、有意な差があるとは言えない、という結論になります。
同様に2群の比率を比較する手法として、2群の比率の比の信頼区間があります。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
欠損値を含むカラムを選択
カラムを選択
削除対象の行
元データ
id | カラム1 | カラム2 |
---|---|---|
1 | A | B |
2 | C | D |
変換後のデータ
id | データ名 | 値 |
---|---|---|
1 | カラム1 | A |
1 | カラム2 | B |
2 | カラム1 | C |
2 | カラム2 | D |
{{ replaced_script }}
R の出力結果
{{ rResult }}
R output figures
AI による R 出力結果の解説
データ
結果
1. まず、各グループの比率を計算します。
\[ p_1 = \frac{\text{event_group1}}{\text{sample_size_group1}} \]
\[ p_2 = \frac{\text{event_group2}}{\text{sample_size_group2}} \]
2. 次に、2つの比率の差の標準誤差を計算します。
\[ SE = \sqrt{\frac{p_1(1-p_1)}{\text{sample_size_group1}} + \frac{p_2(1-p_2)}{\text{sample_size_group2}}} \]
3. 与えられた信頼水準に基づいて、Z値を求めます。例えば、95%の信頼水準の場合、Z値は約1.96(正規分布の両側5%点に対応)。
4. 信頼区間の上限と下限を計算します。
\[ \text{Lower limit} = (p_1 - p_2) - Z \times SE \]
\[ \text{Upper limit} = (p_1 - p_2) + Z \times SE \]