AI から統計処理の提案を受ける
残念ながら、決して満足のいくレベルには到達できていません。
しかし、どんどん進化している AI ですから、近い将来には実用的になるはずです。
説明
統計解析を行うとき、データファイルがあって何を調べたいかは決まっているけど、どの統計手法を使うのが良いかわからないことがあると思います。
周囲に統計に詳しい人がいればいいですが、なかなかそうもいきません。
そのようなときに、AI に質問すればもしかすると適切な手法を考えてくれるのではないかと期待して作ったのがこのツールです。
利用法
データを読み込んで、解析対象となるカラムを選択してから、 AI へのプロンプト (指示) を自然言語で入力してください。
例えば、
"身長" と "体重" に相関関係があるかを知りたい
"T Stage", "N Stage", "遠隔転移", "腫瘍サイズ", "組織型", "ER", "PR" から "転移リンパ節個数" が予測できるか調べたい
検査方法には "従来法", "改良法", "同等法" があるが、 "疾患" を診断する能力を調べ、その優劣を決めたい。
などです。 このとき、解析対象となるカラム名を “” で囲んだ部分は、下図のように、わかりやすく色付き表示になります。
AI による提案の例
このような形で提案してきます。 統計手法のキーワードはリンクになっていて、クリックするとそのページが開くようになっています。
AI に送信されるデータ
以下のデータを AI に送信します。 個人情報が送られることはありません。
- 読み込んだデータの特徴量 (サンプル数、平均値、中央値、などなど)
- Reactive stat で可能な統計処理のリスト
- ユーザーからの自然言語での指示
- 統計処理の目的を具体的な指示を与えてください
生データを送ると負荷が膨大となりコストが跳ね上がりますし、処理時間もかかります。
かといって提案の質が大きく改善するわけではありません。
さらに、万が一にも、個人情報が送られてはなりません。
そのような理由から、生データはAIに渡しておりません。
利用制限
ご利用にはログインが必要です。 また、未ライセンスの状態では、AIへの質問は1日に10回までに制限されております。
AI へ送信された内容と AI からの回答は、EMUYN にてログイン情報と紐づけない形で記録し、性能向上のための資料として活用させていただく予定です。 予めご了承ください
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
チェックされた行が削除対象となります
欠損値を含むカラムを選択
カラムを選択
削除対象の行
データ入力
{{ replaceNewlinesInStrings(replacedScript) }}
R の出力結果
{{ rResult }}
R出力図形
AI による R 出力結果の解説
解析したいデータ
設定
AI による提案
ご質問にお答えします