Reactive stat 開発のコンセプト
ブラウザのみで利用でき、データの保護に配慮された、マニュアル本の要らない統計ソフトを提供したい。
統計処理が簡単に誰でもできるようになるプラットフォームを作りたい。
誤った手法が適用されることがないよう、具体例を示し、サンプルデータで簡単に試せるようにしたい。
そのような考えから、Reactive stat 開発に至りました。
Reactive stat 提供の目的
多数の医療関連の学会で、膨大な数の学会発表が日々行われています。 それらの中には、正しいとは言えない統計解析がなされているものも見受けられます。 全ての医療者が統計学をしっかり学んでいるわけではなく、身近に専門家もいないのですから、当然と言えば当然です。
また、統計解析に手間取っているうちに時機を逸して発表を諦めた、という身近な例がありました。
専門医の取得や維持のために学会発表や論文発表を求められますが、準備にかける時間は多忙な業務後に睡眠時間を削って作り出すしかない、という話も聞きます。
これらを解決するため、以下のようにすると良いと考えました。
- できるだけ準備の手間を減らし、統計処理をしながらその内容を学ぶことができるようにする。
- 具体例を用意し、どんなデータにどのような設定をすればいいのかを迷わないようにする。
Reactive stat はその一つの解決策です。
- 全てがブラウザで完結するため、データファイルさえあれば他に何も要りません。
- 全ての手法にはその説明が書いてあり、多くには具体例が示されています。
- ワンクリックで、サンプルデータと設定を呼び出すことができ、実際の例を試すことができます。
- マニュアル本の購入や、インストールなど事前の準備は不要で、Windows でも Mac でも、タブレット端末でも動作します。
- 日本語のデータでも問題なく処理できます。
こうして、Reactive Stat は学会発表や論文執筆の準備にかかる時間を短縮し、より重要な部分に集中できるようにすることを目指しています。
Reactive stat が、少しでも時間短縮に繋がって、皆様のお役に立てればありがたいと思います。
もちろん、医療以外の領域においてもご活用いただけます。
統計ソフトの信頼性と操作性の両立
統計ソフトの信頼性は極めて重要です。 なぜなら、その結果によって判断が左右されてしまうからです。
そこで、Reactive stat は R (統計計算とグラフィックスのためのプログラミング言語およびソフトウェア環境) を利用して信頼性を担保することにしました。
ただし、「インストール不要でブラウザ上で完結する」という利便性を保持することを重視し、R をクラウドサーバー上で動かすことにしました。 その場合にはリアルタイム性が損なわれてしまいます。 また、意図せずデータがインターネットに送信されていることも避けなくてはなりません。
そこで、Reactive stat では、内部でも統計処理を行いつつ、並行して R のスクリプトを用意し、ユーザーが明示的にそれを実行するというアプローチを選択しました。 その結果、統計ソフトとしての信頼性と操作性の両立を実現しました。
データに含まれる個人情報の保護
特に医療分野では、データに個人情報またはそれに近い情報が含まれている場合があります。
Reactive stat は、共用のPCやタブレット端末でも実行できるようウェブアプリにすると同時に、個人情報保護にもこだわりました。
統計処理は、信頼性の高い R にてサーバー上で実行できますが、いったんブラウザ内部で前処理して個人情報を含まない最小限のデータとして、ユーザーが確認してから、サーバーに送信するという工夫をしています。 読み込んだデータファイルの内容をいきなり全てサーバーにアップロードしてしまうようなことがありません。 そのため、データに含まれる個人情報は確実に保護されます。
また、ブラウザに残った情報はセッションの終了後に自動的に消去されますし、ログアウトにて明示的に消去することもできます。
例えば、jamovi は洗練されたインターフェースを持つ斬新なソフトウエアで、統計処理には R を用いていますが、データを全てサーバーに送信してから、サーバー上で処理を行っていますので、データ内部の個人情報はだだ洩れです。 必ず、事前に個人情報を除去しておく必要があります。
ウェブアプリの利用には十分な注意が必要です。
使いやすさと学習のバランス
「操作が簡単な統計ソフトは、素人が適当なデータを入れてマウスでクリックしてみて、有意差が出たら意味もわからずそれを学会で発表してしまう。 だから簡単な統計ソフトはよろしくない、簡単すぎることは害悪である。 むしろコマンドラインインターフェースで、事前にしっかり学習してからでないと使えない敷居の高いソフトの方が良い、」という意見があります。
もっともな意見だと思います。 安易な統計結果は、誤ったメッセージに繋がりかねません。
しかし、事前にしっかり学習することは重要と思いますが、多忙な医療者にそれを期待することには無理があります。 相談できる統計家がいるのはむしろ珍しいでしょう。
敷居の低い統計ソフトを簡単に使いながら、同時に学ぶことで、思い込みや理解不足による不適切な適用を減らすというアプローチが、より現実的な解決策かと良いと思います。
Reactive stat はそのような考えに基づいています。
ユーザーの操作に応じてリアルタイムで結果を表示し、直感的な理解を深めるように設計されています。
さらに、詳細な説明とサンプルが豊富に用意されています。
むしろ、解説書の一部が統計アプリになっている、というイメージです。
一度使ってみていただければ、そのコンセプトをご理解いただけると信じています。
対象とするデータのサイズ
Reactive stat は、リアルタイムでのフィードバックを実現していますので、あまり巨大なデータを扱うようには設計されていません。 入力項目の変化に応じて、リアルタイムに結果を表示するため、計算量が膨大になるからです。
1,000件を超えてくると、もたつきを感じるようになると思います。 10,000件を超えるデータを扱うことは可能ですが、統計手法によってはお勧めできません。
また、R での計算もクラウド経由になるので、タイムラグが生じてしまいます。
巨大なデータを扱う場合には、ローカルの PC にインストールして使うタイプの統計ソフトをご利用いただくのが良いと考えております。 実際のところ、ほとんどの臨床データは1000件以下ですので、問題になることは少ないと思います。