Wide format から Long Format に変換
Long Format と Wide Format の違いと用途
データフォーマットの比較
特徴
Wide Format
|
Long Format
|
具体例 (数学と英語のテスト結果)
Wide Format
名前 | 数学 | 英語 |
---|---|---|
太郎 | 80 | 75 |
花子 | 85 | 90 |
次郎 | 70 | 80 |
Long Format
名前 | 科目 | 点数 |
---|---|---|
太郎 | 数学 | 80 |
太郎 | 英語 | 75 |
花子 | 数学 | 85 |
花子 | 英語 | 90 |
次郎 | 数学 | 70 |
次郎 | 英語 | 80 |
Wide Format が適切な解析手法の例
- 対応のある群間検定 (対応のあるt検定、Wilcoxon の符号順位検定 など)
- 例: 同じ生徒の数学の点数を、ある教育方法の実施前と後で比較する。
- 理由: 各生徒の前後の測定値が同じ行にあり、個人内の変化を直接比較しやすい。
- 多変量解析
- ANOVA、ロジスティック回帰、ANCOVA、重回帰分析、多変量分析、主成分分析 (PCA)、因子分析 など。
- 例:
- ANOVA (多元配置分散分析): 学年、性別、学習方法が試験成績に与える影響を同時に分析する。
- ロジスティック回帰モデル: 生徒の属性 (年齢、学習時間、出席率) から合格/不合格を予測する。など
- 理由:
- 複数の変数間の関係を同時に分析し、交互作用や複雑なパターンを検出できる。
Long Format が適切な解析手法の例
- 対応のない群間検定 (t検定、Mann-Whitney U検定 など)
- 例: 異なる2つのクラスの数学の点数を比較する。
- 理由: 各観測値が独立した行にあり、群 (クラス) 間の比較がしやすい。
- 混合効果モデル
- 例: 生徒の成績に対する、教師の影響と生徒個人の特性の影響を分離して分析する。
- 理由: 個人内変動と個人間変動を同時に扱えるため。
使用方法
カラムの設定
IDカラムの設定
- 「ID のカラム」セクションで、個体や参加者を識別するためのカラムを選択します
- 複数のカラムを選択可能です (例: 被験者ID + グループID)
- ID列を指定しない場合は、行番号が自動的に振られた ID カラムが生成されます
- オプション設定
- 「IDのいずれかが欠損値の場合はデータを除外する」にチェックを入れると、IDに欠損がある行を除外します
- 複数のID列を選択した場合:
- 「新規に ID カラムを作成する」オプションで、ID列を組み合わせた新しいカラムを生成できます
- ID列の区切り文字を選択できます (アンダースコア、ハイフン、カンマ、空白)
値のカラムの設定
- 「値のカラム」セクションで、Long format に変換する対象となるカラムを選択します
- 複数のカラムを選択可能です
- 選択したカラムは変数名カラムと値カラムに分割されます
- 変数名カラム: 元のカラム名が値として入ります
- 値カラム: 元のカラムの値が入ります
- カラム名の設定
- 変数カラム名: デフォルトは「変数」
- 値カラム名: デフォルトは「値」
未指定カラムの設定
- ID列や値のカラムとして指定されなかったカラムは、デフォルトでそのまま保持されます
- 「指定されなかったカラムのデータを付与する」のチェックを外すと、これらのカラムは除外されます
データの処理
重複IDの処理
複数のID列を指定した場合、ID列の組み合わせに重複があると警告が表示されます。
- 重複がある場合:
- 重複している組み合わせと該当する行番号が表示されます
- 「続行」または「中止」を選択できます
- 重複を含むデータの処理:
- 続行を選択した場合: すべてのデータが変換されます
- 中止を選択した場合: 変換が中止されます
欠損値の処理
ID列に欠損値がある場合の処理を選択できます。
- 「IDのいずれかが欠損値の場合はデータを除外する」オプション:
- チェックあり: 欠損値を含む行は除外されます
- チェックなし: 欠損値を含む行もそのまま変換されます
- 欠損値の判定:
- null または undefined の値
- データテーブルの欠損値設定で指定された値
- 空白を欠損値として扱う設定が有効な場合は空白文字
出力データ
出力形式
変換後のデータは以下の形式で出力されます:
- ID列 (単数または複数)
- 変数名カラム (元のカラム名)
- 値カラム (元のカラムの値)
- その他の未指定カラム (オプション)
データの利用
変換後のデータは以下の方法で利用できます:
- 「変換後のデータを統計解析に利用」ボタン: データを統計解析用に設定
- 「変換後のデータを CSV でダウンロード」ボタン: CSV 形式でダウンロード
{{title}}
{{title}}
{{ item.full }}
{{title}}
{{group}}
{{title || 'カラム選択'}}
{{title || 'カラム選択'}}
{{ title }} カテゴリー変数を選択してください。複数選択すると組み合わされます
...(選択肢が多すぎます)
それぞれに設定する値を入力してください。異なる分類に同じ値を設定することもできます。順位の数値を入れれば、順序カテゴリカル変数として扱えるようになります。
分類内容 | 値 | |
{{ item.tag }} |
データの取り扱い
- データインポート
- データの読み込みは、ブラウザ内で完結し、外部へのデータ送信は発生しません。
- データ保持
- 読み込んだデータはブラウザ内に保持されます。
- ブラウザのセッションが終了または全てのタブが閉じられると、保持していたデータは自動的に破棄されます。
- データの安全性
- ブラウザがクラッシュした場合でも、10分経過すれば次回の起動時にデータは安全に消去されます。
- 共用のPCでの使用も考慮し、データの外部漏洩のリスクを最小化しています。
クラウド R を利用する時のデータ送信
- 最小限のデータ送信
- 外部のRサーバーへ送信されるデータは、数値計算に必要な最小限のセットに制限されています。
- 送信データは解析に必要なサブセットのみに限られます。
- ユーザーコントロール下のデータ送信
- 送信前に、どのデータが外部サーバーへ送信されるのか内容を確認することが可能です。
- データの送信はユーザーの操作により行われ、自動的な送信は行いません。
- クラウド R 出力結果の保持
- クラウド R からの出力結果は、将来の自動翻訳や自動解説の機能実現のため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
- 通信経路も全て暗号化していますので、たとえプライバシーに関わる情報が含まれていたとしても、通常は漏洩する恐れはありません。
AI による解説を利用する時のデータ送信
- 最小限のデータ送信
- 外部のAIサーバーへ送信されるデータは、クラウド R の出力結果と、用いた統計手法の徐放です。
- ただし、クラウド R の出力結果に連続した数値データが含まれる場合は、AI にデータ形式を認識させる目的で、連続データの最初の行のみを送信します。
- クラウド R 出力結果の保持
- AI による解説内容は、将来の品質向上などのため、サーバーがデータベースに保持します。
- その際に、送信者の情報や、計算元となるデータなど、プライバシーに関わる情報は保持しません。
新しい列 (カラム) 名:
ここで設定した値に完全一致するデータを欠損値として扱います。
新しい列 (カラム) 名:
Reactive stat において、統計データの変数は、通常の数値や文字列として扱われます。 したがって、日付や時間の概念は直接的にはサポートされていません。
統計計算を行う際には、日付や時間の差分を数値として事前に用意しておく必要があります。
計算結果プレビュー:
新しい列 (カラム) 名:
チェックされた行が削除対象となります
データがありません
欠損値を含むカラムを選択
カラムを選択
削除対象の行
削除対象の行はありません
データ入力
{{ errorMessage || dataStatus + 'です'}}
設定とオプション
データがありません
R の出力結果
R出力図形
AI による R 出力結果の解説
変換設定:
(
変換元の単位:
変換先の単位:
)
変換結果プレビュー:
新しい列 (カラム) 名:
計算式の入力:
数式:
- データ: カラム名 (列名) をそのまま記述するか、"列名" のようにダブルクォートで挟んで指定
- 算術演算子: +, -, *, /, ()
- 基本関数: abs(), sqrt(), pow(), exp(), log(), log10()
- 三角関数: sin(), cos(), tan(), asin(), acos(), atan()
- 丸め関数: round(), floor(), ceil()
体重 / pow(身長, 2)
, "体重" / ("身長" * "身長")
利用可能なカラム:
{{ column }}
変換結果プレビュー:
{{ errorMessage }}
新しい列 (カラム) 名:
区切り文字の選択:
欠損値の処理:
プレビュー:
{{ preview }}
新しい列 (カラム) 名:
確認
データがありません
元データ (Wide format)
変換設定
指定しない場合には、{{newIdColumnName}}
カラムが自動生成され、行番号が振られます
警告: 同じID組み合わせのデータが複数存在します。
重複している組み合わせ:
-
{{ Object.entries(dup.combination) .map(([col, val]) => `${col}: ${val}`) .join(', ') }}
が {{ dup.count }} 回出現
変換後のデータ (Long Format)
データがありません