Wide format から Long Format に変換

解説

データフォーマットの比較

特徴

Wide Format

データが横に広がります。各行が1つの対象 (例: 人や製品) を表します。各列が異なる変数や測定時点を表します。

Long Format

データが「縦長」に並んでいます。各行が1つの観測や測定を表します。変数の種類を示す列と、その値を示す列があります。

具体例 (数学と英語のテスト結果)

Wide Format

名前	数学	英語
太郎	80	75
花子	85	90
次郎	70	80

Long Format

名前	科目	点数
太郎	数学	80
太郎	英語	75
花子	数学	85
花子	英語	90
次郎	数学	70
次郎	英語	80

Wide Format が適切な解析手法の例

対応のある群間検定 (対応のあるt検定、Wilcoxon の符号順位検定など)
- 例: 同じ生徒の数学の点数を、ある教育方法の実施前と後で比較する。
- 理由: 各生徒の前後の測定値が同じ行にあり、個人内の変化を直接比較しやすい。
多変量解析
- 分散分析 (ANOVA; ANalysis Of VAriance)、ロジスティック回帰、共分散分析 (ANCOVA; ANalysis of COVAriance)、重回帰分析、多変量分析、主成分分析 (PCA)、因子分析など。
- 例:
  - 多元配置分散分析 (multi-way ANOVA): 学年、性別、学習方法が試験成績に与える影響を同時に分析する。
  - ロジスティック回帰モデル: 生徒の属性 (年齢、学習時間、出席率) から合格/不合格を予測する。など
- 理由:
  - 複数の変数間の関係を同時に分析し、交互作用や複雑なパターンを検出できる。

Long Format が適切な解析手法の例

対応のない群間検定 (t検定、Mann-Whitney U検定など)
- 例: 異なる2つのクラスの数学の点数を比較する。
- 理由: 各観測値が独立した行にあり、群 (クラス) 間の比較がしやすい。
混合効果モデル
- 例: 生徒の成績に対する、教師の影響と生徒個人の特性の影響を分離して分析する。
- 理由: 個人内変動と個人間変動を同時に扱えるため。

使用方法

カラムの設定

IDカラムの設定

「ID のカラム」セクションで、個体や参加者を識別するためのカラムを選択します
複数のカラムを選択可能です (例: 被験者ID + グループID)
ID列を指定しない場合は、行番号が自動的に振られた ID カラムが生成されます
オプション設定
- 「IDのいずれかが欠損値の場合はデータを除外する」にチェックを入れると、IDに欠損がある行を除外します
- 複数のID列を選択した場合:
  - 「新規に ID カラムを作成する」オプションで、ID列を組み合わせた新しいカラムを生成できます
  - ID列の区切り文字を選択できます (アンダースコア、ハイフン、カンマ、空白)

値のカラムの設定

「値のカラム」セクションで、Long format に変換する対象となるカラムを選択します
複数のカラムを選択可能です
選択したカラムは変数名カラムと値カラムに分割されます
- 変数名カラム: 元のカラム名が値として入ります
- 値カラム: 元のカラムの値が入ります
カラム名の設定
- 変数カラム名: デフォルトは「変数」
- 値カラム名: デフォルトは「値」

未指定カラムの設定

ID列や値のカラムとして指定されなかったカラムは、デフォルトでそのまま保持されます
「指定されなかったカラムのデータを付与する」のチェックを外すと、これらのカラムは除外されます

データの処理

重複IDの処理

複数のID列を指定した場合、ID列の組み合わせに重複があると警告が表示されます。

重複がある場合:
- 重複している組み合わせと該当する行番号が表示されます
- 「続行」または「中止」を選択できます
重複を含むデータの処理:
- 続行を選択した場合: すべてのデータが変換されます
- 中止を選択した場合: 変換が中止されます

欠損値の処理

ID列に欠損値がある場合の処理を選択できます。

「IDのいずれかが欠損値の場合はデータを除外する」オプション:
- チェックあり: 欠損値を含む行は除外されます
- チェックなし: 欠損値を含む行もそのまま変換されます
欠損値の判定:
- null または undefined の値
- データテーブルの欠損値設定で指定された値
- 空白を欠損値として扱う設定が有効な場合は空白文字

出力データ

出力形式

変換後のデータは以下の形式で出力されます:

ID列 (単数または複数)
変数名カラム (元のカラム名)
値カラム (元のカラムの値)
その他の未指定カラム (オプション)

データの利用

変換後のデータは以下の方法で利用できます:

「変換後のデータを統計解析に利用」ボタン: データを統計解析用に設定
「変換後のデータを CSV でダウンロード」ボタン: CSV 形式でダウンロード

アプリ

元データ (Wide format)

変換設定

指定しない場合には、{{ newIdColumnName }} カラムが自動生成され、行番号が振られます

IDのいずれかが欠損値の場合はデータを除外する

警告: 同じID組み合わせのデータが複数存在します。

重複している組み合わせ:

{{ Object.entries(dup.combination) .map(([col, val]) => `${col}: ${val}`) .join(', ') }} が {{ dup.count }} 回出現

変数カラム名:

値カラム名:

値が欠損値の場合はそのデータ行をスキップする

指定されなかったカラムのデータを付与する:

分類内容	値
{{ item.tag }}

データ可視化・探索的分析

名義変数の解析

連続変数の解析

統計的モデリング

クラスタ分析

生存期間の解析

メタアナリシス

検査の正確度

傾向スコアによる解析

比率(割合)のサンプルサイズ

平均値のサンプルサイズ

生存時間のサンプルサイズ

Wide format から Long Format に変換

解説

データフォーマットの比較

特徴

Wide Format

Long Format

具体例 (数学と英語のテスト結果)

Wide Format

Long Format

Wide Format が適切な解析手法の例

Long Format が適切な解析手法の例

使用方法

カラムの設定

IDカラムの設定

値のカラムの設定

未指定カラムの設定

データの処理

重複IDの処理

欠損値の処理

出力データ

出力形式

データの利用

アプリ

{{title}}

データの取り扱い

クラウド R を利用する時のデータ送信

AI による解説を利用する時のデータ送信

チェックされた行が削除対象となります

削除対象の行

データ入力

AI による R コードの解説

R の出力結果

R出力図形

AI による R 出力結果の解説

シートを選択してください

元データ (Wide format)

変換設定

変換後のデータ (Long Format)