境界値で分類

連続変数を指定した数値境界で区切って、新たなカテゴリカルデータを作成します。

  • ページの上部の 対象データ セクションにて、分類する対象となる連続変数を選択します。
    • 選択すると、そのデータのヒストグラムと基礎統計量が表示されます。

  • 数値境界と水準名 セクションにて、境界値を設定し、それぞれの水準名を指定します。
  • 境界値の数は、 ボタンにて増減できます。
    • 境界値には数値を入力してください。
    • 上端が最小、下端が最大となるように設定してください。
  • 各境界値に対応する水準名を入力します。
    • 自動設定 をオンにすると、境界値に合わせた水準名が自動的に設定されます。
      • 以上・以下・より大・未満: 日本語表現
      • ≦・<: 数学記号表現
      • 番号 (1, 2, 3…): 小さい順に整数を設定します。順序のあるカテゴリカル変数を作成したい場合に利用します。
  • 分類されるデータ の欄には、実際にどのようなデータが分類されるかが表示されますので、設定が適切かどうかを判断できます。
    • 「境界値を上の水準に含む」か「境界値を下の水準に含む」を選択し、境界値が上下どちらの水準に含まれるかを指定します。この設定は水準名の自動設定にも反映されます。

  • 新しい列 (カラム) 名 セクションにて、分類結果を格納する新しいカラムの名前を設定します。
  • 既存のカラムに上書きすることはできません。