数値正規化
数値正規化機能は、データセット内の様々な形式で表現された数値を標準的な半角数字形式に変換します。
数値正規化機能の使用方法
元データの列 (カラム) 選択
- ページ上部の「元データの列」セクションから、正規化したい数値データの列を選択します。
変換結果プレビュー
選択された列の変換結果がリアルタイムでプレビュー表示されます。
新しい列 (カラム) 名の設定
- 変換結果を格納する新しい列の名前を設定します。
- 既存の列名との重複は許可されません。
対応する数値形式
基本的な数値形式
- 半角数字(0-9)
- 負の数(-記号付き)
- 小数点を含む数値
- 指数表記(例:1.23e4)
日本語形式
- 全角数字(0-9)
- 漢数字(一、二、三など)
- 位取り漢数字(千、万、億など)
- 全角記号(.、−など)
特殊形式
- ローマ数字(I, V, X, L, C, D, M)
- ステージ表記(Stage IV など)
- T付き数字(T123 など)
- ハイフン区切り数字(123-456-789)
Unicode形式
- 全角ギリシャ数字(Ⅰ, Ⅱ, Ⅲ, Ⅳ, Ⅴ, Ⅵ, Ⅶ, Ⅷ, Ⅸ, Ⅹ, Ⅺ, Ⅻ)
- 丸囲み数字(①-⑳, ㉑-㊿)
- 黒丸囲み数字(⓿-⓴)
- 括弧付き数字(⑴-⒇)
変換例一覧
以下の表は、代表的な入力パターンとその変換結果を示しています。各カテゴリごとに実際の変換結果を確認できます。
入力パターン | 変換結果 | 説明 |
---|---|---|
123 | 123 | 基本的な半角数字 |
123 | 123 | 全角数字 |
-123.45 | -123.45 | 負の小数 |
1.23e4 | 1.23e4 | 指数表記(小文字) |
4.56E3 | 4.56e3 | 指数表記(大文字) |
1.23e-4 | 1.23e-4 | 負の指数表記 |
.123 | .123 | 先頭小数点 |
一二三 | 123 | 基本的な漢数字 |
千二百三十四 | 1234 | 位取り漢数字 |
一億二千三百四十五 | 100002345 | 大きな漢数字 |
¥12,345 | 12345 | 円記号とカンマ |
$1,234.56 | 1234.56 | ドル記号とカンマ付き小数 |
T123 | 123 | T接頭辞付き数字 |
Stage IV | 4 | ステージ表記 |
Ⅰ | 1 | 全角ギリシャ数字 |
Ⅻ | 12 | 全角ギリシャ数字(最大) |
Stage Ⅳ | 4 | ステージ(全角ギリシャ数字) |
①②③ | 123 | 丸囲み数字(連続) |
㊱㊲㊳ | 363738 | 大きな丸囲み数字 |
❶❷❸ | 123 | 黒丸囲み数字 |
⑴⑵⑶ | 123 | 括弧付き数字 |
第Ⅲ章 | 3 | 文中の全角ギリシャ数字 |
利用上の注意点
- 漢数字は「兆」「億」「万」などの位取り表現に対応しています
- 全角の記号(.,−)は対応する半角記号に変換されます
- 通貨記号は除去され、数値部分のみが抽出されます
- 前後のスペース(全角・半角とも)は無視されます
- 複数の数値が含まれる場合は最初に見つかった有効な数値が採用されます
- 無効な入力の場合は空文字列が返されます
- Unicode数字は連続した数字として処理されます(例:⑩⑪ → 1011)
注意事項と制限
数値として認識されなかったデータは、空白 “”
となります。