tJapaneseNumberNormalize
日本語の数字(漢数字)をアラビア数字に正規化します。
日本語の数字は、漢字とアラビア数字と句読点を組み合わせて書かれていることがよくあります。日本語の番号を正規化すると、それらの番号をより容易に検索できるようになり、照合精度が向上します。
たとえば、tJapaneseNumberNormalizeは3.2千を3200に正規化します。これにより、日本語の数字「3.2千」とアラビア数字の対応語「3200」を一致させることができます。
ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。