tStandardizeRow
受信データを個別のXMLまたはJSONデータフローで正規化して、ルール準拠データを非準拠データから分離または標準化します。
tStandardizeRowは、前のコンポーネントから受け取ったデータフローをトークン化し、ユーザー定義のパーサールールを適用してデータを分析します。この分析に基づいて、このコンポーネントは、分析されたデータを正規化して別のデータフローに書き込み、ユーザー定義のルール名を使ってタグ付けします。生データは変更されません。
標準化オプションは出力フローに補足カラムを追加し、正規化されたデータがそこで標準化されます。
JavaライブラリーANTLRは、着信データを解析してトークン化するために使われます。ANTLRの詳細は、次のサイトをご覧ください。
ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。
情報メモ注: Talend Studio 7.2以前のバージョンで作成されたインデックスはアップデートが必要です。移行プロシージャーの場所はTalend Studioインストールによって異なります:
- インストラーがある場合は、/addons/scripts/Lucene_Migration_Tool/README.mdとなります。
- インストーラーがない場合: ライセンスメールで、Migration tool for Lucene Indexes from version 4 to version 8のリンクをクリックしてください。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。