メイン コンテンツをスキップする

tStandardizeRow

受信データを個別のXMLまたはJSONデータフローで正規化して、ルール準拠データを非準拠データから分離または標準化します。

tStandardizeRowは、前のコンポーネントから受け取ったデータフローをトークン化し、ユーザー定義のパーサールールを適用してデータを分析します。この分析に基づいて、このコンポーネントは、分析されたデータを正規化して別のデータフローに書き込み、ユーザー定義のルール名を使ってタグ付けします。生データは変更されません。

標準化オプションは出力フローに補足カラムを追加し、正規化されたデータがそこで標準化されます。

JavaライブラリーANTLRは、着信データを解析してトークン化するために使われます。ANTLRの詳細は、次のサイトをご覧ください。

http://www.antlr.org/

ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。

情報メモ注: Talend Studio 7.2以前のバージョンで作成されたインデックスはアップデートが必要です。移行プロシージャーの場所はTalend Studioインストールによって異なります:
  • インストラーがある場合は、/addons/scripts/Lucene_Migration_Tool/README.mdとなります。
  • インストーラーがない場合: ライセンスメールで、Migration tool for Lucene Indexes from version 4 to version 8のリンクをクリックしてください。

デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。