メイン コンテンツをスキップする

2つの解析レベルを使って非構造化データから情報を抽出する

このシナリオはTalend Data Management PlatformTalend Big Data PlatformTalend Real-Time Big Data PlatformTalend MDM PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

このシナリオでは、非構造化データから一部の情報を抽出するルールセットを構築する方法について説明します。基本的なANTLRルールを使ってデータをトークン化する方法と、詳細なルールを使ってANTLRによって作成された各トークンを正規表現と照合する方法について説明します。

このシナリオで使うコンポーネントは、以下のとおりです。

  • 非ストラクチャー化データ文字列を作成するtFixedFlowInputコンポーネント。

  • データ文字列から液体の量を抽出するために必要なルールを定義するtStandardizeRowコンポーネント。

  • 出力データを表示するtLogRowコンポーネント。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。