メイン コンテンツをスキップする 補完的コンテンツへスキップ

データを標準化するための解析ルールを定義する

手順

  1. tStandardizeRowコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
    このコンポーネントは、非ストラクチャー化入力フローの標準化に必要なルールを定義し、ブランド、範囲、色、および単位をXML形式で生成するのに役立ちます。
  2. [Column to parse] (解析するカラム)リストから、Long_Descriptionを選択します。
  3. [Standardize this field] (このフィールドを標準化)チェックボックスをオンにします。
  4. ルールを次のように定義します。
    1. [Conversion rules] (変換ルール)テーブルで[+]ボタンをクリックして、ルールの定義に必要なカラムを追加します。

      このシナリオでは、[Index] (インデックス)タイプのルールに焦点を当てています。上記のキャプチャーで定義されている他のルールタイプの詳細な例は、他のtStandardizeRowシナリオをご参照ください。

    2. ブランド範囲色の3つのルールを定義します。
    3. [Type] (タイプ)リストから[Index] (インデックス)を選択し、[Value] (値)フィールドに、生成したインデックスのコンテキスト変数を入力します。
      コンテキスト変数の作成と使用方法は、コンテキストと変数を使用をご覧ください。
    4. [Search mode] (検索モード)リストから、[Match exact] (完全一致)を選択します。検索モードは[Index] (インデックス)ルールにのみ適用されます。

      [Match exact] (完全一致)モードを使って、tSynonymOutputコンポーネントで生成したブランド、範囲、および色のインデックス文字列に完全に一致する文字列のみを入力フローから抽出します。利用可能な検索モードの詳細は、インデックスルールの検索モードをご覧ください。

  5. [Generate parser code in Routines] (ルーチン上の分析コードを生成する)ボタンをクリックして、 Profiling パースペクティブの[DQ Repository] (DQリポジトリー)ツリービューにある[Routines] (ルーチン)フォルダーの下にコードを生成します。
    このステップは必須です。このステップを行わないとジョブは実行されません。
  6. [Advanced settings] (詳細設定)ビューで、[Output format] (出力形式)エリアでデフォルトで選択されているオプションをそのまま使います。
    [Max edits for fuzzy match] (ファジーマッチの最大編集)は、デフォルトで1に設定されています。
  7. tLogRowコンポーネントをダブルクリックし、[Basic settings] (基本設定)ビューでコンポーネント設定を定義します。
  8. [Mode] (モード)エリアで、[Table (print values in cells of a table)] (テーブル(テーブルのセルの出力値))オプションを選択します。
    このコンポーネントは、分析できず、どのインデックス文字列とも一致しなかった入力フローからのトークンを表示します。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。