メイン コンテンツをスキップする 補完的コンテンツへスキップ

パターンを設定

このカラム分析では、事前定義されたパターンを使用して、メールおよび電話番号のカラムの内容をそれぞれ、標準のメールおよび米国の電話番号パターンと照合します。これにより、メールと電話番号の内容、ストラクチャー、品質が定義され、標準形式に一致するデータと一致しないデータの割合がわかります。

始める前に

  • Talend StudioProfilingパースペクティブを開いていること。

  • カラム分析が作成済みで、データベースへの接続が定義済みであること。

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで、Emailカラムの横にある[Add pattern] (パターンを追加)をクリックし、[Pattern Selector] (パターン選択)ダイアログボックスを開きます。
  2. [Regex] (正規表現) > [internet] (インターネット)の順に展開し、[Email Address] (メールアドレス)チェックボックスをオンにして、[OK]をクリックしてダイアログボックスを閉じます。

    パターンが[Analyzed Columns] (分析済みカラム)セクションのカラムに追加されます。

  3. Phoneカラムの横にある[Add pattern] (パターンを追加)をクリックし、[Pattern Selector] (パターン選択)ダイアログボックスを開きます。
  4. [Regex] (正規表現) > [phone] (電話)の順に展開し、[US phone numbers] (米国の電話番号)チェックボックスをオンにして、[OK]をクリックしてダイアログボックスを閉じます。

    パターンが[Analyzed Columns] (分析済みカラム)セクションのカラムに追加されます。

  5. [Email Address] (メールアドレス)パターンと[US phone numbers] (米国の電話番号)パターンの横にある[Options] (オプション)をクリックし、[Lower threshold (%)] (下限しきい値(%))フィールドを98.0に設定します。

    パターンにマッチするレコードの数が98%を下回ると、分析結果の値が赤色で示されます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。