メイン コンテンツをスキップする 補完的コンテンツへスキップ

正規表現を使って一致する内容を検索

正規表現を使ってデータの中から特定のパターンを見つけ、興味のある値を分離できます。

このシナリオでは、ISBN番号を含む書籍に関する情報を一覧にしたデータセットで作業を行います。Talend Data Preparationを使用すると、ISBNが有効かどうか、正しいパターンに従っているかどうかを確認できます。[Match pattern] (パターンにマッチ)ファンクションでは、選択した表現とデータを比較できます。

手順

  1. ISBNカラムをクリックしてその内容を選択します。
    ISBNカラムを示した図。
  2. ファンクションリストで[Match pattern...] (パターンにマッチ…)を見つけて選択します。

    メニューが開いたら、検索するパターンを入力します。

  3. [Pattern] (パターン)フィールドのドロップダウンリストから[other] (その他)を選択します。
  4. [Manual pattern] (手動パターン)フィールドの左側のボタンをクリックし、リストからRegexを選択します。
    [パターンにマッチ]フィールドでRegexオプションが選択されている状態。
  5. [Manual pattern] (手動パターン)フィールドに^[ISBN]\{4\}[ ]{0,1}[0-9]\{1\}[-]\{1\}[0-9]\{3\}[-]\{1\}[0-9]\{5\}[-]\{1\}[0-9]{0,1}$と入力します。

    この正規表現は、データセットで特定する必要のあるISBN番号モデルに対応します。

  6. [Submit] (送信)をクリックします。

    ISBN_matchingという新しいカラムが作成され、正規表現で定義されたパターンにマッチする値がtrueとして表示されます。一致しない値はfalseとして表示されます。

    ISBNカラムとISBN_matchingカラムを示した図。

タスクの結果

特定のパターンを検索する正規表現を使用したので、検索に一致する値を特定、分離できます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。