メイン コンテンツをスキップする

tPatternMasking

特定のパターンに従うデータをマスキングします。また、必要に応じて元のデータを規則的に変換できます。

異種データをマスキングする必要がある場合は、tDataMaskingコンポーネントを使用します。詳細は、tDataMaskingをご覧ください。

tPatternMaskingは、パターン固有のデータや汎用データを指定範囲の日付や数値、または名前付きの値のセットからのランダムな文字に置換します。機密性の高い実際のデータを表示することが勧められない場合、実データは保護され、代替データが使用できるようになります。

実際のデータとそっくりなデータで一貫性を保ちつつ、テストやトレーニングなどの目的で使用できます。マスキングを必要とする最も一般的なデータ型として、個人を特定できる情報(PII)または機密個人データ(SPD)を含むデータがあります。

tPatternMaskingは、データセットを行単位で読み取り、データフィールドで定義したデータマスキングオペレーションを実行した後で、ストラクチャー的に類似しているものの本物でないバージョンのデータを作成します。
  • コンポーネントは、入力内のスペース、スラッシュ(/)、ダッシュ(-)、ポイント(.)を区切りとして識別します。
  • コンポーネントは、マスキングされた出力内の入力値のパターンを維持します。
  • コンポーネントは、各入力行について1行を生成します。

たとえば、615/67/7489をマスキングした出力の例として、379/48/1789が考えられます。

定義したパターンに入力データが一致しない場合、tPatternMaskingnullを出力します。

ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。

デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。