tPatternMasking
特定のパターンに従うデータをマスキングします。また、必要に応じて元のデータを規則的に変換できます。
異種データをマスキングする必要がある場合は、tDataMaskingコンポーネントを使用します。詳細は、tDataMaskingをご覧ください。
tPatternMaskingは、パターン固有のデータや汎用データを指定範囲の日付や数値、または名前付きの値のセットからのランダムな文字に置換します。機密性の高い実際のデータを表示することが勧められない場合、実データは保護され、代替データが使用できるようになります。
実際のデータとそっくりなデータで一貫性を保ちつつ、テストやトレーニングなどの目的で使用できます。マスキングを必要とする最も一般的なデータ型として、個人を特定できる情報(PII)または機密個人データ(SPD)を含むデータがあります。
tPatternMaskingは、データセットを行単位で読み取り、データフィールドで定義したデータマスキングオペレーションを実行した後で、ストラクチャー的に類似しているものの本物でないバージョンのデータを作成します。
- コンポーネントは、入力内のスペース、スラッシュ(/)、ダッシュ(-)、ポイント(.)を区切りとして識別します。
- コンポーネントは、マスキングされた出力内の入力値のパターンを維持します。
- コンポーネントは、各入力行について1行を生成します。
たとえば、615/67/7489をマスキングした出力の例として、379/48/1789が考えられます。
定義したパターンに入力データが一致しない場合、tPatternMaskingはnullを出力します。
ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。