データ値のシャッフルによる実際の機密データの使用制限
tDataShufflingコンポーネントを使用すると、機密情報をシャッフルして別の行の同じカラムの他の値に置き換えることができ、テストやトレーニングなどの目的で本番データを安全に使用できるようになります。
このシナリオはTalend Data Management Platform、Talend Big Data PlatformTalend Real-Time Big Data Platform、Talend MDM PlatformTalend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricにのみ適用されます。
- tFixedFlowInputコンポーネントは、クレジットカード番号を含む個人データを生成するために使用します。
- tDataShufflingは、元の値を同じカラムの別の行の他の値に置き換えます。
- tFileOutputExcelコンポーネントは、シャッフルされたデータセットを出力します。
前提条件: 機密性の高いデータの高度な使用制限
データをシャッフルする場合でも、機密データをマスキングすることをお勧めします。また、データをシャッフルする際はカラム間の関係を考慮し、元のデータセットを再構築できないようにすることも忘れるべきではありません。
このシナリオでは、姓と名がグルーピングされていますが、メールアドレスは同じグループに含まれていません。したがって、[email] (メール)カラムは[lname] (姓)カラムと[fname] (名)カラムに関連しません。[email] (メール)カラムには通常、姓と名に関する情報が含まれているため、攻撃者は元のデータを再構築するのに利用できてしまいます。
また、[address1] (住所1)、[city] (市区町村)、[email] (メール)のカラムはどのグループにも含まれていないため、シャッフルされていません。これにより、たとえばRobert Damstraさんが1619 Stillman Court, Lynnwoodに住んでいることが推測できてしまうことを意味しています。
-
実際のクレジットカード番号を使用しないようにするため、tDataMaskingコンポーネントを使用してクレジットカード番号をマスキングできます。
-
メールアドレスで顧客が特定されないようにするため、tDataMaskingコンポーネントを使用してメールアドレスをマスキングできます。
-
実際の住所を読み取られにくくするために、[address1] (住所1)と[city] (市区町村)カラムを他のグループに追加できます。
ジョブを設定
手順
- [Palette] (パレット)からtFixedFlowInputコンポーネント、tDataShufflingコンポーネント、tFileOutputExcelコンポーネントをデザインワークスペースにドロップします。
- [Main] (メイン)リンクを使って3つのコンポーネントを接続します。