tDataMasking
機密性の高い実際のデータを表示することが勧められない場合に、元のデータをランダムな文字または数字で隠し、実際のデータを保護しながら、同様の効果を得るために使用します。
tDataMaskingは、データセット行を行単位で読み取った後に、データフィールドに特定のファンクションを適用して、ストラクチャー的に類似しているものの本物でないバージョンのデータを作成します。各入力行について1行が生成されます。
テストやトレーニングなどの目的でファンクション的な代替品を使用できるようになります。個人を特定できる情報(PII)または機密個人データ(SPD)を取り扱う時に、このデータを保護し、マスクできます。
機密データの定義は幅広く、国や組織によっても異なります。基本的に、機密データには関係する人物や会社を危険にさらしかねない個人情報やビジネス情報を含まれます。
たとえば、一般にクレジット/デビットカードのデータは機密データとして扱われます。機密データとは、個人や居場所を特定できる情報のことです。機密性の高い個人情報には以下が含まれますが、これらに限定されません: 姓名、メールアドレス、住所、ソーシャルセキュリティー番号(SSN)、クレジットカード番号、銀行口座番号、人種、性別、生年月日、給与および位置情報と時間の組み合わせ。
機密性の高い個人情報の詳細は、[Personally Identifiable Information] (個人を特定できる情報)をご覧ください。
さらに、ビジネス機密データには、企業秘密、買収計画、財務データ、顧客情報などが含まれることがあります。
ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。