データ生成ファンクション
入力データとは異なる出力データを生成できます。
ファンクション | ランダム生成 | 一貫した生成 | 全単射生成 | 入力データの検証 |
---|---|---|---|---|
[Generate from pattern] (パターンから生成) | Yes | 不可 | なし | なし |
[Generate Uuid] (UUIDの生成) | Yes | 不可 | なし | なし |
シーケンスの生成 | Yes | 不可 | なし | なし |
[Generate from file/list] (ファイル/リストから生成) | Yes | あり | 不可 | なし |
パターンから生成
オプション | 説明 |
---|---|
追加パラメーター | このファンクションには追加パラメーターが必要です。 追加パラメーターは、次のルールに従うパターンです。
その他のすべての文字は、そのまま生成された値にコピーされます。 サポートされる文字タイプと関連するUnicode範囲は、マスキングコンポーネントでのデータマスキングファンクションをご覧ください。 次の構文を使用して、番号付き前方参照(\\<number>)を使用することもできます: <pattern>\\<number>,<group1>,<groupN>
パターン(A、a、9、H、h、K、k、C、G)で使用されている文字を、生成値と同じようにコピーする場合は、前方参照を使用します。 |
パターンにコンマ(,)が使用されている場合、このファンクションは正しく機能しません。
- aの文字はランダムなラテン文字の小文字に置き換えられます。
- sの文字は生成された出力でマスクされません。
- \\2は、2番目のコンマ(,)の後ろにあるグループ、@talend.comを呼び出します。
入力値 | 追加パラメーター | マスク値の例 |
---|---|---|
A26 | "aaaass\\2,@gmail.com,@talend.com" | hjdfss@talend.com |
- \\3は、3番目のコンマ(,)の後ろにあるグループ、aを呼び出します。
- 9はランダムな数字でマスクされています。
入力値 | 追加パラメーター | マスク値の例 |
---|---|---|
A26 | "\\39999,D,Z,a" | a4825 |
[Generate UUID] (UUIDの生成)
このファンクションは、ランダムに生成された汎用一意識別子(UUID)で入力値をマスクします。
このファンクションは、Javaが提供するUUID.randomUUID()メソッドを使います。このJavaメソッドはシードを使いません。つまり、ジョブを2度実行すると、ファンクションは異なるUUIDを生成します。
このファンクションは文字列に適用されます。
このファンクションには追加パラメーターは不要です。
次の例のマスク値は、ランダムに生成されたUUIDです。
入力値 | マスク値の例 |
---|---|
A26 | 28e92000-aafa-4ec3-bd56-240f192a4a8c |
シーケンスを生成
このファンクションは、追加パラメーターを返し、各行に対してこの数値を1増加させます。
このファンクションは日付以外のすべてのデータ型(Integer、Long、Strings、その他)に適用できます。
オプション | 説明 |
---|---|
追加パラメーター | このファンクションには追加パラメーターが必要です。 追加パラメーターは数字である必要があります。 追加パラメーターが数値でない場合は、0に設定されます。 |
入力値 | 追加パラメーター | マスク値の例 |
---|---|---|
21 A48 |
"0" | 0 1 |
ファイル/リストから生成
このファンクションは、入力値をユーザー定義の値の1つにランダムに置換します。
このファンクションは、文字列または数値のデータ型に適用されます。
オプション | 説明 |
---|---|
メソッド | [Randomly] (ランダム)メソッドでは、値がリスト(またはファイル)からランダムに選択されます。その結果、2つの類似する入力値が異なる入力値でマスクされる場合があります。 [Consistently] (一貫性)メソッドでは、類似する入力値が2つあれば、必ず同じ出力値でマスクされます。 [Consistently] (一貫性)メソッドを使う場合、重複が生成される確率は次の式を使って計算できます。
ここで、Pは重複を生成する確率であり、Nは入力データサイズであり、Kはパラメーターとして指定された入力リストのサイズです。 このアプローチを使用して、グループ内で同じ値を共有するペアを見つける確率を計算できます。 たとえば、n人のグループで、2人の誕生日が同じである確率は次のとおりです。
|
追加パラメーター | このファンクションには追加パラメーターが必要です。 追加パラメーターは次の場合があります。
値は文字列型で保管し、コンマで区切って指定する必要があります: "item1, item2, item3, etc."。このファンクションは、Javaから提供されているhashCode()メソッドを使ってリストからエレメントを選択します。 Apache Sparkバージョンのコンポーネントを使用する場合は、ファイルパスを次のように設定します。
フォルダーへのパスはサポートされていません。 追加パラメーターが設定されていない場合、ファンクションは空の文字列または0を返します。 |
次の例では、マスク値は追加パラメーターとして設定された値の1つです。
入力値 | メソッド | 追加パラメーター | マスク値の例 |
---|---|---|---|
21 | Randomly | "help,documentation" | help |