メイン コンテンツをスキップする
補完的コンテンツへスキップ
Qlik.com
Community
Learning
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
閉じる
ドキュメント
Qlik Talend ドキュメンテーション
リリース ノート
インストールとアップグレード
データ統合
管理と実行
データ品質とガバナンス
アプリケーションと API 統合
追加のリソース
API ドキュメンテーション ポータル
セキュリティ ポータル
Talend アーカイブ
Qlik ヘルプ
Getting Started
Getting started with Talend cloud
Talend Cloud
Talend Cloud API Designer
Talend Cloud Data Inventory
Talend Cloud Data Preparation
Talend Cloud Data Stewardship
Talend Cloud Pipeline Designer
Talend Cloud API Services Platform
Getting started with Talend on premises
Talend Data Fabric
Talend Data Preparation
Talend Data Stewardship
Qlik ヘルプに移動
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
検索
ヘルプを検索
メニュー
閉じる
ヘルプを検索
新しくアーカイブされたコンテンツ: Talend MDM、Talend Data Catalog 8.0、Talend 7.3 は、2024 年にサービス提供が終了しました。これらのドキュメントは Talend アーカイブ ページに移動され、コンテンツの更新は行われなくなりました。
お知らせバナーを閉じる
こちらにフィードバックをお寄せください
Talend Components
Data Qualityのコンポーネント
Data privacy
Data privacyのシナリオ
入力フローからの複製データの生成
複製データの設定
このページ上
手順
手順
tDuplicateRow
をダブルクリックして
[Basic settings] (基本設定)
ビューを表示し、コンポーネントプロパティを定義します。
[Edit schema] (スキーマを編集)
ボタンをクリックして入力および出力カラムを表示し、必要に応じて出力スキーマに変更を施します。
このコンポーネントの出力スキーマには、読み取り専用カラム
ORIGINAL_MARK
が1つ含まれています。レコードが元レコードまたは複製レコードである場合、このカラムは
true
と
false
によって識別されます。元レコードは複製の各グループに1つのみです。
[Percentage of duplicated records] (複製レコードの割合)
フィールドに、出力フローに含める複製行の割合を入力します。
[Distribution of duplicates] (複製の分布)
エリアで、複製の生成に使用する
ベルヌーイ分布
(確率論)を選択します。各グループに含める複製レコードの平均数を設定するために使われます。
[Modifications] (変更)
テーブルの下にある[+]ボタンをクリックして、テーブルに4つの行を追加します。
このテーブルでは、特定のカラムで変更する値、および複製の生成のためにそれらの値を変更する方法を定義できます。
[Input Column] (入力カラム)
フィールドで、複製を生成する入力フローのカラムを選択します。この例では、
[Name] (名前)
、
[City] (市区町村)
、
[DOB]
を選びます。
カラムを2回テーブルに追加し、別々のファンクションを選択すると、同じフィールドから異なる値の複製が生成されます。たとえば、このシナリオでは、確率を50%に指定し、
Soundex replace
ファンクションを使って複製名を変更してから、もう一度確率を50%にし、
Exchange characters
ファンクションで複製名を変更します。つまり、複製レコードの
[Name] (名前)
フィールドは、確率が
(1-0.5)×(1-0.5) = 0.25
である場合、2回目のファンクションを実行後も変更されない可能性があります。
すべての複製レコードを確実に変更するには、
[Modification Rate] (変更率)
を
1
に設定する必要があります。
[Modification Rate] (変更率)
カラムに、入力カラムから生成する複製レコードの割合を入力します。
-
Function (ファンクション)
リストから、複製する値をどのように変更するかを決めるファンクションを選択します。
この例では、複数の読み方と特性の複製名が存在することになり、異なる読み方の市区町村名が複製されます。生年月日カラムの日付値はここではランダムに変更されます。
Max Modification Count (最大変更数)
カラムに、各フィールドで変更する値の最大数を入力します。
[Advanced settings] (詳細設定)
タブをクリックし、
[Seed for random generator] (ランダムジェネレーターをシード)
フィールドにランダムな数値を入力します。
このフィールドに数値を設定することで、ジョブの各実行で複製データの同じサンプルが生成されます。別のサンプルを生成する場合は値を変更します。
このページは役に立ちましたか?
このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。
こちらにフィードバックをお寄せください
前のトピック
入力データを設定
次のトピック
出力コンポーネントの設定