メイン コンテンツをスキップする
補完的コンテンツへスキップ
Qlik.com
Community
Learning
Qlik リソース
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
閉じる
ドキュメント
クラウド
Client-Managed
追加のドキュメント
クラウド
Qlik Cloud
ホーム
紹介
Qlik Cloud の新機能
Qlik Talend Cloud について
分析
データ統合
管理
自動化
開発
他のクラウド ソリューション
Talend Cloud
Talend API Portal
Stitch
Upsolver
Client-Managed
クライアント管理 — 分析
ユーザー向けの Qlik Sense
管理者向け
Qlik Sense
開発者向け
Qlik Sense
Qlik NPrinting
Connectors
Qlik GeoAnalytics
Qlik Alerting
ユーザーと管理者向けの
QlikView
開発者向け
QlikView
Governance Dashboard
クライアント管理 — データ統合
Qlik Replicate
Qlik Compose
Qlik Enterprise Manager
Qlik Gold Client
Qlik Catalog
NodeGraph (legacy)
Talend Studio
Talend ESB
Talend Administration Center
Talend Data Catalog
Talend Data Preparation
Talend Data Stewardship
追加のドキュメント
追加のドキュメント
Qlik ドキュメンテーション アーカイブ
Talend ドキュメンテーション アーカイブ
Qlik Talend 製品のヘルプを検索
オンボーディング
分析を開始
分析ユーザーのオンボーディング
Qlik Sense で分析を開始
Qlik Cloud Analytics Standard の管理
Qlik Cloud Analytics Premium および Enterprise の管理
Qlik Sense
Business
の管理
Qlik Sense
Enterprise SaaS
の管理
Qlik Cloud Government を管理
Windows 上の
Qlik Sense
Enterprise
の管理
ビデオ
移行センター
評価ガイド
Qlik リソース
Qlik ヘルプに移動
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
検索
SearchUnify の検索をロード中
製品に関するサポートが必要な場合は、Qlik Support にお問い合わせください。
Qlik Customer Portal
メニュー
閉じる
SearchUnify の検索をロード中
製品に関するサポートが必要な場合は、Qlik Support にお問い合わせください。
Qlik Customer Portal
こちらにフィードバックをお寄せください
Talend Components
Data Qualityのコンポーネント
Data privacy
Data privacyのシナリオ
入力フローからの複製データの生成
複製データの設定
このページ上
手順
手順
tDuplicateRow
をダブルクリックして
[Basic settings] (基本設定)
ビューを表示し、コンポーネントプロパティを定義します。
[Edit schema] (スキーマを編集)
ボタンをクリックして入力および出力カラムを表示し、必要に応じて出力スキーマに変更を施します。
このコンポーネントの出力スキーマには、読み取り専用カラム
ORIGINAL_MARK
が1つ含まれています。レコードが元レコードまたは複製レコードである場合、このカラムは
true
と
false
によって識別されます。元レコードは複製の各グループに1つのみです。
[Percentage of duplicated records] (複製レコードの割合)
フィールドに、出力フローに含める複製行の割合を入力します。
[Distribution of duplicates] (複製の分布)
エリアで、複製の生成に使用する
ベルヌーイ分布
(確率論)を選択します。各グループに含める複製レコードの平均数を設定するために使われます。
[Modifications] (変更)
テーブルの下にある[+]ボタンをクリックして、テーブルに4つの行を追加します。
このテーブルでは、特定のカラムで変更する値、および複製の生成のためにそれらの値を変更する方法を定義できます。
[Input Column] (入力カラム)
フィールドで、複製を生成する入力フローのカラムを選択します。この例では、
[Name] (名前)
、
[City] (市区町村)
、
[DOB]
を選びます。
カラムを2回テーブルに追加し、別々のファンクションを選択すると、同じフィールドから異なる値の複製が生成されます。たとえば、このシナリオでは、確率を50%に指定し、
Soundex replace
ファンクションを使って複製名を変更してから、もう一度確率を50%にし、
Exchange characters
ファンクションで複製名を変更します。つまり、複製レコードの
[Name] (名前)
フィールドは、確率が
(1-0.5)×(1-0.5) = 0.25
である場合、2回目のファンクションを実行後も変更されない可能性があります。
すべての複製レコードを確実に変更するには、
[Modification Rate] (変更率)
を
1
に設定する必要があります。
[Modification Rate] (変更率)
カラムに、入力カラムから生成する複製レコードの割合を入力します。
-
Function (ファンクション)
リストから、複製する値をどのように変更するかを決めるファンクションを選択します。
この例では、複数の読み方と特性の複製名が存在することになり、異なる読み方の市区町村名が複製されます。生年月日カラムの日付値はここではランダムに変更されます。
Max Modification Count (最大変更数)
カラムに、各フィールドで変更する値の最大数を入力します。
[Advanced settings] (詳細設定)
タブをクリックし、
[Seed for random generator] (ランダムジェネレーターをシード)
フィールドにランダムな数値を入力します。
このフィールドに数値を設定することで、ジョブの各実行で複製データの同じサンプルが生成されます。別のサンプルを生成する場合は値を変更します。
このページは役に立ちましたか?
このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。
こちらにフィードバックをお寄せください
前のトピック
入力データを設定
次のトピック
出力コンポーネントの設定