Talend Studio ジョブを使用して解決スプリントを作成する
Talend Studio ジョブをデータ ソースとして、解決スプリントを作成できます。
スプリントの作成とデータ投入のワークフローは次のとおりです。
-
スプリントの作成
Qlik Talend Data Integration の [データ スチュワードシップ] でスプリントを作成します。
-
スプリントへのデータ投入
Talend Studio でジョブを作成し、スプリントにデータを投入します。ジョブを定期的に実行するタスクを作成することで、検証用の新しいレコードを定期的に送信できます。
前提条件
スプリントを作成する前に、以下が必要です。
-
Qlik Cloud と Talend Cloud のテナントは接続されている必要があります。詳細については、「Qlik Cloud と Talend Cloud の接続」を参照してください。
-
スプリントの作成に使用するスペース。
スプリント オーナー/作成者は、スペース内で「管理可能」、「編集可能」、「閲覧可能」、「データ表示可能」の権限を持っている必要があります。
データ スチュワードは、スペース内で「編集可能」、「閲覧可能」、「データ表示可能」の権限を持っている必要があります。
-
スプリント データを保存するために使用する Snowflake データウェアハウスへの接続。接続にデータ ゲートウェイを使用しないでください。
すべてのスプリント ユーザーは、スペース内で「編集可能」、「閲覧可能」、「データ表示可能」の権限を持っている必要があります。
Qlik Talend Data Integration アクティビティ センターの [接続] で接続を作成できます。
Snowflake の接続の詳細については、「Snowflake」を参照してください。
解決スプリントを作成するには、Qlik Talend Data Integration アクティビティ センターの [データ スチュワードシップ] で [スプリントを作成] をクリックします。
スプリントの基本設定
-
名前
スプリントの名前を追加します。
-
スペース
スプリントを作成するスペースを選択します。
-
[Description] (説明)
スプリントの説明を追加します。
-
スプリントの取り込み内容
[Talend Studio ジョブ] を選択します。
データ スキーマの定義に進む準備ができたら、 [次へ] をクリックします。
データ スキーマの定義
データ スキーマを定義する必要があります。
[列を追加] をクリックして、データ スキーマに列を追加します。データ スストレージの定義に進む準備ができたら、 [次へ] をクリックします。
各列に [名前]、 [説明]、 [タイプ] を指定します。
[列をロック] と [列を除外] を使用して、表示および編集可能な列を制御できます。これは、検証に必要な列のみを表示する 検証用ビュー を作成する際に便利です。
-
列をロック
これを選択すると、データ スチュワードに列は表示されますが、編集はできなくなります。検証の対象ではないものの、データ スチュワードが参照する必要がある列に使用します。
-
列を除外
これを選択すると、データ スチュワードに列は表示されなくなります。データ スチュワードにとって参照が不要な列に使用します。
検証ルールの適用
列に検証ルールを適用すると、無効なデータを特定しやすくなります。無効なデータは列で強調表示されます。
-
[+] をクリックして検証ルールを適用します。
既存の検証ルールを選択するか、新しい検証ルールを作成できます。
検証ルールの作成の詳細については、「検証ルールの作成」を参照してください。
データ ストレージに接続する
スプリントのデータを保存するために使用するクラウド データ ウェアハウスに接続する必要があります。現在サポートされているデータウェアハウスは Snowflake のみです。
-
データ ウェアハウスへの接続を選択します。
-
使用するデータベースを選択します。
-
既存のデータベース スキーマを使用するか、新しいデータベース スキーマを使用するかを選択します。
[新しいデータベース スキーマ] を選択した場合、新しいスキーマの名前を設定します。
-
解決済みスプリント データに使用するテーブル名を [解決済みレコードのテーブル名] で設定します。
スプリント ワークフローのロールとその他の設定を定義する準備ができたら、 [次へ] をクリックします。
スプリント ワークフローのロールと設定を定義する
最後のステップとして、ロールとその他の設定を定義します。
-
オーナーを追加
スプリントのオーナーとなるすべてのユーザーを追加します。
-
スチュワードを追加
このスプリントのすべてのデータ スチュワードを追加します。
-
レコード ワークフロー
スプリント オーナーによる 2 段階目の検証ステップを追加するかどうかを選択できます。
情報メモスプリント オーナーとデータ スチュワードの両方のロールを持つユーザーがレコードを検証する場合、2 段階目の検証ステップはスキップされます。 -
レコードの割り当て
レコードをデータ スチュワードに自動で割り当てるか、手動で割り当てるかを選択します。
-
Auto (自動)
レコードは、データ スチュワードに均等に自動的に割り当てられます。データ スチュワードではないスプリント オーナーにはレコードは割り当てられません。
-
手動
レコードは初期状態ではデータ スチュワードに割り当てられません。スプリント オーナーとデータ スチュワードは、 [未割り当て] からレコードを割り当てることができます。
-
-
優先度
スプリントの優先度を設定できます。
スプリントを作成する準備ができたら、 [作成] をクリックします。
スプリントが作成されました。次のステップでは、Talend Studio ジョブを使用してスプリントにデータを投入します。
スプリントへのデータ投入
Talend Studio で tDSOutput コンポーネントを使用してジョブを作成し、スプリントにデータを投入します。ジョブを定期的に実行するタスクを作成することで、新しいレコードを検証のために送信できます。
詳細については、「tDSOutput の設定」を参照してください。