CSV ファイルから解決スプリントを作成する
検証するデータを含む CSV ファイルから、解決スプリントを作成できます。
前提条件
スプリントを作成する前に、以下が必要です。
-
スプリントの作成に使用するスペース。
スプリント オーナー/作成者は、スペース内で「管理可能」、「編集可能」、「閲覧可能」、「データ表示可能」の権限を持っている必要があります。
データ スチュワードは、スペース内で「編集可能」、「閲覧可能」、「データ表示可能」の権限を持っている必要があります。
-
スプリントのデータを保存するために使用する Snowflake データ ウェアハウスへの接続。接続にはデータ ゲートウェイを使用しないでください。
すべてのスプリント ユーザーは、スペース内で「編集可能」、「閲覧可能」、「データ表示可能」の権限を持っている必要があります。
Qlik Talend Data Integration アクティビティ センターの [接続] で、接続を作成できます。
Snowflake の接続の詳細については、「Snowflake」を参照してください。
スプリントの作成
解決スプリントを作成するには、Qlik Talend Data Integration アクティビティセンターの [データ スチュワードシップ] で [スプリントを作成] をクリックします。
スプリントの基本設定
-
名前
スプリントの名前を追加します。
-
スペース
スプリントを作成するスペースを選択します。
-
説明
スプリントの説明を追加します。
-
スプリントのデータ ソース
[ファイル] を選択します。
検証するデータを含む CSV ファイルをインポートします。
データ スキーマの定義に進む準備ができたら、 [次へ] をクリックします。
データ スキーマの定義
データ検証に使用するデータ スキーマを検証し、要件に合わせて調整できるようになりました。各列にはデータ品質インジケーターが表示され、無効と思われるデータは強調表示されます。これらの表示は、データのサンプルに基づいています。
列のロック
列の [...] をクリックし、 [ロック] を選択すると、スプリント内で編集ができないように列をロックできます。列データは引き続き表示されますが、データ スチュワードは編集できなくなります。
列の除外
列の [...] をクリックし、 [除外] を選択すると、その列をスプリントから除外できます。除外された列のデータは、データ スチュワードには表示されなくなります。
列にセマンティック タイプを適用する
列は、既定ではネイティブのデータ型を使用します。列にセマンティック タイプを適用することで、スチュワードが検証を行う際の補助となります。
-
列を選択し、 [データ型] の横にある
をクリックします。これで、列に適用するセマンティック タイプを選択できるようになりました。
各列の名前と説明を変更することもできます。
データ スストレージの定義に進む準備ができたら、 [次へ] をクリックします。
列に検証ルールを追加する
列に検証ルールを適用すると、無効なデータを特定しやすくなります。無効なデータは列で強調表示されます。
-
列を選択し、 [検証ルールを適用] をクリックします。既存の検証ルールを選択するか、新しい検証ルールを作成できます。
検証ルールの作成の詳細については、「検証ルールの作成」を参照してください。
データ ストレージに接続する
スプリントのデータを保存するために使用するクラウド データ ウェアハウスに接続する必要があります。現在サポートされているデータウェアハウスは Snowflake のみです。
-
データ ウェアハウスへの接続を選択します。
-
使用するデータベースを選択します。
-
既存のデータベース スキーマを使用するか、新しいデータベース スキーマを使用するかを選択します。
[新しいデータベース スキーマ] を選択した場合、新しいスキーマの名前を設定します。
-
解決済みスプリント データに使用するテーブル名を [解決済みレコードのテーブル名] で設定します。
スプリント ワークフローのロールとその他の設定を定義する準備ができたら、 [次へ] をクリックします。
スプリント ワークフローのロールと設定を定義する
最後のステップとして、ロールとその他の設定を定義します。
-
オーナーを追加
スプリントのオーナーとなるすべてのユーザーを追加します。
-
スチュワードを追加
このスプリントのすべてのデータ スチュワードを追加します。
-
レコード ワークフロー
スプリント オーナーによる 2 段階目の検証ステップを追加するかどうかを選択できます。
情報メモスプリント オーナーとデータ スチュワードの両方のロールを持つユーザーがレコードを検証する場合、2 段階目の検証ステップはスキップされます。 -
レコードの割り当て
レコードをデータ スチュワードに自動で割り当てるか、手動で割り当てるかを選択します。
-
自動
レコードは、データ スチュワードに均等に自動的に割り当てられます。データ スチュワードではないスプリント オーナーにはレコードは割り当てられません。
-
手動
レコードは初期状態ではデータ スチュワードに割り当てられません。スプリント オーナーとデータ スチュワードは、 [未割り当て] からレコードを割り当てることができます。
-
-
優先度
スプリントの優先度を設定できます。
スプリントを作成する準備ができたら、 [作成] をクリックします。
スプリントが作成され、割り当てられたデータ スチュワードはデータの検証を開始できます。