データ品質計算の構成
データセットのデータ品質を初めて計算したら、この計算を更新し、ニーズに応じてカスタマイズできます。
サンプルサイズと処理モードの選択
品質計算のサンプル サイズをカスタマイズできるようにするには、データセットで事前に [計算] を 1 回クリックしておく必要があります。
-
Qlik Talend Data Integration > [カタログ] から、データセットを開きます。
-
データ品質を計算する方法に応じて、次のようになります。
-
[更新] をクリックすると、以前に適用したパラメーターを使用してデータ品質が再計算されます。
-
[更新] ボタンの横にある下向き矢印をクリックして、 [品質とプロファイリング] パネルを展開し、再計算をカスタマイズします。
-
-
[サンプル サイズ] に、データ品質を計算するサンプルのサイズを入力します。
-
行の数: データ品質を計算する行数を入力します。プルアップ モードでの最大値は 100000 行ですが、プッシュダウン モードでは最大値の制限はありません。
-
データセットのパーセンテージ: 代わりに、データ品質を計算するデータセットのパーセンテージを入力します。小数点以下の値は使用できません。大きなデータセットの場合、データセットの 1% が許可される最大行数 (100000 行) を超えると、このオプションは表示されません。
-
-
[処理モード] では、データ品質を計算するときに使用する処理モードを選択します。
-
プッシュダウン: 現在、Snowflake および Databricks データセットでのみ使用できます。これにより、データベース側の品質計算がトリガーされ、Snowflake クレジットまたは Databricks ユニット (DBUs) が消費されます。
-
プルアップ: すべてのデータセットで使用できます。Qlik Cloud で品質計算をトリガーします。
-
-
設定に応じてデータ品質を再計算するには、 [更新] をクリックします。
データ品質インジケーターとサンプル サイズが [概要] に表示されます。処理時間は、サンプル サイズに応じて異なります。データ プレビューには、常に 100 件のレコードのみが表示されます。
データ品質計算は、対応する Qlik Public API を通じてトリガーしたりカスタマイズしたりすることもできます。
データ品質のスケジューリングには、Qlik Automate テンプレート Schedule data quality computations を使用できます。詳細については、All templates を参照してください。