メイン コンテンツをスキップする 補完的コンテンツへスキップ

データ品質計算の構成

データセットのデータ品質を初めて計算したら、この計算を更新し、ニーズに応じてカスタマイズできます。

情報メモQlik Talend Cloud Enterprise サブスクリプションが必要です。

サンプルサイズと処理モードの選択

品質計算のサンプル サイズをカスタマイズできるようにするには、データセットで事前に [計算] を 1 回クリックしておく必要があります。

  1. Qlik Talend Data Integration > [カタログ] から、データセットを開きます。

  2. データ品質を計算する方法に応じて、次のようになります。

    • [更新] をクリックすると、以前に適用したパラメーターを使用してデータ品質が再計算されます。

    • [更新] ボタンの横にある下向き矢印をクリックして、 [品質とプロファイリング] パネルを展開し、再計算をカスタマイズします。

  3. [サンプル サイズ] に、データ品質を計算するサンプルのサイズを入力します。

    • 行の数: データ品質を計算する行数を入力します。プルアップ モードでの最大値は 100000 行ですが、プッシュダウン モードでは最大値の制限はありません。

    • データセットのパーセンテージ: 代わりに、データ品質を計算するデータセットのパーセンテージを入力します。小数点以下の値は使用できません。大きなデータセットの場合、データセットの 1% が許可される最大行数 (100000 行) を超えると、このオプションは表示されません。

  4. [処理モード] では、データ品質を計算するときに使用する処理モードを選択します。

    • プッシュダウン: 現在、Snowflake および Databricks データセットでのみ使用できます。これにより、データベース側の品質計算がトリガーされ、Snowflake クレジットまたは Databricks ユニット (DBUs) が消費されます。

    • プルアップ: すべてのデータセットで使用できます。Qlik Cloud で品質計算をトリガーします。

  5. 設定に応じてデータ品質を再計算するには、 [更新] をクリックします。

データ品質インジケーターとサンプル サイズが [概要] に表示されます。処理時間は、サンプル サイズに応じて異なります。データ プレビューには、常に 100 件のレコードのみが表示されます。

情報メモ500 列を超えるデータセットに対しては、データ品質を計算できません。

データ品質計算は、対応する Qlik Public API を通じてトリガーしたりカスタマイズしたりすることもできます。

データ品質のスケジューリングには、Qlik Automate テンプレート Schedule data quality computations を使用できます。詳細については、All templates を参照してください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。