Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Konfigurieren der Datenqualitätsberechnung

Nachdem Sie die Datenqualität eines Datensatzes erstmals berechnet haben, besteht die Möglichkeit, diese Berechnung zu aktualisieren und an Ihre Anforderungen anzupassen.

InformationshinweisSie benötigen ein Qlik Talend Cloud Enterprise-Abonnement.

Auswählen der Stichprobengröße und des Verarbeitungsmodus

Um die Stichprobengröße für die Qualitätsberechnung anpassen zu können, müssen Sie zuvor ein Mal auf Berechnen im Datensatz geklickt haben.

  1. Öffnen Sie den Datensatz über Qlik Talend Data Integration > Katalog.

  2. Je nachdem, wie Sie die Datenqualität berechnen möchten:

    • Klicken Sie auf Aktualisieren, um die Datenqualität unter Verwendung der zuvor angewendeten Parameter neu zu berechnen.

    • Klicken Sie auf den Abwärtspfeil neben der Schaltfläche Aktualisieren, um das Fenster Qualität und Profilerstellung zu erweitern und die Neuberechnung anzupassen.

  3. Geben Sie in Stichprobengröße die Größe der Stichprobe ein, auf deren Grundlage Sie die Datenqualität berechnen möchten:

    • Zeilenanzahl: Geben Sie die Anzahl der Zeilen ein, für die Sie die Datenqualität berechnen möchten. Der maximale Wert beträgt 100000 Zeilen im Pullup-Modus; im Pushdown-Modus ist kein maximaler Wert vorhanden.

    • Prozentsatz des Datensatzes: Geben Sie alternativ den Prozentsatz des Datensatzes ein, auf dessen Grundlage Sie die Datenqualität berechnen möchten. Dezimalwerte sind nicht zulässig. Bei großen Datensätzen wird diese Option nicht angezeigt, wenn 1 % des Datensatzes mehr als der maximal zulässigen Anzahl von Zeilen (100000 Zeilen) entspricht.

  4. Wählen Sie in Verarbeitungsmodus den Verarbeitungsmodus aus, der bei der Berechnung der Datenqualität verwendet werden soll:

    • Pushdown: aktuell nur für Snowflake- und Databricks-Datensätze verfügbar. Damit wird die Qualitätsberechnung auf Datenbankseite ausgelöst, was Snowflake-Guthaben oder Databricks-Einheiten (DBUs) kostet.

    • Pullup: verfügbar für alle Datensätze. Damit wird die Qualitätsberechnung in Qlik Cloud ausgelöst.

  5. Klicken Sie auf Aktualisieren, um die Datenqualität entsprechend Ihren Einstellungen neu zu berechnen.

Die Indikatoren für die Datenqualität sowie die Stichprobengröße werden in der Übersicht angezeigt. Die Verarbeitungszeit variiert je nach Stichprobengröße. Beachten Sie, dass in der Datenvorschau immer nur 100 Datensätze angezeigt werden.

Die Berechnung der Datenqualität kann auch über die entsprechende Qlik Public API ausgelöst und angepasst werden.

Für die Planung der Datenqualität kann die Qlik Automate-Vorlage Datenqualitätsberechnungen planen verwendet werden. Weitere Informationen finden Sie unter All templates.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!