Bewerten der Datenqualität

Nach dem Öffnen eines Datensatzes können Sie sich die verschiedenen Teile der Übersicht ansehen, um mehr über die allgemeine Qualität, das Schema, die Qualitätsstatistiken und die semantischen Typen der einzelnen Spalten zu erfahren.

Sie benötigen eines der folgenden Abonnements:

Qlik Talend Cloud Enterprise
Qlik Talend Cloud Premium
Qlik Cloud Analytics Premium
Qlik Cloud Analytics Enterprise
Qlik Sense Enterprise SaaS

Qualitätsindikatoren des Datensatzes

Eine Verbindung zu Qlik Cloud Analytics ist erforderlich, um die Qualität und die Profilerstellung Ihrer Datensätze zu berechnen. Weitere Informationen finden Sie unter Datenqualität für verbindungsbasierte Datensätze.

Wenn Sie die Übersicht eines gerade registrierten Datensatzes öffnen, sind die meisten Informationen ausgegraut. Um die Datenqualität erstmals zu berechnen, klicken Sie auf Berechnen. Wenn die Qualität schon einmal berechnet wurde, Sie sich aber vergewissern möchten, ob die Daten aktuell sind, klicken Sie auf Aktualisieren.

Jede Berechnung oder Aktualisierung in Pushdown verursacht einige Kosten in Ihrem Cloud Data Warehouse (Snowflake oder Databricks). Weitere Informationen finden Sie unter Datenqualität für verbindungsbasierte Datensätze.

Es gibt zwei Hauptabschnitte, in denen die Qualität angezeigt wird.

Den Bereich Datenqualität, der eine Qualitätsleiste mit drei Farben und deren jeweiligen Prozentsätzen aufweist:
- Ungültig (rot): Zeigt den Prozentsatz der Werte in der Stichprobe an, die als ungültig betrachtet werden.
- Leer oder null (schwarz): Zeigt den Prozentsatz der Werte in der Stichprobe an, die leer oder null sind.
- Gültig (grün): Zeigt den Prozentsatz der gültigen Werte in der Stichprobe an. Der Prozentsatz berücksichtigt keine leeren Werte.
Der Bereich Schema zeigt die verschiedenen Felder des Datensatzes, den angewendeten Datentyp oder semantischen Typ und eine Qualitätsleiste für jedes Feld des Datensatzes.

Für verbindungsbasierte Datensätze gilt: Wenn das Schema und die Qualität des Datensatzes nicht abgerufen werden können, prüfen Sie, ob für die Verbindung, die Sie im Qlik Analytics Services Hub eingerichtet haben, das Feld Rolle ordnungsgemäß ausgefüllt ist, oder ob die Rolle selbst die erforderlichen Berechtigungen für die Datenbanktabelle gewährt.

Erkennung der semantischen Typen

Jeder Spalte eines Datensatzes wird automatisch ein semantischer Typ zugewiesen, um den Inhalt besser zu beschreiben. Im Hintergrund erfolgt ein Datenerkennungsvorgang, der bestimmt, welcher Typ zugewiesen werden soll.

Sie können auch semantische Typen erstellen und die Werte in jedem semantischen Typ verwalten.

Weitere Informationen finden Sie unter Verwalten von semantischen Typen.

Sampling-Modus für Berechnungsmodus

Der für Datenstichproben verwendete Sampling-Modus hängt vom ausgewählten Berechnungsmodus ab:

Pullup-Modus: Es wird eine Anfangsstichprobe verwendet, was bedeutet, dass die ersten Zeilen des Datensatzes als Stichprobe genommen werden.
Pushdown-Modus: Eine Zufallsstichprobe wird verwendet, um eine gleichmäßigere Verteilung der Daten im Datensatz zu gewährleisten. Dieser Modus wird derzeit nur für Databricks und Snowflake unterstützt.

Das Verständnis des Sampling-Modus hilft bei der genauen Interpretation der Datenqualitätsmetriken basierend auf dem Berechnungsmodus.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!

Geben Sie hier Ihr Feedback ab