Bewerten der Datenqualität
Nach dem Öffnen eines Datensatzes können Sie sich die verschiedenen Teile der Übersicht ansehen, um mehr über die allgemeine Qualität, das Schema, die Qualitätsstatistiken und die semantischen Typen der einzelnen Spalten zu erfahren.
Qualitätsindikatoren des Datensatzes
Wenn Sie die Übersicht eines gerade registrierten Datensatzes öffnen, sind die meisten Informationen ausgegraut. Um die Datenqualität erstmals zu berechnen, klicken Sie auf Berechnen. Wenn die Qualität schon einmal berechnet wurde, Sie sich aber vergewissern möchten, ob die Daten aktuell sind, klicken Sie auf Aktualisieren.
Jede Berechnung oder Aktualisierung in Pushdown verursacht einige Kosten in Ihrem Cloud Data Warehouse (Snowflake oder Databricks). Weitere Informationen finden Sie unter Datenqualität für verbindungsbasierte Datensätze.
Es gibt zwei Hauptabschnitte, in denen die Qualität angezeigt wird.
-
Den Bereich Datenqualität, der eine Qualitätsleiste mit drei Farben und deren jeweiligen Prozentsätzen aufweist:
-
Ungültig (rot): Zeigt den Prozentsatz der Werte im Datensatz an, die als ungültig betrachtet werden.
-
Leer (schwarz): Zeigt den Prozentsatz der leeren Werte an.
-
Gültig (grün): Zeigt den Prozentsatz der gültigen Werte im Datensatz an. Der Prozentsatz berücksichtigt keine leeren Werte.
-
-
Der Bereich Schema zeigt die verschiedenen Felder des Datensatzes, den angewendeten Datentyp oder semantischen Typ und eine Qualitätsleiste für jedes Feld des Datensatzes.
Erkennung der semantischen Typen
Jeder Spalte eines Datensatzes wird automatisch ein semantischer Typ zugewiesen, um den Inhalt besser zu beschreiben. Im Hintergrund erfolgt ein Datenerkennungsvorgang, der bestimmt, welcher Typ zugewiesen werden soll.
Sie können auch semantische Typen erstellen und die Werte in jedem semantischen Typ verwalten.
Weitere Informationen finden Sie unter Verwalten von semantischen Typen.