Bewerten der Datenqualität
Nach dem Öffnen eines Datensatzes können Sie sich die verschiedenen Teile der Übersicht ansehen, um mehr über die allgemeine Qualität, das Schema, die Qualitätsstatistiken und die semantischen Typen der einzelnen Spalten zu erfahren.
Qualitätsindikatoren des Datensatzes
Wenn Sie die Übersicht eines gerade registrierten Datensatzes öffnen, sind die meisten Informationen ausgegraut. Um die Datenqualität erstmals zu berechnen, klicken Sie auf Berechnen. Wenn die Qualität schon einmal berechnet wurde, Sie sich aber vergewissern möchten, dass die Daten aktuell sind, klicken Sie auf Aktualisieren.
Jede Berechnung oder Aktualisierung in Pushdown verursacht einige Kosten in Ihrem Cloud Data Warehouse (Snowflake oder Databricks). Weitere Informationen finden Sie unter Datenqualität für verbindungsbasierte Datensätze.
Es gibt zwei Hauptabschnitte, in denen die Qualität angezeigt wird.
-
Der Bereich Datenqualität umfasst Folgendes:
-
Die Verteilung der gültigen, ungültigen und leeren Werte im ganzen Datensatz in Form einer Qualitätsleiste in drei Farben mit den entsprechenden Prozentsätzen
-
Einen Gültigkeits-Score, der den Prozentsatz der gültigen Werte ausdrückt, ohne leere Werte zu berücksichtigen
-
Einen Vollständigkeits-Score, der den Prozentsatz der nicht leeren Werte ausdrückt
-
-
Der Bereich Schema zeigt die verschiedenen Felder des Datensatzes, den angewendeten Datentyp oder semantischen Typ und eine Qualitätsleiste für jedes Feld des Datensatzes.
Erkennung von semantischen Typen
Jeder Spalte eines Datensatzes wird automatisch ein semantischer Typ zugewiesen, um den Inhalt besser zu beschreiben. Im Hintergrund erfolgt ein Datenerkennungsvorgang, der bestimmt, welcher Typ zugewiesen werden soll.
Sie können auch semantische Typen erstellen und die Werte in jedem semantischen Typ verwalten.
Weitere Informationen finden Sie unter Verwalten von semantischen Typen.