Qlik Trust Score™
Der Qlik Trust Score™ hilft Ihnen bei der Beantwortung der Frage „Wie vertrauenswürdig ist mein Datensatz?“ Dieser globale Qualitätsindikator fasst mehrere Metriken zu einem einzigen und leicht verständlichen Score zusammen und bietet Transparenz nicht nur bezüglich der Integrität einzelner Datensätze, sondern auch auf Ebene des Datenprodukts. Der gesamte Qlik Trust Score™ für ein Datenprodukt wird aus den Trust Scores aller enthaltenen Datensätze berechnet, sodass Sie die Datenqualität in Ihrer gesamten Datenlandschaft bewerten und überwachen können.
Der Qlik Trust Score™ lässt sich auf die Anforderungen Ihres Unternehmens bezüglich der Datenqualität zuschneiden und verschafft Ihnen einen Überblick über den Zustand eines jeden Datensatzes oder Datenprodukts.
Übersicht
In einer Datensatzübersicht finden Sie den Qlik Trust Score™ und umfassende Einblicke wie z. B.:
-
Den globalen Qlik Trust Score™ für die ausgewählten Datensätze und einen Prozentsatz oder eine 5-Punkte-Bewertung zur Angabe ihres Zustands.
-
Die verschiedenen Faktoren, die den Qlik Trust Score™ eines Datensatzes erhöhen oder senken können. Sie sind in den folgenden Hauptdimensionen zusammengefasst:
-
Gültigkeit, die die Qualität des Datensatzes selbst einschließlich der Verwendung semantischer Typen und angewendeter Validierungsregeln berücksichtigt und den Anteil gültiger Werte in der Datensatzstichprobe widerspiegelt. Leere Werte werden bei der Berechnung dieser Dimension nicht als gültig angesehen.
-
Vollständigkeit, die von der Anzahl der leeren Datensätze in der Datensatzstichprobe abhängt.
-
Auffindbarkeit, die misst, wie leicht Benutzer Ihren Datensatz anhand seiner Metadaten finden und verstehen können, was sich direkt auf die Akzeptanzraten auswirkt.
Sie berücksichtigt die Tatsache, dass dieser Datensatz in aktiven Datenprodukten referenziert ist, und spiegelt wider, wie gut Ihr Datensatz dokumentiert ist. Ein gut dokumentierter Datensatz verwendet geeignete Metadaten wie Beschreibungen oder Tags, sowohl für den Datensatz selbst als auch für die Felder des Datensatzes.
-
Nutzung, die anzeigt, wie stark Ihr Datensatz über Abhängigkeiten wie Analyse-Apps, Datenvorbereitungen, Datenflüsse usw. genutzt wird. Dabei wird auch die Anzahl der Aufrufe berücksichtigt, die diese Abhängigkeiten haben.
InformationshinweisWenn für diese Dimension kein Ergebnis angezeigt wird, vergewissern Sie sich, dass die Nutzungsmetriken aktiviert sind. Navigieren Sie zu Verwaltung > Einstellungen und aktivieren Sie dann Nutzungsmetriken im Abschnitt Funktionssteuerung. -
Zeitnähe, die die Datenaktualität mit dem von Ihnen konfigurierten Schwellenwert vergleicht. Weitere Informationen finden Sie unter Aktualität der Daten. Zum Festlegen des Schwellenwerts klicken Sie auf
, um das entsprechende Konfigurationsfenster zu öffnen:-
Aktualitätsschwellenwert: Wählen Sie das maximal akzeptable Alter der Daten, indem Sie einen Wert und eine Einheit (Minuten, Stunden, Tage oder Monate) auswählen. Dieser Schwellenwert gibt an, wie oft der Datensatz aktualisiert werden muss, um für Ihre Bedürfnisse relevant zu bleiben. Wenn die Aktualität des Datensatzes den angegebenen Schwellenwert überschreitet, sinkt die Zeitnähenbewertung, was bedeutet, dass die Daten möglicherweise veraltet oder für die aktuelle Analyse weniger zuverlässig sind.
Die Festlegung eines Aktualitätsschwellenwerts stellt sicher, dass Ihr Datensatz regelmäßig aktualisiert wird und Ihren Erwartungen an zeitnahe, relevante Daten entspricht. Die Konfiguration wirkt sich nur auf den ausgewählten Datensatz aus.
-
-
Genauigkeit, die das Ergebnis der Datenqualitäts-Validierungsregeln mit der Kategorie „Genauigkeit“ sowie deren Schweregrad berücksichtigt.
Wenn für diese Dimension keine Punktzahl angezeigt wird, bedeutet dies, dass auf keines der Datensatzfelder Validierungsregeln angewendet wurden. Weitere Informationen zu Validierungsregeln finden Sie unter Arbeiten mit Validierungsregeln.
-
Diversität, die die Vielfalt des Datensatzes berücksichtigt, einschließlich der Erwartungen hinsichtlich der Gleichmäßigkeit des Inhalts und der Volumenverteilung. Zum Konfigurieren dieser Dimension klicken Sie auf
, um das entsprechende Konfigurationsfenster zu öffnen und die gewünschte Anzahl von Feldern und Zeilen festzulegen:-
Felder: Diese Option bewertet die Diversität über die Felder (Spalten) in Ihrem Datensatz hinweg. Sie prüft, wie gleichmäßig die Daten auf die Spalten verteilt sind und ob jede Spalte sinnvolle und vielfältige Daten zum Datensatz beiträgt.
-
Zeilen: Diese Option bewertet die Verteilung und Variabilität der Daten über die Datensätze (Zeilen) in Ihrem Datensatz hinweg. Sie hilft zu erkennen, ob der Datensatz eine ausgewogene und repräsentative Stichprobe von Einträgen enthält, ohne dass bestimmte Werte über- oder unterrepräsentiert sind.
Wenn Sie für diese Parameter akzeptable Mindestwerte festlegen, wird sichergestellt, dass Ihr Datensatz Ihren Anforderungen sowohl an die Struktur (Felder) als auch an die Stichprobengröße (Zeilen) entspricht. Die Konfiguration wirkt sich nur auf den ausgewählten Datensatz aus.
-
-
Um den Qlik Trust Score™ Ihres Datensatzes sehen zu können, müssen Sie die Datenqualität mindestens einmal berechnet haben.
Wenn Sie nicht alle Dimensionen des Qlik Trust Score™ aus Ihrem Datensatz oder Datenprodukt anzeigen können, vergewissern Sie sich, dass diese auf der Konfigurationsseite von Qlik Trust Score™ aktiviert sind.
Konfigurieren des Qlik Trust Score™
Auf der Seite Qlik Trust Score™ können Sie die Gewichtung der einzelnen Dimensionen, die zur Berechnung des Qlik Trust Score™ verwendet werden, sowie das Anzeigeformat konfigurieren und anpassen. Beachten Sie, dass diese Konfiguration auf alle vorhandenen Datensätze Ihres Mandanten angewendet wird.
Bevor Sie den Qlik Trust Score™ konfigurieren, stellen Sie sicher, dass Datenqualität für Ihren Mandanten unterstützt wird. Die gleichen Funktionen und Einschränkungen, die für die Datenqualität gelten, gelten auch für den Qlik Trust Score™, z. B. die unterstützten Dateitypen. Weitere Informationen finden Sie unter Datenqualität für verbindungsbasierte Datensätze und Datenqualität für dateibasierte Datensätze.
-
Klicken Sie unter Qlik Talend Data Integration > Datenqualität auf Qlik Trust Score™.
-
Um eine Dimension zu aktivieren oder zu deaktivieren, klicken Sie links daneben auf den Schalter.
Gültigkeit und Vollständigkeit können nicht deaktiviert werden, da sie die wichtigsten Parameter bei der Ermittlung des Qlik Trust Score™ sind.
-
Um die Gewichtung der einzelnen Dimensionen anzupassen, klicken Sie auf die Plus- und Minuszeichen rechts daneben.
Der Gesamtprozentsatz aller Dimensionen muss 100 % betragen.
-
Um die Anzeige des Qlik Trust Score™ anzupassen, wählen Sie je nach dem gewünschten Anzeigeformat entweder Als Bewertung bis 5 oder Als Prozentsatz aus.
Anzeigen des Qlik Trust Score™-Verlaufs
Der Qlik Trust Score™ entwickelt sich kontinuierlich mit dem Lebenszyklus Ihres Datensatzes weiter, einschließlich Änderungen in der Gewichtung der Dimensionen, Qualitätsberechnung, Tags, Beschreibungen, Verwendung usw.
Mit der Verlaufsfunktion können Sie die Trends und die Entwicklung des Qlik Trust Score™ direkt in der Datensatz- bzw. Datenproduktübersicht einsehen:
-
Die wichtigsten Trends werden direkt in der Übersicht neben dem Qlik Trust Score™ und neben jeder seiner Dimensionen angezeigt. Sie stellen die Veränderung gegenüber dem vorherigen Score dar.
-
Sie können das Detailfenster Qlik Trust Score™ Verlauf auf zwei Arten aufrufen:
-
Von einer Datensatzübersicht: Klicken Sie neben dem Qlik Trust Score™ auf
und wählen Sie Verlauf anzeigen aus. -
Von einer Datenproduktübersicht: Klicken Sie neben dem Datensatz in der Liste auf
und wählen Sie Qlik Trust Score™ Verlauf aus.
Der Qlik Trust Score™-Verlauf zeigt alle Ereignisse, die zu einer Änderung der Bewertung geführt haben, in chronologischer Reihenfolge an. Für jedes Ereignis werden ein Zeitstempel, eine kurze Beschreibung der auslösenden Aktion und die spezifischen von der Änderung betroffenen Dimensionen angezeigt.
-
Standardmäßig wird der Qlik Trust Score™-Verlauf als Diagramm angezeigt. Um die Daten in einem Tabellenformat anzuzeigen, klicken Sie auf das Tabellensymbol auf der rechten Seite des Diagramms. Zunächst werden die letzten 500 Ereignisse geladen, und Sie können weitere Ereignisse direkt aus der Tabellenansicht laden.