Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Verwalten von Metadaten auf Feldebene und Datenprofilerstellung

Datenadministratoren gewinnen durch die Profilerstellung umfangreiche technische Informationen über ihre Datenbestände. App-Entwickler nutzen Profilstatistiken und Datenstichproben, um Ideen und Hinweise für die Erstellung von Apps und das Planen von Visualisierungen zu erhalten. Anhand von Feldprofilerstellung können Datenanalysten und Business-Anwender schnellere Einblicke erhalten. Sie können nützliche Feldprofilmetriken auf einen Blick anzeigen und visualisieren, ohne zuerst eine App erstellen zu müssen. Anhand von Metadaten auf Feldebene können Benutzer Aliase, Beschreibungen und Klassifizierungen auf Felder anwenden. Diese Funktionen helfen beim Identifizieren bestimmter Daten und vertraulicher Felder.

InformationshinweisQlik Cloud erstellt nur Profile für bis zu 12 Millionen Zeilen in einem Datensatz. Wenn ein Datensatz mehr als 12 Millionen Zeilen enthält, erfolgt die Profilerstellung nur für die ersten 12 Millionen Zeilen. Es werden weiter Metadaten für alle Felder hinzugefügt, unabhängig von der Anzahl der Zeilen mit erstelltem Profil.

Verwalten von Metadaten auf Feldebene

Sie können auf die Metadaten für jedes Feld in Ihrem Datensatz über die Registerkarte Felder zugreifen und die Metadaten bearbeiten. Wählen Sie eine beliebige Karte aus der Ansicht Kachel-Symbol für die Kachelansicht auswählen Tile, eine beliebige Ziele aus der Ansicht Listen-Symbol für die Listenansicht auswählen List oder eine beliebige Spalte aus der Ansicht Daten aus, um das Fenster Details des betreffenden Felds rechts neben dem Raster zu öffnen. Die Metadatenfelder auf Feldebene – Feldalias, Beschreibung, Tags und Klassifizierung – sind optional und können in diesem Fenster definiert und bearbeitet werden.

Metadatenfelder für Felder
Detail Beschreibung
Feldalias Geben Sie einen optionalen alternativen Namen ein, um Feldnamen in der Profilanalyse aussagekräftiger zu machen. Aliasfeldnamen werden nur in der Profilanalyse angezeigt und wirken sich nicht auf die technischen Spaltennamen aus.
Beschreibung

Geben Sie beliebige Informationen ein, die die Benutzer beim Anzeigen von Feldmetadaten und der Profilerstellung für das Feld unterstützen können.

Tags Geben Sie Text-Snippets ein, um dieses Feld und seine Daten zu definieren und zu kategorisieren.
Klassifizierung Aktivieren Sie die Kontrollkästchen für Personenbezogene Daten oder Vertrauliche Informationen.
InformationshinweisAusgewählte Klassifizierungen auf Feldebene, Personenbezogene Daten und Vertrauliche Informationen werden auf der Registerkarte Datensatzübersicht nach Feld unter den Metadaten des technischen Datensatzes aufgelistet.
InformationshinweisKlassifizierungen, die auf Felder in Excel-Dateien mit mehreren Arbeitsblättern angewendet werden, werden mit dem Arbeitsblattnamen und Feldnamen aufgelistet (Beispiel: Personenbezogene Daten: Sheet1/EmpID).

Metadaten auf Feldebene für eine XLSX-Datei mit mehreren Arbeitsblättern

Wählen Sie eine Feldkarte in der Kachelansicht aus, um das Fenster „Details“ zu öffnen.

Profilerstellungsdaten

Profilstatistiken stellen Spaltenanalysen bereit, die die Häufigkeit, Bereiche und Werte innerhalb von Datenbeständen messen. Diese Metriken beschreiben Beziehungen zwischen Feldwerten, wie beispielsweise:

  • Anzahl distinkter Werte (Kardinalität)
  • Beispielwerte, häufigste Werte und Werthäufigkeit
  • Redundanzen, die sich gut zum identifizieren von Standardwerten oder möglichen duplizierten Werten eignen
  • Anzahl von Null-, String- und numerischen Werten
  • Informationen zu Wertbereichen, darunter Min, Max, Durchschnitt, Summe und Standardabweichung

Der Katalog stellt drei Ansichten für Feldprofildaten bereit: Tile view, List view und Data view.

Tile view ist eine kartenbasierte visuelle Darstellung von Feldern, die als Raster angeordnet sind.

List view ist eine tabellarische Übersicht konfigurierbarer Profilstatistiken.

Table view listet Feldspaltennamen und maximal die ersten zwanzig Einträge des Datensatzes auf.

Klicken Sie auf das Symbol TileKachel-Symbol für die Kachelansicht auswählen, ListListen-Symbol für die Listenansicht auswählen oder Daten , um zwischen Profilansichten zu wechseln.

Kachelansicht des Profils

Die Kachelansicht des Profils ist ein visuelles Feldprofil, das dafür ausgelegt ist, den informativsten Inhalt für diesen Feldtyp zu zeigen. Welcher Kartentyp als Standardansicht angezeigt wird, hängt davon ab, ob die Anzahl numerischer Werte oder Textwerte für das betreffende Feld höher ist. Beispielsweise wird für Felder, die sowohl Text- als auch numerische Werte enthalten, standardmäßig der Kartentyp Most Common Values (Häufigste Werte) angezeigt, wenn mehr Textwerte vorhanden sind, bzw. der Kartentyp Binned Frequency (Klasseneinteilungshäufigkeit) für numerische Verteilung, wenn das Feld mehr numerische Werte enthält. Zum Umschalten ist ein Dropdown-Feld vorhanden. Damit können Sie für jedes Feld, das nicht eindeutige Werte enthält, zum Kartentyp Most Common Values (Häufigste Werte) wechseln, wenn Symbol „Most Common Values“ (Häufigste Werte) ausgewählt ist, bzw. Sie können zurück zur Karte für numerische Verteilung wechseln, wenn Binned Frequency (Klasseneinteilungshäufigkeit) Symbol „Binned Frequency“ (Klasseneinteilungshäufigkeit) ausgewählt ist. Beachten Sie, dass alle Kartentypen die Anzahl der Nullwerte einschließen, wenn das Feld Nullwerte enthält.

Kachelansicht: Feldprofile werden nach Metriken erstellt, die für den im Feld enthaltenen Datentyp sinnvoll sind (Beispiel: Text- oder numerische Werte)

Profil-Kachelansicht des Datensatzes

Karte Sample values

Die Karte Sample values wird angezeigt, wenn alle Werte eindeutig sind und nur Text enthalten. Sie listet (maximal) die ersten drei Werte und die Gesamtzahl der weiteren eindeutigen Werte auf.

Karte der Kachelansicht: Stichprobenwerte
Beispielwerte der Kachel

Profilkriterien für Sample values: Für Feldwerte erfolgt die Profilerstellung mit dieser Karte, wenn die Kardinalität hoch ist (viele distinkte Werte). Wenn alle Werte textbasiert und eindeutig sind, bieten einige Beispielwerte den besten ersten Einblick in die Daten dieses Feldtyps.

Jede Profilkarte Sample values enthält die folgenden Angaben: 

  • Feldname
  • Kardinalität (distinkte Werte)
  • Bis zu drei Beispielwerte (manche Felder können weniger als drei Werte enthalten)

Karte Most common values frequency (Häufigkeit der häufigsten Werte)

Die Karte Most common values frequency zeigt die fünf häufigsten Werte und deren Häufigkeit. Wenn mehr Werte als fünf distinkte Werte vorhanden sind, werden diese kombiniert und als Other angezeigt. Wenn Werte in Feldern fehlen, wird der Gesamtwert als Null angezeigt. Diese Profilkarte kann für Text-, numerische oder gemischte Datenwerte verwendet werden.

Karte der Kachelansicht: Most Common Values Frequency (Häufigkeit der häufigsten Werte)
Kachel „Most Common Values Frequency“ (Häufigkeit der häufigsten Werte)

Kriterien für Most common values frequency: Für Felder, die nur wenige Werte oder eine verzerrte Wertverteilung aufweisen, erfolgt die Profilerstellung mit der Karte „Most common values frequency“ (Häufigkeit der häufigsten Werte). Diese Profilerstellungskarte wird nur angewandt, wenn mehrere Instanzen der gleichen Werte vorhanden sind. Die Benutzer erhalten einen raschen Einblick in die Verteilung der Feldwerte. Wenn die Felddaten sowohl Text- als auch numerische Werte enthalten und mehr Text- als numerische Werte vorhanden sind, wird die Karte Most common values frequency angezeigt. Die Umschaltoption zu Binned frequency wird bereitgestellt, wenn das Feld mehr als drei numerische Werte enthält.

Jede Profilkarte Most common values frequency enthält folgende Angaben: 

  • Feldname
  • Kardinalität (distinkte Werte)
  • Häufigste Werte und deren Häufigkeit
  • Sonstige mit der kombinierten Häufigkeit der restlichen Werte

Karte Binned frequency (Klasseneinteilungshäufigkeit)

Die Karte Binned frequency zeigt Verteilungs- und Profilerstellungsinformationen, die für numerische Felder relevant sind, darunter minimale, durchschnittliche und maximale Datenwerte. Wenn die Felddaten sowohl Text- als auch numerische Werte enthalten und mehr numerische als Textwerte vorhanden sind, wird die Karte Binned frequency angezeigt. Der Kartentyp Most Common Values Frequency ist für alle Felder mit nicht eindeutigen Werten verfügbar.

Karte der Kachelansicht: Numerische Verteilung mit Binned Frequency (Klasseneinteilungshäufigkeit)

Kachel „Binned frequency“ (Klasseneinteilungshäufigkeit)

Jede Profilkarte Binned frequency enthält folgende Angaben: 

  • Feldname
  • Kardinalität (distinkte Werte)
  • Histogramm mit der Verteilung der numerischen Daten
  • Mindestwert
  • Durchschnittswert (Summe der Zahlen geteilt durch die Gesamtzahl der Werte im Datensatz)
  • Höchstwert

Listenansicht des Profils

Die Listenansicht des Profils enthält eine Tabelle mit Optionen für die Profilstatistik. Benutzer können die Metriken, die für den Datensatz am wichtigsten sind, in der ColumnPicker Symbol „Spalten“ einsehen, die sich ganz rechts in der Tabelle befindet. Die ersten neun Statistiken sind standardmäßig vorausgewählt,

Listenansicht: Wählen Sie wichtige Profilstatistiken in der Dropdown-Liste ColumnPicker aus, die sich ganz rechts in der Tabelle befindet.

Profil-Listenansicht des Datensatzes

Ansicht „Profildaten“

Die Ansicht „Profildaten“ zeigt den Datensatz als Datentabellendiagramm mit Feldspaltennamen und maximal den ersten zwanzig Werten.

Datenansicht: Die Datenspaltennamen und die ersten zwanzig Einträge werden angezeigt

Profildatenansicht des Datensatzes

Berechtigungen

Berechtigungen sind erforderlich, um Profile und Stichproben von Daten zu erstellen. Sie benötigen eine Rolle im Bereich des Datensatzes, die den Zugriff auf Profildatenquellen zulässt. Weitere Informationen finden Sie unter Verwalten von Berechtigungen in freigegebenen Bereichen oder Verwalten von Berechtigungen in verwalteten Bereichen.

Weitere Informationen

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!