Zu Hauptinhalt springen

Profilerstellungsdaten

Profilstatistiken stellen Spaltenanalysen bereit, die die Häufigkeit, Bereiche und Werte innerhalb von Datenbeständen messen. Diese Metriken beschreiben Beziehungen zwischen Feldwerten, wie beispielsweise:

  • Anzahl distinkter Werte (Kardinalität)
  • Beispielwerte, häufigste Werte und Werthäufigkeit
  • Redundanzen, die sich gut zum identifizieren von Standardwerten oder möglichen duplizierten Werten eignen
  • Anzahl von Null-, String- und numerischen Werten
  • Informationen zu Wertbereichen, darunter Min, Max, Durchschnitt, Summe und Standardabweichung

Datenadministratoren gewinnen durch die Profilerstellung umfangreiche technische Informationen über ihre Datenbestände. Diese Informationen erleichtern die Organisation und Zuweisung von Ressourcen und Zugriffsrechten. App-Entwickler nutzen Profilstatistiken und Datenstichproben, um Ideen und Hinweise für die Erstellung von Apps und das Planen von Visualisierungen zu erhalten. Anhand von Feldprofilerstellung können Datenanalysten und Business-Anwender schnellere Einblicke erhalten. Sie können nützliche Feldprofilmetriken anzeigen und visualisieren, ohne zuerst eine App erstellen zu müssen.

Catalog provides two different views of field profile data: List view and Tile view. List view is a tabular summary of configurable profile statistics and Tile view is a card-based, visual representation of fields laid out as a grid. Select the Tile Select tile icon for tile view or List Select list icon for list view icon to switch between profile views.

Kachelansicht: Feldprofile werden nach Metriken erstellt, die für den im Feld enthaltenen Datentyp sinnvoll sind (Beispiel: Text- oder numerische Werte)

Kachelansicht des Profils

Listenansicht: Wählen Sie die gewünschten Profilstatistiken aus dem Dropdown-Menü Spalten aus.

Listenansicht des Profils

Kachelansicht des Profils

Die Kachelansicht des Profils ist ein visuelles Feldprofil, das dafür ausgelegt ist, den informativsten Inhalt für diesen Feldtyp zu zeigen. Welcher Kartentyp als Standardansicht angezeigt wird, hängt davon ab, ob die Anzahl numerischer Werte oder Textwerte für das betreffende Feld höher ist. Beispielsweise wird für Felder, die sowohl Text- als auch numerische Werte enthalten, standardmäßig der Kartentyp Most Common Values (Häufigste Werte) angezeigt, wenn mehr Textwerte vorhanden sind, bzw. der Kartentyp Binned Frequency (Klasseneinteilungshäufigkeit) für numerische Verteilung, wenn das Feld mehr numerische Werte enthält. Zum Umschalten ist ein Dropdown-Feld vorhanden. Damit können Sie für jedes Feld, das nicht eindeutige Werte enthält, zum Kartentyp Most Common Values Frequency (Häufigkeit der häufigsten Werte) wechseln, wenn A ausgewählt ist, bzw. Sie können zurück zur Karte für numerische Verteilung wechseln, wenn #1 ausgewählt ist. Beachten Sie, dass alle Kartentypen die Anzahl der Nullwerte einschließen, wenn das Feld Nullwerte enthält.

Karten der Kachelansicht: Binned Frequency (numerische Verteilung), Sample Values und Most Common Values Frequency

Kachelansicht der Profilkarten

Karte Sample values

Die Karte Sample values wird angezeigt, wenn alle Werte eindeutig sind und nur Text enthalten. Darin werden (maximal) die ersten drei Werte aufgelistet.

Profilkarte Sample values
Profilkarte „Sample values“

Profilkriterien für Sample values: Für Feldwerte erfolgt die Profilerstellung mit dieser Karte, wenn die Kardinalität hoch ist (viele distinkte Werte). Wenn alle Werte textbasiert und eindeutig sind, bieten einige Beispielwerte den besten ersten Einblick in die Daten dieses Feldtyps.

Jede Profilkarte Sample values enthält die folgenden Angaben: 

  • Feldname
  • Kardinalität
  • Bis zu drei Beispielwerte (manche Felder können weniger als drei Werte enthalten)

Karte Most common values frequency (Häufigkeit der häufigsten Werte)

Die Karte Most common values frequency zeigt die beiden häufigsten Werte und die Häufigkeit dieser Werte sowie eine Kombination aller anderen Werte als Sonstige, es sei denn, es sind nur drei Werte vorhanden. In diesem Fall werden alle drei Werte mit der Häufigkeit des jeweiligen Werts angezeigt. Diese Profilkarte kann für Text-, numerische oder gemischte Datenwerte verwendet werden.

Profilkarte Most common values frequency mit Textwerten
Profilkarte „Most common values frequency“
Profilkarte Most common values frequency mit numerischen Werten
Profilkarte „Most common values“

Kriterien für Most common values frequency: Für Felder, die nur wenige Werte oder eine verzerrte Wertverteilung aufweisen, erfolgt die Profilerstellung mit der Karte „Most common values frequency“. Diese Profilerstellungskarte wird nur angewandt, wenn mehrere Instanzen der gleichen Werte vorhanden sind. Die Benutzer erhalten einen raschen Einblick in die Verteilung der Feldwerte. Wenn die Felddaten sowohl Text- als auch numerische Werte enthalten und mehr Text- als numerische Werte vorhanden sind, wird die Karte Most common values frequency angezeigt. Die Umschaltoption zu Binned frequency wird bereitgestellt, wenn das Feld mehr als drei numerische Werte enthält.

Jede Profilkarte Most common values frequency enthält folgende Angaben: 

  • Feldname
  • Kardinalität
  • Häufigste Werte und deren Häufigkeit
  • Sonstige mit der kombinierten Häufigkeit der restlichen Werte

Karte Binned frequency (Klasseneinteilungshäufigkeit)

Die Karte Binned frequency zeigt Verteilungs- und Profilerstellungsinformationen, die für numerische Felder relevant sind, darunter minimale, durchschnittliche und maximale Datenwerte. Wenn die Felddaten sowohl Text- als auch numerische Werte enthalten und mehr numerische als Textwerte vorhanden sind, wird die Karte Binned frequency angezeigt. Der Kartentyp Most Common Values Frequency ist für alle Felder mit nicht eindeutigen Werten verfügbar.

Profilkarte Binned frequency (Klasseneinteilungshäufigkeit)

Profilkarte „Binned frequency“

Jede Profilkarte Binned frequency enthält folgende Angaben: 

  • Feldname
  • Kardinalität
  • Histogramm mit der Verteilung der numerischen Daten
  • Mindestwert
  • Durchschnittswert (Summe der Zahlen geteilt durch die Gesamtzahl der Werte im Datensatz)
  • Höchstwert

Listenansicht des Profils

Die Listenansicht des Profils enthält eine Tabelle mit Optionen für die Profilstatistik. Die Benutzer markieren die Metriken, die für den Datensatz, für den das Profil erstellt wird, am sinnvollsten sind, unter Columns. Die ersten neun Statistiken sind standardmäßig vorausgewählt,

Navigieren Sie vom Hub Startseite zu Ihre Daten bzw. filtern Sie in Katalog nach TypenDaten.

  1. Wählen Sie Datensatz öffnen und dann Profildaten aus. Mit dieser Aktion wird die Seite Profil für den Datensatz geöffnet. Aktivieren Sie die Schaltfläche Spalten und setzen Sie ein Häkchen neben die gewünschten Profistatistiken. Diese Statistiken müssen ausgewählt sein (Häkchen gesetzt), damit sie das Feld (Spalte) profilieren und in der Tabelle angezeigt werden. In der folgenden Liste sind die verfügbaren Profilstatistiken aufgeführt.

    Profilstatistiken
    Statistik Beschreibung
    Name Feldname (Beispiel: CategoryID)
    Datentyp

    Qlik Sense registriert Daten aus vielen verschiedenen Systemen. Eine einheitliche, von extern zu intern reichende Datentypzuordnung wird zu Informationszwecken für Felddaten (Spalten) erzwungen. Zu den unterstützten Datentypwerten zählen:

    • Date: Ein Datum mit Monat, Tag, Jahr im ISO 8601-Format JJJJ-MM-TT

    • Time: Ein Uhrzeitwert mit Stunde, Minuten, Sekunden im ISO 8601-Format hh.mm.ss.sss±hh:mm
    • Datetime: Ein Datums- und Uhrzeitwert mit Jahr, Monat, Tag, Stunde, Minute, Sekunde und Bruchteilen im Format JJJJ-MM-TTThh.mm.ss.sss
    • Timestamp: Ein Zeitstempelwert mit Jahr, Monat, Tag, Stunde, Minute, Sekunde, Bruchteilen und Zeitzone im Format JJJJ-MM-TTThh.mm.ss.sssZ
    • String: Zeichendaten, die Text darstellen
    • Double: Ein numerischer Datentyp mit 64-Bit-IEEE 754-Gleitkomma mit doppelter Genauigkeit
    • Decimal: Ein exakter numerischer Datentyp, der durch seine Genauigkeit (Gesamtzahl der Stellen) und Dezimalstellen (Anzahl der Stellen rechts vom Dezimalzeichen) definiert wird
    • Integer: Positive oder negative Ganzzahlen
    • Boolean: Ein Boolescher Wert (TRUE/FALSE)
    • Binary: Kategorische Daten, die exakt zwei mögliche Werte haben können, z. B. „1“ und „2“
    • Custom: Ein Typ, der sich außerhalb des zugeordneten systembekannten Typs befindet
    Distinkte Werte Kardinalität, Anzahl der für dieses Feld vorhandenen distinkten Werte
    Stichprobenwerte Stichprobenwerte (Anzeige von 3 Stichprobenwerten)
    Summe Summe aller Werte in diesem Feld (für String-Felder wird „0“ angezeigt)
    Min. Für dieses Feld beobachteter Mindestwert (numerische Felder)
    Max. Für dieses Feld beobachteter Höchstwert (numerische Felder)
    Durchschnitt Für dieses Feld beobachteter Durchschnittswert
    System-Tags Dateitags, die zum Identifizieren des Codesatzes angewendet werden (z. B. $ascii, $text)
    Standardabweichung Standardabweichung für numerische Felder
    Positiv Anzahl der positiven Werte
    Negativ Anzahl der negativen Werte
    Null-Werte Anzahl der „0“-Werte
    Leere Strings Anzahl der leeren Strings
    Min. Länge Niedrigste beobachtete Zeichenlänge
    Durchschnittliche Länge Durchschnittliche beobachtete Zeichenlänge
    Max. Länge Höchste beobachtete Zeichenlänge
    Erster sortierter Wert Der erste (niedrigste) Wert mit dem Sortiergewicht (String-Felder)
    Letzter sortierter Wert Der letzte (höchste) Wert mit dem Sortiergewicht (String-Felder)
    Numerische Werte Anzahl der numerischen Werte
    Textwerte Anzahl der Textwerte
    Häufigste Werte Die drei häufigsten Werte im Feld

Stichprobendaten

Eine Stichprobe von Daten ist eine Teilmenge eines Populationsdatensatzes. Dies ist ein nützliches Tool für Datenadministratoren, um zu gewährleisten, dass die Daten den erwarteten Mustern und Formaten entsprechen. App-Ersteller können so ein Gefühl für die Felder und Felddaten im Kontext anderer Datensätze und Datenbestände gewinnen. Diese Ansichten bieten einen ersten Blick auf die Daten; Entwickler können mit der Untersuchung der Daten für die Analyse und potenzielle Korrelationen beginnen.

Wählen Sie Datenstichprobe, um eine Stichprobe der ersten 20 Datenwerte für jedes Feld anzuzeigen.

Datensatz-Engine – Beispiel
  • Wählen Sie die Schaltfläche Symbol Dropdown-Pfeil und dann Stichprobe, um eine Stichprobe (n=20) der Datenwerte für jedes Feld anzuzeigen.

Berechtigungen

Berechtigungen sind erforderlich, um Profile und Stichproben von Daten zu erstellen. Die Aktion der Profilerstellung für Daten ist der umfassenderen Berechtigung Profildatenquelle zugewiesen. Weitere Informationen finden Sie unter Verwalten von Berechtigungen in freigegebenen Bereichen oder Verwalten von Berechtigungen in verwalteten Bereichen.

  • Profildaten > Profildatenquelle

Beispiel