Ga naar hoofdinhoud

Gegevens profileren

Profielstatistieken bieden kolomanalyses waarbij de incidenten, het bereik en de waarden binnen gegevensverzamelingen worden gemeten. Deze metrische gegevens beschrijven relaties tussen veldwaarden, zoals:

  • Aantal afzonderlijke waarden (kardinaliteit)
  • Voorbeeldwaarden, meest voorkomende waarden en waardefrequentie
  • Redundantie die van pas komt bij het identificeren van standaard- of mogelijke dubbele waarden
  • Aantal null-, tekenreeks- en numerieke waarden
  • Informatie over waardebereiken, inclusief min, max, gemiddelde, som en standaardafwijking

Gegevensbeheerders hebben met behulp van profilering toegang tot belangrijke technische gegevens over hun gegevensverzamelingen. Deze gegevens helpen bij het organiseren en toewijzen van bronnen en toegang tot gegevens. App-ontwikkelaars gebruiken profielstatistieken en steekproeven van gegevens om ideeën op te doen en als richtlijn voor het maken van apps en het plannen van visualisaties. Door velden te profileren kunnen gegevensanalisten en zakelijke gebruikers sneller inzichten opdoen. Ze kunnen waardevolle metrische gegevens van veldprofielen bekijken en visualiseren zonder eerst een app te hoeven maken.

Catalog provides two different views of field profile data: List view and Tile view. List view is a tabular summary of configurable profile statistics and Tile view is a card-based, visual representation of fields laid out as a grid. Select the Tile Select tile icon for tile view or List Select list icon for list view icon to switch between profile views.

Tegelweergave Velden worden geprofileerd op basis van metrische gegevens die van betekenis zijn voor het soort gegevens die in het veld zijn opgenomen (bijvoorbeeld: tekst versus numerieke waarden)

Weergave Profieltegel

Lijstweergave:Selecteer de gewenste profielstatistieken in de vervolgkeuzelijst Kolommen

Weergave profiellijst

Weergave Profieltegel

De weergave Profieltegel is een visueel veldprofiel voor het weergeven van de meest relevante inhoud voor dat type veld. Het standaard kaartweergavetype wordt bepaald door het feit of het aantal numerieke waarden of tekstwaarden hoger is voor dat veld. Als velden bijvoorbeeld zowel tekstwaarden als numerieke waarden bevatten, wordt het kaarttype Most Common Values (Meest voorkomende waarden) standaard weergegeven als er meer tekstwaarden aanwezig zijn en wordt het kaarttype Binned Frequency (Opslagfrequentie) voor numerieke distributie getoond als er meer numerieke velden aanwezig zijn in het veld. Er wordt een wisselknop getoond zodat u kunt schakelen naar het kaarttype Most Common Values Frequency (Frequentie meest voorkomende waarden) voor velden met niet-unieke waarden als A is geselecteerd; of u kunt terugschakelen naar de kaart voor numerieke distributie als #1 is geselecteerd. Niet alle kaarttypen bevatten het aantal null-waarden als in het veld null-waarden aanwezig zijn.

Kaarten voor tegelweergave: Binnen Frequency (Opslagfrequentie) numerieke distributie, Sample Values (Voorbeeldwaarden) en Most Common Values Frequency (Frequentie meest voorkomende waarden)

Kaarten voor weergave Profieltegel

Kaart Sample values (Voorbeeldwaarden)

De kaart Sample values (Voorbeeldwaarden) wordt getoond als alle waarden uniek zijn en alleen tekstwaarden zijn. De eerste drie waarden worden weergegeven (indien aanwezig).

Profielkaart Sample values (Voorbeeldwaarden)
Voorbeeldwaarden profielkaart

Profielcriteria Sample values (Voorbeeldwaarden): Veldwaarden worden met deze kaart geprofileerd als de kardinaliteit hoog is (alle afzonderlijke waarden). In het geval elke waarde op tekst is gebaseerd en uniek is, geven enkele voorbeeldwaarden het meeste inzicht in dit type veldgegevens.

Elke profielkaart voor Sample values (Voorbeeldwaarden) bestaat uit het volgende: 

  • Veldnaam
  • Kardinaliteit
  • Tot drie voorbeeldwaarden (velden kunnen minder dan drie waarden bevatten)

Kaart Most common values frequency (Frequentie meest voorkomende waarden)

De kaart Most common values frequency (Frequentie meest voorkomende waarden) toont de twee waarden die het vaakst voorkomen en de frequentie van die waarden en alle andere waarden gebundeld als Overige. Tenzij er slechts drie waarden zijn, dan worden de drie waarden weergegeven met de bijbehorende frequentie. Deze profielkaart kan worden toegepast op tekstwaarden, numerieke waarden of waarden op basis van gecombineerde gegevens.

Profielkaart Most common values frequency (Frequentie meest voorkomende waarden) met tekstwaarden
Frequentie meest voorkomende waarden profielkaart
Profielkaart Most common values frequency (Frequentie meest voorkomende waarden) met numerieke waarden
Meest voorkomende waarden profielkaart

Criteria voor Most common values frequency (Frequentie meest voorkomende waarden) : Velden met weinig waarden of een ongelijke verdeling van waarden worden geprofileerd op basis van de kaart Most common values frequency (Frequentie meest voorkomende waarden). Dit type profilering wordt alleen toegepast als dezelfde waarden vaker voorkomen. Gebruikers krijgen zo snel inzicht in de verdeling van veldwaarden. Als de veldgegevens zowel tekstwaarden als numerieke waarden bevatten, en er meer tekstwaarden dan numerieke waarden zijn, wordt de kaart Most common values frequency (Frequentie meest voorkomende waarden) getoond. De wisselknop Binned Frequency (Opslagfrequentie) wordt getoond als het veld meer dan drie numerieke waarden bevat.

Op elke profielkaart voor Most common values frequency (Frequentie meest voorkomende waarden) wordt het volgende getoond: 

  • Veldnaam
  • Kardinaliteit
  • Meest voorkomende waarden en hun frequentie
  • Overige, gecombineerde frequentie van de overgebleven waarden

Kaart Binned frequency (Opslagfrequentie)

De kaart Binned frequency (Opslagfrequentie) toont de verdeling en profileringsgegevens die relevant zijn voor numerieke velden, zoals minimum-, gemiddelde- en maximumwaarden. Als de veldgegevens zowel tekstwaarden als numerieke waarden bevatten, en er meer tekstwaarden dan numerieke waarden zijn, wordt de kaart Binned frequency (Opslagfrequentie) getoond. Het kaarttype Most Common Values Frequency (Frequentie meest voorkomende waarden) is beschikbaar voor alle velden die niet-unieke waarden bevatten.

Profielkaart Binned frequency (Opslagfrequentie)

Opslagfrequentie profielkaart

Op elke profielkaart voor Binned frequency (Opslagfrequentie) wordt het volgende getoond: 

  • Veldnaam
  • Kardinaliteit
  • Histogram met de verdeling van de numerieke gegevens
  • Minimumwaarde
  • Gemiddelde waarde (het totaal gedeeld door het totaal aantal waarden in de gegevensverzameling)
  • Maximumwaarde

Weergave profiellijst

Met de weergave profiellijst wordt een tabel weergegeven met de opties voor profielstatistieken. Gebruikers kunnen de desgewenste metrische gegevens bekijken die van betekenis zijn voor de gegevensverzameling die wordt geprofileerd in Columns. De eerste negen statistieken worden standaard vooraf geselecteerd.

Vanuit het tabblad Introductiepagina in de hub, navigeert u naar Uw gegevens; of ga naar Catalogus en filter op TypenGegevens.

  1. Selecteer Gegevensverzameling openen selecteer vervolgens Profielgegevens. Met deze actie wordt de pagina Profiel voor de gegevensverzameling geopend. Selecteer de knop Kolommen en schakel het selectievakje naast de gewenste profielstatistieken in. Deze statistieken moeten worden geselecteerd (selectievakje ernaast) om het veld (kolom) te profileren zodat ze in de tabel verschijnen. De volgende lijstdetails zijn beschikbaar voor profielstatistieken.

    Profielstatistieken
    Statistieken Beschrijving
    Naam Veldnaam (bijvoorbeeld: CategoryID
    Gegevenstype

    Qlik Sense registreert gegevens van veel verschillende systemen, een externe naar interne uniforme toewijzing van gegevenstypen wordt opgelegd op veldgegevens (kolom) om informatie te vergaren. De volgende waarden voor gegevenstype worden ondersteund:

    • Datum: Een datum met de maand, dag, jaar in de ISO 8601-indeling of YYYY-MM-DD

    • Tijd: Een tijdwaarde met uur, minuten, seconden in ISO 8601-indeling hh.mm.ss.sss±hh:mm
    • Datetime: Een waarde voor datum en tijd met jaar, maand, dag, uur, minuut, seconde en breuken in de indeling YYYY-MM-DDThh.mm.ss.sss
    •  Timestamp: Een waarde voor tijdstempel met jaar, maand, dag, uur, minuut, seconde en tijdzone in de indeling YYYY-MM-DDThh.mm.ss.sssZ
    • String: Tekengegevens die tekst vertegenwoordigen
    • Double: Een numeriek gegevenstype met 64-bits IEEE 754 float met dubbele precisie
    • Decimal: Een exact numeriek gegevenstype dat wordt gedefinieerd door zijn precisie (totaal aantal cijfers) en schaal (aantal cijfers rechts van het decimaalteken)
    • Integer: Positieve of negatieve gehele getallen
    • Boolean: Een Booleaanse waarde (TRUE/FALSE)
    • Binary: Categorische gegevens die precies twee mogelijk waarde kunnen aannemen, zoals "1" en "2"
    • Custom: Een type dat buiten het toegewezen type valt dat in het systeem bekend is
    Distinctieve waarden Kardinaliteit, aantal afzonderlijke waarden dat voor dit veld aanwezig is
    Steekproefwaarden Steekproefwaarden (3 steekproefwaarden worden weergegeven)
    Som Som van alle waarden in dit veld ("0" wordt weergegeven voor tekenreeksvelden)
    Min Minimum waargenomen waarde voor dit veld (numerieke velden)
    Max Maximum waargenomen waarde voor dit veld (numerieke velden)
    Gemiddelde Gemiddelde waargenomen waarde voor dit veld
    Systeeminfo Bestandlabels die zijn toegepast om de codeset te identificeren (ex. $ascii, $text)
    Standaardafwijking Standaardafwijking voor numerieke velden
    Positieve waarden Aantal positieve waarden
    Negatieve waarden Aantal negatieve waarden
    Nulwaarden Aantal "0"-waarden
    Lege tekenreeksen Aantal lege tekenreeksen
    Min. lengte Laagst waargenomen tekenlengte
    Gemiddelde lengte Gemiddeld waargenomen tekenlengte
    Max. lengte Hoogst waargenomen tekenlengte
    Eerste gesorteerde waarde De eerste (laagste) waarde voor sorteren (tekenreeksvelden)
    Laatste gesorteerde waarde De laatste (hoogste) waarde voor sorteren (tekenreeksvelden)
    Numerieke waarden Aantal numerieke waarden
    Tekstwaarden Aantal tekstwaarden
    Meest voorkomende waarden De drie meest voorkomende waarden in het veld

Steekproef van gegevens

Een steekproef van gegevens is een subset van een gegevensverzameling voor populatie. Het is een handig hulpmiddel voor gegevensbeheerders om ervoor te zorgen dat de gegevens voldoen aan verwachte patronen en indelingen. App-makers krijgen hierdoor een idee van de velden en veldgegevens binnen de context van andere records en de gegevensverzameling. Deze weergaven bieden een eerst inkijk in de gegevens; ontwikkelaars kunnen beginnen met het verkennen van de gegevens voor analyse en het verkennen van mogelijke correlaties.

Selecteer Steekproef van gegevens om een steekproef te bekijken van de eerste 20 gegevenswaarden van elk veld.

Voorbeeld van gegevensverzamelingsengine
  • Selecteer de knop vervolgkeuzepijl pictogram en vervolgens Steekproef om een steekproef (n=20) te bekijken van gegevenswaarden van elk veld.

Machtigingen

Machtigingen zijn vereist voor het profileren en nemen van steekproeven van gegevens. Het profileren van gegevens valt onder de uitgebreidere machtiging Gegevensbron profileren. Ga voor meer informatie naar Machtigingen in gedeelde ruimtes beheren of Rechten in beheerde ruimtes beheren.

  • Gegevens profileren > Gegevensbron profileren

Voorbeeld