Ga naar hoofdinhoud Ga naar aanvullende inhoud

Metagegevens en gegevensprofilering op veldniveau beheren

Gegevensbeheerders hebben met behulp van profilering toegang tot belangrijke technische gegevens over hun gegevensverzamelingen. App-ontwikkelaars gebruiken profielstatistieken en steekproeven van gegevens om ideeën op te doen en als richtlijn voor het maken van apps en het plannen van visualisaties. Door velden te profileren kunnen gegevensanalisten en zakelijke gebruikers sneller inzichten opdoen. Ze kunnen waardevolle metrische gegevens van veldprofielen direct bekijken en visualiseren zonder eerst een app te hoeven maken. Dankzij metagegevens op veldniveau kunnen gebruikers aliassen, beschrijvingen en classificaties op velden toepassen. Deze functies helpen bij het identificeren van specifieke gegeens en velden met gevoelige informatie.

InformatieQlik Cloud profileert maximaal 12 miljoen rijen in een gegevensverzameling. Als een gegevensverzameling meer dan 12 miljoen rijen bevat, worden alleen de eerste 12 miljoen rijen geprofileerd. Er worden metagegevens voor alle velden toegevoegd, ongeacht het aantal rijen dat is geprofileerd.

Metagegevens op veldniveau beheren

Vanuit het tabblad Velden hebt u toegang tot en kunt u metagegevens bewerken voor elk veld in uw gegevensverzameling. Selecteer een kaart uit de Tegelpictogram voor tegelweergave selecteren tegelweergave, een rij uit de Lijstpictogram voor lijstweergave selecteren lijstweergave of een kolom uit de weergave Gegevens om rechts van het raster het detailvenster voor dat veld te openen. Velden met metagegevens op veldniveau, Veldalias, Beschrijving, Tags en Classificaties, zijn optioneel en kunnen worden gedefinieerd en bewerkt vanuit dit venster.

Velden met metagegevens op veldniveau
DetailBeschrijving
VeldaliasVoer optioneel een alternatieve naam in om veldnamen te maken die meer betekenis hebben in de profielanalyse. Aliasveldnamen worden alleen in de profielanalyse weergegeven en hebben geen invloed op de technische kolomnamen.
Beschrijving

Voer informatie in die mogelijk behulpzaam is voor gebruikers die metagegevens op veldniveau bekijken en profilering voor het veld.

LabelsGeef tekstfragmenten op om dit veld en de gegevens te definiëren en categoriseren.
ClassificatieSelecteer het selectievakje voor Persoonlijke gegevens of Gevoelige informatie.
InformatieGeselecteerde classificaties op veldniveau Persoonlijke gegevens en Gevoelige informatie worden op het tabblad Overzicht gegevensverzameling weergegeven per veld, onder de technische metagegevens van de gegevensset.
InformatieClassificaties die zijn toegepast op velden in Excel-bestanden met meerdere werkbladen, worden vermeld met de werkbladnaam en veldnaam (voorbeeld: Persoonlijke informatie: Sheet1/EmpID).

Metagegevens op veldniveau voor een XLSX-bestand met meerdere werkbladen

Selecteer een veldkaart in de tegelweergave om het deelvenster Details te openen

Gegevens profileren

Profielstatistieken bieden kolomanalyses waarbij de incidenten, het bereik en de waarden binnen gegevensverzamelingen worden gemeten. Deze metrische gegevens beschrijven relaties tussen veldwaarden, zoals:

  • Aantal afzonderlijke waarden (kardinaliteit)
  • Voorbeeldwaarden, meest voorkomende waarden en waardefrequentie
  • Redundantie die van pas komt bij het identificeren van standaard- of mogelijke dubbele waarden
  • Aantal null-, tekenreeks- en numerieke waarden
  • Informatie over waardebereiken, inclusief min, max, gemiddelde, som en standaardafwijking

Met behulp van de functie catalogiseren kunnen veldprofielgegevens op drie manieren worden weergegeven: Tile view, List view en Data view.

Tile view is een visuele kaartweergave van velden in de vorm van een raster.

List view is een overzichtstabel van configureerbare profielstatistieken.

Table view toont veldkolomnamen tot en met de eerste twintig records van de gegevensverzameling.

Selecteer het pictogram TileTegelpictogram voor tegelweergave selecteren, ListLijstpictogram voor lijstweergave selecteren of Gegevens om te schakelen tussen profielweergaven.

Weergave Profieltegel

De weergave Profieltegel is een visueel veldprofiel voor het weergeven van de meest relevante inhoud voor dat type veld. Het standaard kaartweergavetype wordt bepaald door het feit of het aantal numerieke waarden of tekstwaarden hoger is voor dat veld. Als velden bijvoorbeeld zowel tekstwaarden als numerieke waarden bevatten, wordt het kaarttype Meest voorkomende waarden standaard weergegeven als er meer tekstwaarden aanwezig zijn en wordt het kaarttype Opslagfrequentie voor numerieke distributie getoond als er meer numerieke velden aanwezig zijn in het veld. Er wordt een wisselknop getoond zodat u kunt schakelen naar het kaarttype Meest voorkomende waarden voor velden met niet-unieke waarden als pictogram Meest voorkomende waarden is geselecteerd; of u kunt terugschakelen naar de kaart voor numerieke distributie als Opslagfrequentie pictogram Opslagfrequentie is geselecteerd. Niet alle kaarttypen bevatten het aantal null-waarden als in het veld null-waarden aanwezig zijn.

Tegelweergave: velden worden geprofileerd op basis van metrische gegevens die van betekenis zijn voor het soort gegevens die in het veld zijn opgenomen (bijvoorbeeld: tekst versus numerieke waarden)

Tegelweergave van profiel van gegevensverzameling

Kaart Voorbeeldwaarden

De kaart Voorbeeldwaarden wordt getoond als alle waarden uniek zijn en alleen tekstwaarden zijn. Het toont (maximaal) de eerste drie waarden en het totale aantal bijkomende unieke waarden.

Kaart tegelweergave: Voorbeeldwaarden
Tegel voorbeeldwaarden

Profielcriteria voorbeeldwaarden: veldwaarden worden met deze kaart geprofileerd als de kardinaliteit hoog is (alle afzonderlijke waarden). In het geval elke waarde op tekst is gebaseerd en uniek is, geven enkele voorbeeldwaarden het meeste inzicht in dit type veldgegevens.

Elke profielkaart voor Voorbeeldwaarden bestaat uit het volgende:

  • Veldnaam
  • Kardinaliteit (afzonderlijke waarden)
  • Tot drie voorbeeldwaarden (velden kunnen minder dan drie waarden bevatten)

Kaart Frequentie meest voorkomende waarden

De kaart Frequentie meest voorkomende waarden toont de vijf meest voorkomende waarden en hun frequentie. Als er meer waarden zijn dan vijf afzonderlijke waarden, worden deze gecombineerd en weergegeven als Overig. Als er velden ontbreken, wordt het totaal weergegeven als Null. Deze profielkaart kan worden toegepast op tekstwaarden, numerieke waarden of waarden op basis van gecombineerde gegevens.

Kaart tegelweergave: Frequentie meest voorkomende waarden
Tegel Meest voorkomende waarden

Criteria Frequentie meest voorkomende waarden: velden met weinig waarden of een ongelijke verdeling van waarden worden geprofileerd op basis van de kaart Frequentie meest voorkomende waarden. Dit type profilering wordt alleen toegepast als dezelfde waarden vaker voorkomen. Gebruikers krijgen zo snel inzicht in de verdeling van veldwaarden. Als de veldgegevens zowel tekstwaarden als numerieke waarden bevatten, en er meer tekstwaarden dan numerieke waarden zijn, wordt de kaart Frequentie meest voorkomende waarden getoond. De wisselknop Opslagfrequentie wordt getoond als het veld meer dan drie numerieke waarden bevat.

Op elke profielkaart voor Frequentie meest voorkomende waarden wordt het volgende getoond: 

  • Veldnaam
  • Kardinaliteit (afzonderlijke waarden)
  • Meest voorkomende waarden en hun frequentie
  • Overige, gecombineerde frequentie van de overgebleven waarden

Kaart Opslagfrequentie

De kaart Opslagfrequentie toont de verdeling en profileringsgegevens die relevant zijn voor numerieke velden, zoals minimum-, gemiddelde- en maximumwaarden. Als de veldgegevens zowel tekstwaarden als numerieke waarden bevatten, en er meer tekstwaarden dan numerieke waarden zijn, wordt de kaart Opslagfrequentie getoond. Het kaarttype Frequentie meest voorkomende waarden is beschikbaar voor alle velden die niet-unieke waarden bevatten.

Kaart tegelweergave:  Numerieke verdeling voor opslagfrequentie

Kaart Opslagfrequentie

Op elke profielkaart voor Opslagfrequentie wordt het volgende getoond: 

  • Veldnaam
  • Kardinaliteit (afzonderlijke waarden)
  • Histogram met de verdeling van de numerieke gegevens
  • Minimumwaarde
  • Gemiddelde waarde (het totaal gedeeld door het totaal aantal waarden in de gegevensverzameling)
  • Maximumwaarde

Weergave profiellijst

Met de weergave profiellijst wordt een tabel weergegeven met de opties voor profielstatistieken. Gebruikers kiezen de gewenste metrische gegevens die het meest bruikbaar zijn voor de gegevensverzameling in de kolomkiezer pictogram Kolommen. Deze is te vinden door in de tabel helemaal naar rechts te scrollen. De eerste negen statistieken worden standaard vooraf geselecteerd.

Lijstweergave: selecteer de gewenste profielstatistieken in de kolomkiezer door in de tabel naar rechts te scrollen

Lijstweergave van profiel van gegevensverzameling

Weergave voor profielgegevens

De weergave voor profielgegevens toont uw gegevensverzameling als een strakke gegevenstabel met veldkolomnamen en de eerste twintig waarden.

Gegevensweergave: kolomnamen van gegevensverzamelingen en de eerste twintig records worden getoond

Gegevensweergave van profiel van gegevensverzameling

Machtigingen

Machtigingen zijn vereist voor het profileren en nemen van steekproeven van gegevens. U moet beschikken over een rol in de ruimte van de gegevensverzameling die u machtigt de gegevensbronnen te profileren. Ga voor meer informatie naar Machtigingen in gedeelde ruimtes beheren of Rechten in beheerde ruimtes beheren.

Meer informatie

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een typfout, een ontbrekende stap of een technische fout – laat het ons weten zodat we dit kunnen verbeteren!