Metagegevens en gegevensprofilering op veldniveau beheren
Gegevensbeheerders hebben met behulp van profilering toegang tot belangrijke technische gegevens over hun gegevensverzamelingen. App-ontwikkelaars gebruiken profielstatistieken en steekproeven van gegevens om ideeën op te doen en als richtlijn voor het maken van apps en het plannen van visualisaties. Door velden te profileren kunnen gegevensanalisten en zakelijke gebruikers sneller inzichten opdoen. Ze kunnen waardevolle metrische gegevens van veldprofielen direct bekijken en visualiseren zonder eerst een app te hoeven maken. Dankzij metagegevens op veldniveau kunnen gebruikers aliassen, beschrijvingen en classificaties op velden toepassen. Deze functies helpen bij het identificeren van specifieke gegeens en velden met gevoelige informatie.
Metagegevens op veldniveau beheren
Vanuit het tabblad Velden hebt u toegang tot en kunt u metagegevens bewerken voor elk veld in uw gegevensverzameling. Selecteer een kaart uit de tegelweergave, een rij uit de lijstweergave of een kolom uit de weergave Gegevens om rechts van het raster het detailvenster voor dat veld te openen. Velden met metagegevens op veldniveau, Veldalias, Beschrijving, Tags en Classificaties, zijn optioneel en kunnen worden gedefinieerd en bewerkt vanuit dit venster.
Detail | Beschrijving |
---|---|
Veldalias | Voer optioneel een alternatieve naam in om veldnamen te maken die meer betekenis hebben in de profielanalyse. Aliasveldnamen worden alleen in de profielanalyse weergegeven en hebben geen invloed op de technische kolomnamen. |
Beschrijving | Voer informatie in die mogelijk behulpzaam is voor gebruikers die metagegevens op veldniveau bekijken en profilering voor het veld. |
Labels | Geef tekstfragmenten op om dit veld en de gegevens te definiëren en categoriseren. |
Classificatie | Selecteer het selectievakje voor Persoonlijke gegevens of Gevoelige informatie. |
Gegevens profileren
Profielstatistieken bieden kolomanalyses waarbij de incidenten, het bereik en de waarden binnen gegevensverzamelingen worden gemeten. Deze metrische gegevens beschrijven relaties tussen veldwaarden, zoals:
- Aantal afzonderlijke waarden (kardinaliteit)
- Voorbeeldwaarden, meest voorkomende waarden en waardefrequentie
- Redundantie die van pas komt bij het identificeren van standaard- of mogelijke dubbele waarden
- Aantal null-, tekenreeks- en numerieke waarden
- Informatie over waardebereiken, inclusief min, max, gemiddelde, som en standaardafwijking
Met behulp van de functie catalogiseren kunnen veldprofielgegevens op drie manieren worden weergegeven: Tile view, List view en Data view.
Tile view is een visuele kaartweergave van velden in de vorm van een raster.
List view is een overzichtstabel van configureerbare profielstatistieken.
Table view toont veldkolomnamen tot en met de eerste twintig records van de gegevensverzameling.
Selecteer het pictogram Tile, List of Gegevens om te schakelen tussen profielweergaven.
Weergave Profieltegel
De weergave Profieltegel is een visueel veldprofiel voor het weergeven van de meest relevante inhoud voor dat type veld. Het standaard kaartweergavetype wordt bepaald door het feit of het aantal numerieke waarden of tekstwaarden hoger is voor dat veld. Als velden bijvoorbeeld zowel tekstwaarden als numerieke waarden bevatten, wordt het kaarttype Meest voorkomende waarden standaard weergegeven als er meer tekstwaarden aanwezig zijn en wordt het kaarttype Opslagfrequentie voor numerieke distributie getoond als er meer numerieke velden aanwezig zijn in het veld. Er wordt een wisselknop getoond zodat u kunt schakelen naar het kaarttype Meest voorkomende waarden voor velden met niet-unieke waarden als is geselecteerd; of u kunt terugschakelen naar de kaart voor numerieke distributie als Opslagfrequentie is geselecteerd. Niet alle kaarttypen bevatten het aantal null-waarden als in het veld null-waarden aanwezig zijn.
Kaart Voorbeeldwaarden
De kaart Voorbeeldwaarden wordt getoond als alle waarden uniek zijn en alleen tekstwaarden zijn. Het toont (maximaal) de eerste drie waarden en het totale aantal bijkomende unieke waarden.
Profielcriteria voorbeeldwaarden: veldwaarden worden met deze kaart geprofileerd als de kardinaliteit hoog is (alle afzonderlijke waarden). In het geval elke waarde op tekst is gebaseerd en uniek is, geven enkele voorbeeldwaarden het meeste inzicht in dit type veldgegevens.
Elke profielkaart voor Voorbeeldwaarden bestaat uit het volgende:
- Veldnaam
- Kardinaliteit (afzonderlijke waarden)
- Tot drie voorbeeldwaarden (velden kunnen minder dan drie waarden bevatten)
Kaart Frequentie meest voorkomende waarden
De kaart Frequentie meest voorkomende waarden toont de vijf meest voorkomende waarden en hun frequentie. Als er meer waarden zijn dan vijf afzonderlijke waarden, worden deze gecombineerd en weergegeven als Overig. Als er velden ontbreken, wordt het totaal weergegeven als Null. Deze profielkaart kan worden toegepast op tekstwaarden, numerieke waarden of waarden op basis van gecombineerde gegevens.
Criteria Frequentie meest voorkomende waarden: velden met weinig waarden of een ongelijke verdeling van waarden worden geprofileerd op basis van de kaart Frequentie meest voorkomende waarden. Dit type profilering wordt alleen toegepast als dezelfde waarden vaker voorkomen. Gebruikers krijgen zo snel inzicht in de verdeling van veldwaarden. Als de veldgegevens zowel tekstwaarden als numerieke waarden bevatten, en er meer tekstwaarden dan numerieke waarden zijn, wordt de kaart Frequentie meest voorkomende waarden getoond. De wisselknop Opslagfrequentie wordt getoond als het veld meer dan drie numerieke waarden bevat.
Op elke profielkaart voor Frequentie meest voorkomende waarden wordt het volgende getoond:
- Veldnaam
- Kardinaliteit (afzonderlijke waarden)
- Meest voorkomende waarden en hun frequentie
- Overige, gecombineerde frequentie van de overgebleven waarden
Kaart Opslagfrequentie
De kaart Opslagfrequentie toont de verdeling en profileringsgegevens die relevant zijn voor numerieke velden, zoals minimum-, gemiddelde- en maximumwaarden. Als de veldgegevens zowel tekstwaarden als numerieke waarden bevatten, en er meer tekstwaarden dan numerieke waarden zijn, wordt de kaart Opslagfrequentie getoond. Het kaarttype Frequentie meest voorkomende waarden is beschikbaar voor alle velden die niet-unieke waarden bevatten.
Op elke profielkaart voor Opslagfrequentie wordt het volgende getoond:
- Veldnaam
- Kardinaliteit (afzonderlijke waarden)
- Histogram met de verdeling van de numerieke gegevens
- Minimumwaarde
- Gemiddelde waarde (het totaal gedeeld door het totaal aantal waarden in de gegevensverzameling)
- Maximumwaarde
Weergave profiellijst
Met de weergave profiellijst wordt een tabel weergegeven met de opties voor profielstatistieken. Gebruikers kiezen de gewenste metrische gegevens die het meest bruikbaar zijn voor de gegevensverzameling in de kolomkiezer . Deze is te vinden door in de tabel helemaal naar rechts te scrollen. De eerste negen statistieken worden standaard vooraf geselecteerd.
Weergave voor profielgegevens
De weergave voor profielgegevens toont uw gegevensverzameling als een strakke gegevenstabel met veldkolomnamen en de eerste twintig waarden.
Machtigingen
Machtigingen zijn vereist voor het profileren en nemen van steekproeven van gegevens. U moet beschikken over een rol in de ruimte van de gegevensverzameling die u machtigt de gegevensbronnen te profileren. Ga voor meer informatie naar Machtigingen in gedeelde ruimtes beheren of Rechten in beheerde ruimtes beheren.