Hantering av metadata på fältnivå och dataprofilering
Metadata på fältnivå gör det möjligt för användare att använda alias, beskrivningar och klassificeringar för fält. Dessa funktioner hjälper till att identifiera specifika data och känsliga fält.
Profilering ger dataadministratörer tillgång till omfattande teknisk information avseende sina datauppsättningar. Apputvecklare använder profilstatistik och datasampling för att få idéer och råd när de skapar appar och planerar visualiseringar. Fältprofilering kan hjälpa dataanalytiker och affärsanvändare att nå insikter snabbare. De kan visa och visualisera värdefulla fältprofilsmätvärden på ett ögonblick utan att behöva skapa en app först.
Behörigheter
Behörigheter krävs för att kunna profilera och välja exempeldata. Du måste ha en roll i en datauppsättnings utrymme som låter dig profilera datakällor. Mer information finns i Hantera behörigheter i delade utrymmen eller Hantera behörigheter i hanterade utrymmen.
Hantering av metadata på fältnivå
Du kan komma åt och redigera metadata för varje fält i datauppsättningen från fliken Profil. Välj valfritt kort från Brick-vyn , valfri rad från List-vyn
, eller valfri kolumn från Data-vyn
för att öppna det aktuella fältets Detalj-panel till höger om rutnätet. Metadatafält på fältnivå – Fältalias, Beskrivning, Taggar och Klassificering – är valfria och kan definieras och redigeras från den här panelen.
Detaljerad | Beskrivning |
---|---|
Fältalias* | Ange ett valfritt alternativt namn för att göra fältnamnen mer meningsfulla i profilanalysen. Aliasfältnamn visas endast i profilanalysen och påverkar inte de tekniska kolumnnamnen. |
Beskrivning |
Ange all information som kan vara till hjälp för användare som visar fältmetadata och profilering för fältet. |
Taggar | Ange textavsnitt för att definiera och kategorisera detta fält och dess data. |
Klassificering | Markera kryssrutan för Personlig information eller Känslig information. |
Metadata på fältnivå för en XLSX-fil med flera ark

Alla datatyper är inte profilerade som standard. Följande visar istället en begränsad profil tills du profilerar dem:
-
QVD
-
Parquet
För mer information om den begränsade profilen, se Begränsad profilvy
Profilera data
Profilstatistik utför kolumnanalyser som mäter incidens, intervall och värden som förekommer inom datauppsättningar. Dessa siffror beskriver relationer mellan fältvärden som:
- Antal distinkta värden (kardinalitet)
- exempelvärden, vanligaste värden och värdefrekvens
- redundanser som kan användas för att identifiera standardvärden eller potentiella dubblettvärden
- antal null-värden, strängvärden och numeriska värden
- Information om värdeintervall, inklusive min, max, medel, summa och standardavvikelse.
Katalogen ger tre vyer av fältprofildata:
-
Brickvyn är en kortbaserad, visuell representation av fält utlagda som ett rutnät.
-
Listvyn är en tabellöversikt över konfigurerbar profilstatistik.
-
Tabellvyn listar fältkolumnnamn och upp till de första tjugo posterna i datauppsättningen.
Växla mellan profilvyer med ikonen Tile, List
eller Data
.
Brickvy
Vyn Profilbricka är en visuell fältprofil som visar det mest informativa innehållet för den typen av fält. Vilken vykorttyp som visas som standard bestäms av om det finns flest numeriska värden eller textvärden i fältet. Exempel: Om ett fält har både textvärden och numeriska värden visas korttypen Most Common Values (Vanligaste värden) som standard om det finns flest textvärden, och korttypen Binned Frequency (Bin-frekvens) för numerisk fördelning visas om det finns flest numeriska värden i fältet. En växlingsruta visas så att du kan växla till korttypen Most Common Values (Frekvens för vanligaste värden) för fält som har icke-unika värden när är valt. Du kan även växla tillbaka till kortet för numerisk fördelning om Samlad frekvens
är valt. Observera att alla korttyper inkluderar antalet null-värden om det finns null-värden i fältet.
Brickvy Fält profileras av mätvärden som är viktiga för den typ av data som finns i det fältet (till exempel text jämfört med numeriska värden)

Kortet Exempelvärden
Kortet Exempelvärden visas när alla värden är unika och bara innehåller text. Den kommer att lista (upp till) de tre första värdena och det totala antalet ytterligare unika värden.

Exempelvärden profilkriterier: fältvärden profileras med det här kortet när kardinaliteten är hög (bara distinkta värden). Om alla värden är textbaserade och unika, ger några exempelvärden den bästa första insynen i den här fälttypens data.
Varje Exempelvärde-profilkort ger:
- Fältnamn
- Kardinalitet (distinkta värden)
- Högst tre exempelvärden (fält kan ha färre än tre värden)
Kortet Most Common Values Frequency (Frekvens för vanligaste värden)
Kortet De vanligaste värdena visar de fem vanligaste värdena och deras frekvens. Om det finns fler värden än fem distinkta värden kombineras de och visas som Övriga. Om några fält saknas visas summan som Null. Detta profilkort kan användas på textvärden, numeriska värden och värden med blandade data.

Kriterier för Most Common Values Frequency (Frekvens för vanligaste värden): Fält som har få värden eller skev fördelning av värden profileras med kortet Most Common Values Frequency (Frekvens för vanligaste värden). Denna profilering används endast när det finns flera instanser av samma värden. Användare kan få snabb insikt i fördelningen av fältvärden. Om fältdata innehåller både textvärden och numeriska värden och det finns fler textvärden än numeriska värden visas kortet Most Common Values Frequency (Frekvens för vanligaste värden). Växlingen för Binned frequency (Bin-frekvens) visas när det finns fler än tre numeriska värden i fältet.
Varje Most Common Values Frequency (Frekvens för vanligaste värden)-profilkort ger:
- Fältnamn
- Kardinalitet (distinkta värden)
- De vanligaste värdena och deras frekvens
- Other (Andra), som är den kombinerade frekvensen av övriga värden
Kortet Samlad frekvens
Kortet Binned frequency (Bin-frekvens) visar fördelnings och profileringsinformation som är relevant för numeriska fält, inklusive minsta, genomsnittliga och högsta datavärden. Om fältdata innehåller både textvärden och numeriska värden och det finns fler numeriska värden än textvärden visas kortet Binned frequency (Bin-frekvens). Korttypen Most Common Values Frequency (Frekvens för vanligaste värden) är tillgänglig för alla fält som har icke-unika värden.
Brickvykort: Numerisk fördelning av Samlad frekvens

Varje Samlad frekvens-profilkort ger:
- Fältnamn
- Kardinalitet (distinkta värden)
- Histogram som visar fördelningen av numeriska data
- Minsta värde
- Medelvärde (summan av talen delat med det totala antalet värden i datauppsättningen)
- Största värde
Listvy
Profillistvyn ger en tabell med profilstatistikalternativ. Användare kontrollerar de för datauppsättningen viktigaste mätvärdena under kolumnväljaren som återfinns när du skrollar till tabellens högra kant. De nio första värdena är förvalda som standard.
Listvy: välj profilstatistik från menyväljaren som du hittar genom att skrolla till höger i tabellen

Datavy
Profildatavyn visar din datauppsättning som en vanlig datatabell med fältkolumnnamn och (upp till) de första tjugo värdena.
Datavy: datauppsättningens kolumnnamn och de första tjugo posterna visas

Begränsad profilvy
Vissa datauppsättningar är inte profilerade som standard. Istället visar Profil en begränsad dataprofil. Du kan profilera data genom att klicka på Profilera datauppsättning.
Följande datatyper visar en begränsad profilvy tills de profileras:
-
QVD
-
Parquet
En begränsad profil av en datauppsättning från QVD
