Hantering av metadata på fältnivå och dataprofilering

Metadata på fältnivå gör det möjligt för användare att använda alias, beskrivningar och klassificeringar för fält. Dessa funktioner hjälper till att identifiera specifika data och känsliga fält.

Profilering ger dataadministratörer tillgång till omfattande teknisk information avseende sina datauppsättningar. Applikationsutvecklare använder profilstatistik och datasampling för att få idéer och vägledning för att skapa applikationer och planera visualiseringar. Fältprofilering kan hjälpa dataanalytiker och affärsanvändare att nå insikter snabbare. De kan visa och visualisera värdefulla fältprofilsmätvärden på ett ögonblick utan att behöva skapa en applikation först.

Qlik Cloud profilerar bara upp till 12 miljoner rader i en datauppsättning. Om en datauppsättning överskrider 12 miljoner rader profileras bara de första 12 miljoner raderna. Metadata för alla fält läggs fortfarande till oavsett antalet rader som profileras.

Profileringsprocessen har en tidsbegränsning som tillämpas på både filbaserade och databasbaserade datauppsättningar, vilket begränsar profileringen till ett tidsfönster på 30 minuter. En profil markeras som misslyckad om den överskrider denna tidsgräns.

Behörigheter

Behörigheter krävs för att kunna profilera och välja exempeldata. Du måste ha en roll i en datauppsättnings utrymme som låter dig profilera datakällor. Mer information finns i Hantera behörigheter i delade utrymmen eller Hantera behörigheter i hanterade utrymmen.

Hantering av metadata på fältnivå

Du kan komma åt och redigera metadata för varje fält i datauppsättningen från fliken Profil. Välj valfritt kort från Brick-vyn Brickvy , valfri rad från List-vyn Listvy , eller valfri kolumn från Data-vyn Datavy för att öppna det aktuella fältets Detalj-panel till höger om rutnätet. Metadatafält på fältnivå – Fältalias, Beskrivning, Taggar och Klassificering – är valfria och kan definieras och redigeras från den här panelen.

Fält för fältmetadata
Detaljerad	Beskrivning
Fältalias*	Ange ett valfritt alternativt namn för att göra fältnamnen mer meningsfulla i profilanalysen. Aliasfältnamn visas endast i profilanalysen och påverkar inte de tekniska kolumnnamnen.
Beskrivning	Ange all information som kan vara till hjälp för användare som visar fältmetadata och profilering för fältet.
Taggar	Ange textavsnitt för att definiera och kategorisera detta fält och dess data.
Klassificering	Markera kryssrutan för Personlig information eller Känslig information.

De valda fältnivåklassificeringarna Personlig information och Känslig information visas på fliken Översikt över datauppsättning listade per fält under tekniska datauppsättningsmetadata.

Klassificeringar som tillämpas på fält i Excel-filer med flera ark listas med arknamn och fältnamn (exempel: Personuppgifter: Sheet1/EmpID).

Välj ett fältkort i brickvyn för att öppna panelen Detaljer. — Metadata på fältnivå för en XLSX-fil med flera ark

Alla datatyper är inte profilerade som standard. Följande visar istället en begränsad profil tills du profilerar dem:

QVD
Parquet

För mer information om den begränsade profilen, se Begränsad profilvy

Profilera data

Profilstatistik utför kolumnanalyser som mäter incidens, intervall och värden som förekommer inom datauppsättningar. Dessa siffror beskriver relationer mellan fältvärden som:

Antal distinkta värden (kardinalitet)
exempelvärden, vanligaste värden och värdefrekvens
redundanser som kan användas för att identifiera standardvärden eller potentiella dubblettvärden
antal null-värden, strängvärden och numeriska värden
information om värdeintervall, inklusive min, max, medel, summa och standardavvikelse.

Katalogen ger tre vyer av fältprofildata:

Brickvyn är en kortbaserad, visuell representation av fält utlagda som ett rutnät.
Listvyn är en tabellöversikt över konfigurerbar profilstatistik.
Tabellvyn listar fältkolumnnamn och upp till de första tjugo posterna i datauppsättningen.

Växla mellan profilvyer med ikonen Tile Brickvy , List Listvy eller Data Datavy .

Brickvy

Vyn Profilbricka är en visuell fältprofil som visar det mest informativa innehållet för den typen av fält. Vilken vykorttyp som visas som standard bestäms av om det finns flest numeriska värden eller textvärden i fältet. Exempel: Om ett fält har både textvärden och numeriska värden visas korttypen Most Common Values (Vanligaste värden) som standard om det finns flest textvärden, och korttypen Binned Frequency (Bin-frekvens) för numerisk fördelning visas om det finns flest numeriska värden i fältet. En växlingsruta visas så att du kan växla till korttypen Most Common Values (Frekvens för vanligaste värden) för fält som har icke-unika värden när ikonen Mest vanliga värden är valt. Du kan även växla tillbaka till kortet för numerisk fördelning om Samlad frekvens ikonen Samlad frekvens är valt. Observera att alla korttyper inkluderar antalet null-värden om det finns null-värden i fältet.

Kortet Exempelvärden

Kortet Exempelvärden visas när alla värden är unika och bara innehåller text. Den kommer att lista (upp till) de tre första värdena och det totala antalet ytterligare unika värden.

Brickan Exempelvärden — Kort för Brickvy: Exempelvärden

Exempelvärden profilkriterier: fältvärden profileras med det här kortet när kardinaliteten är hög (bara distinkta värden). Om alla värden är textbaserade och unika, ger några exempelvärden den bästa första insynen i den här fälttypens data.

Varje Exempelvärde-profilkort ger:

Fältnamn
Kardinalitet (distinkta värden)
Högst tre exempelvärden (fält kan ha färre än tre värden)

Kortet Most Common Values Frequency (Frekvens för vanligaste värden)

Kortet De vanligaste värdena visar de fem vanligaste värdena och deras frekvens. Om det finns fler värden än fem distinkta värden kombineras de och visas som Övriga. Om några fält saknas visas summan som Null. Detta profilkort kan användas på textvärden, numeriska värden och värden med blandade data.

Brickan Most Common Values Frequency (Frekvens för vanligaste värden) — Brickvykort: Most Common Values Frequency (Frekvens för vanligaste värden)

Kriterier för Most Common Values Frequency (Frekvens för vanligaste värden): Fält som har få värden eller skev fördelning av värden profileras med kortet Most Common Values Frequency (Frekvens för vanligaste värden). Denna profilering används endast när det finns flera instanser av samma värden. Användare kan få snabb insikt i fördelningen av fältvärden. Om fältdata innehåller både textvärden och numeriska värden och det finns fler textvärden än numeriska värden visas kortet Most Common Values Frequency (Frekvens för vanligaste värden). Växlingen för Binned frequency (Bin-frekvens) visas när det finns fler än tre numeriska värden i fältet.

Varje Most Common Values Frequency (Frekvens för vanligaste värden)-profilkort ger:

Fältnamn
Kardinalitet (distinkta värden)
De vanligaste värdena och deras frekvens
Other (Andra), som är den kombinerade frekvensen av övriga värden

Kortet Samlad frekvens

Kortet Binned frequency (Bin-frekvens) visar fördelnings och profileringsinformation som är relevant för numeriska fält, inklusive minsta, genomsnittliga och högsta datavärden. Om fältdata innehåller både textvärden och numeriska värden och det finns fler numeriska värden än textvärden visas kortet Binned frequency (Bin-frekvens). Korttypen Most Common Values Frequency (Frekvens för vanligaste värden) är tillgänglig för alla fält som har icke-unika värden.

Brickan Samlad frekvens — Brickvykort: Numerisk fördelning av Samlad frekvens

Varje Samlad frekvens-profilkort ger:

Fältnamn
Kardinalitet (distinkta värden)
Histogram som visar fördelningen av numeriska data
Minsta värde
Medelvärde (summan av talen delat med det totala antalet värden i datauppsättningen)
Största värde

Listvy

Profillistvyn ger en tabell med profilstatistikalternativ. Användare kontrollerar de för datauppsättningen viktigaste mätvärdena under kolumnväljaren ikonen Kolumner som återfinns när du skrollar till tabellens högra kant. De nio första värdena är förvalda som standard.

Fältprofilstatistik
Statistik	Beskrivning
Namn	Fältnamn (exempel: CategoryID)
Datatyp	Qlik Sense registrerar data från många olika system. En enhetlig mappning av extern till intern datatyp läggs till för fältdata (kolumndata) i informationssyfte. Följande datatypsvärden stöds: Datum: Ett datum som innehåller månad, dag och år i ISO 8601-formatet YYYY-MM-DD Tid: Ett tidsvärde som innehåller timme, minuter och sekunder i ISO 8601-formatet hh.mm.ss.sss±hh:mm Datum och tid: ett datum och tidsvärde som innehåller år, månad, dag, timme, minut, sekund och decimaldelar i formatet YYYY-MM-DDThh.mm.ss.sss Tidsmarkör: Ett tidsmarkörvärde som innehåller år, månad, dag, timme, minut, sekund, decimaldelar och tidszon i formatet YYYY-MM-DDThh.mm.ss.sssZ Sträng: Teckendata som representerar text Dubbel: en numerisk datatyp med ett 64-bitars IEEE 754-flyttal med dubbel precision Decimal: en exakt numerisk datatyp som definieras av dess precision (totalt antal siffror) och skala (antal siffror till höger om decimaltecknet) Heltal: positiva eller negativa hela tal Boolean: ett booleskt värde (SANT/FALSKT) Binärt: kategoriska data som kan vara ett av exakt två möjliga värden, som ”1” och ”2” Anpassat: typ som inte är en mappad systemkänd typ
Distinkta värden	Kardinalitet, antal distinkta värden som finns för det här fältet
Null-värden	Antal null-värden
Exempelvärden	Exempelvärden (visning med tre exempelvärden)
Summa	Summan av alla värden i det här fältet (”0” visas för strängfält)
Lägst	Minsta observerade värdet för det här fältet (numeriska fält)
Maximalt	Största observerade värdet för det här fältet (numeriska fält)
Medel	Medelvärdet för observerade värden för det här fältet
Median	Mediantal (eller mittental) i sifferuppsättningen för detta fält
Systemtaggar	Filtaggar som används för att identifiera koduppsättningen (t.ex. $ascii, $text)
Standardavvikelse	Standardavvikelse för numeriska fält
Positiva	Antal positiva värden
Negativa	Antal negativa värden
Nollvärden	Antal ”0”-värden
Tomma strängar	Antal tomma strängar
Minsta längd	Lägsta observerade antalet tecken
Genomsnittlig längd	Genomsnittliga observerade antalet tecken
Maximal längd	Högsta observerade antalet tecken
Första sorterade värde	Det första (lägsta) värdet med sorteringsvikt (strängfält)
Senast sorterade värde	Det sista (högsta) värdet med sorteringsvikt (strängfält)
Numeriska värden	Antal numeriska värden
Textvärden	Antal textvärden
Mest frekventa värden	Fältets tre vanligaste värden

Datavy

Profildatavyn visar din datauppsättning som en vanlig datatabell med fältkolumnnamn och (upp till) de första tjugo värdena.

Begränsad profilvy

Vissa datauppsättningar är inte profilerade som standard. Istället visar Profil en begränsad dataprofil. Du kan profilera data genom att klicka på Profilera datauppsättning.

Följande datatyper visar en begränsad profilvy tills de profileras:

QVD
Parquet

Klicka för att visa i full storlek — En begränsad profil av en datauppsättning från QVD

Begränsad profilstatistik
Statistik	Beskrivning
Namn	Fältnamn (exempel: CategoryID)
Datatyp	Qlik Sense registrerar data från många olika system. En enhetlig mappning av extern till intern datatyp läggs till för fältdata (kolumndata) i informationssyfte. Följande datatypsvärden stöds: Datum: Ett datum som innehåller månad, dag och år i ISO 8601-formatet YYYY-MM-DD Tid: Ett tidsvärde som innehåller timme, minuter och sekunder i ISO 8601-formatet hh.mm.ss.sss±hh:mm Datum och tid: ett datum och tidsvärde som innehåller år, månad, dag, timme, minut, sekund och decimaldelar i formatet YYYY-MM-DDThh.mm.ss.sss Tidsmarkör: Ett tidsmarkörvärde som innehåller år, månad, dag, timme, minut, sekund, decimaldelar och tidszon i formatet YYYY-MM-DDThh.mm.ss.sssZ Sträng: Teckendata som representerar text Dubbel: en numerisk datatyp med ett 64-bitars IEEE 754-flyttal med dubbel precision Decimal: en exakt numerisk datatyp som definieras av dess precision (totalt antal siffror) och skala (antal siffror till höger om decimaltecknet) Heltal: positiva eller negativa hela tal Boolean: ett booleskt värde (SANT/FALSKT) Binärt: kategoriska data som kan vara ett av exakt två möjliga värden, som ”1” och ”2” Anpassat: typ som inte är en mappad systemkänd typ
Distinkta värden	Kardinalitet, antal distinkta värden som finns för det här fältet
Null-värden	Antal null-värden
Exempelvärden	Exempelvärden (visning med tre exempelvärden)

RELATERAD INFORMATION:

Hur använder jag Datakatalog till profildata?

Mer information

Hur använder jag Datakatalog till profildata?

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!

Lämna din feedback här