Gå till huvudinnehåll Gå till ytterligare innehåll

Hantering av metadata på fältnivå och dataprofilering

Profilering ger dataadministratörer tillgång till omfattande teknisk information avseende sina datauppsättningar. Apputvecklare använder profilstatistik och datasampling för att få idéer och råd när de skapar appar och planerar visualiseringar. Fältprofilering kan hjälpa dataanalytiker och affärsanvändare att nå insikter snabbare. De kan visa och visualisera värdefulla fältprofilsmätvärden på ett ögonblick utan att behöva skapa en app först. Metadata på fältnivå gör det möjligt för användare att använda alias, beskrivningar och klassificeringar för fält. Dessa funktioner hjälper till att identifiera specifika data och känsliga fält.

Anteckning om informationQlik Cloud profilerar bara upp till 12 miljoner rader i en datauppsättning. Om en datauppsättning överskrider 12 miljoner rader profileras bara de första 12 miljoner raderna. Metadata för alla fält läggs fortfarande till oavsett antalet rader som profileras.

Hantering av metadata på fältnivå

Du kan komma åt och redigera metadata för varje fält i datauppsättningen från fliken Fält. Välj valfritt kort från Brick-vyn Välj ikonen för brickor för brickvyn, valfri rad från list-vyn Välj listikonen för listvyn, eller valfri kolumn från Data-vyn för att öppna det aktuella fältets Detalj-panel till höger om rutnätet. Metadatafält på fältnivå – Fältalias, Beskrivning, Taggar och Klassificering – är valfria och kan definieras och redigeras från den här panelen.

Fält för fältmetadata
DetaljeradBeskrivning
Fältalias*Ange ett valfritt alternativt namn för att göra fältnamnen mer meningsfulla i profilanalysen. Aliasfältnamn visas endast i profilanalysen och påverkar inte de tekniska kolumnnamnen.
Beskrivning

Ange all information som kan vara till hjälp för användare som visar fältmetadata och profilering för fältet.

TaggarAnge textavsnitt för att definiera och kategorisera detta fält och dess data.
KlassificeringMarkera kryssrutan för Personlig information eller Känslig information.
Anteckning om informationDe valda fältnivåklassificeringarna Personlig information och Känslig information visas på fliken Översikt över datauppsättning listade per fält under tekniska datauppsättningsmetadata.
Anteckning om informationKlassificeringar som tillämpas på fält i Excel-filer med flera ark listas med arknamn och fältnamn (exempel: Personuppgifter: Sheet1/EmpID).

Metadata på fältnivå för en XLSX-fil med flera ark

Välj ett fältkort i brickvyn för att öppna panelen Detaljer.

Profilera data

Profilstatistik utför kolumnanalyser som mäter incidens, intervall och värden som förekommer inom datauppsättningar. Dessa siffror beskriver relationer mellan fältvärden som:

  • Antal distinkta värden (kardinalitet)
  • exempelvärden, vanligaste värden och värdefrekvens
  • redundanser som kan användas för att identifiera standardvärden eller potentiella dubblettvärden
  • antal null-värden, strängvärden och numeriska värden
  • Information om värdeintervall, inklusive min, max, medel, summa och standardavvikelse.

Katalogen ger tre vyer av fältprofildata: Tile view, List view och Data view.

Tile view är en kortbaserad, visuell representation av fält utlagda som ett rutnät.

List view är en tabellöversikt över konfigurerbar profilstatistik.

Table viewlistar fältkolumnnamn och upp till de första tjugo posterna i datauppsättningen.

Växla mellan profilvyer med TileVälj ikonen för brickor för brickvyn, ListVälj listikonen för listvyn, eller Data -ikonen.

Vyn Profilbricka

Vyn Profilbricka är en visuell fältprofil som visar det mest informativa innehållet för den typen av fält. Vilken vykorttyp som visas som standard bestäms av om det finns flest numeriska värden eller textvärden i fältet. Exempel: Om ett fält har både textvärden och numeriska värden visas korttypen Most Common Values (Vanligaste värden) som standard om det finns flest textvärden, och korttypen Binned Frequency (Bin-frekvens) för numerisk fördelning visas om det finns flest numeriska värden i fältet. En växlingsruta visas så att du kan växla till korttypen Most Common Values (Frekvens för vanligaste värden) för fält som har icke-unika värden närikonen Mest vanliga värden är valt. Du kan även växla tillbaka till kortet för numerisk fördelning om Samlad frekvensikonen Samlad frekvens är valt. Observera att alla korttyper inkluderar antalet null-värden om det finns null-värden i fältet.

Brickvy Fält profileras av mätvärden som är viktiga för den typ av data som finns i det fältet (till exempel text jämfört med numeriska värden)

Profilbrickvy av datauppsättning

Kortet Exempelvärden

Kortet Exempelvärden visas när alla värden är unika och bara innehåller text. Den kommer att lista (upp till) de tre första värdena och det totala antalet ytterligare unika värden.

Kort för Brickvy: Exempelvärden
Brickan Exempelvärden

Exempelvärden profilkriterier: fältvärden profileras med det här kortet när kardinaliteten är hög (bara distinkta värden). Om alla värden är textbaserade och unika, ger några exempelvärden den bästa första insynen i den här fälttypens data.

Varje Exempelvärde-profilkort ger: 

  • Fältnamn
  • Kardinalityt (distinkta värden)
  • Högst tre exempelvärden (fält kan ha färre än tre värden)

Kortet Most Common Values Frequency (Frekvens för vanligaste värden)

Kortet De vanligaste värdena visar de fem vanligaste värdena och deras frekvens. Om det finns fler värden än fem distinkta värden kombineras de och visas som Övriga. Om några fält saknas visas summan som Null. Detta profilkort kan användas på textvärden, numeriska värden och värden med blandade data.

Brickvykort: Most Common Values Frequency (Frekvens för vanligaste värden)
Brickan Most Common Values Frequency (Frekvens för vanligaste värden)

Kriterier för Most Common Values Frequency (Frekvens för vanligaste värden): Fält som har få värden eller skev fördelning av värden profileras med kortet Most Common Values Frequency (Frekvens för vanligaste värden). Denna profilering används endast när det finns flera instanser av samma värden. Användare kan få snabb insikt i fördelningen av fältvärden. Om fältdata innehåller både textvärden och numeriska värden och det finns fler textvärden än numeriska värden visas kortet Most Common Values Frequency (Frekvens för vanligaste värden). Växlingen för Binned frequency (Bin-frekvens) visas när det finns fler än tre numeriska värden i fältet.

Varje Most Common Values Frequency (Frekvens för vanligaste värden)-profilkort ger: 

  • Fältnamn
  • Kardinalitet (distinkta värden)
  • De vanligaste värdena och deras frekvens
  • Other (Andra), som är den kombinerade frekvensen av övriga värden

Kortet Samlad frekvens

Kortet Binned frequency (Bin-frekvens) visar fördelnings och profileringsinformation som är relevant för numeriska fält, inklusive minsta, genomsnittliga och högsta datavärden. Om fältdata innehåller både textvärden och numeriska värden och det finns fler numeriska värden än textvärden visas kortet Binned frequency (Bin-frekvens). Korttypen Most Common Values Frequency (Frekvens för vanligaste värden) är tillgänglig för alla fält som har icke-unika värden.

Brickvykort: Numerisk fördelning av Samlad frekvens

Brickan Samlad frekvens

Varje Samlad frekvens-profilkort ger: 

  • Fältnamn
  • Kardinalitet (distinkta värden)
  • Histogram som visar fördelningen av numeriska data
  • Minsta värde
  • Medelvärde (summan av talen delat med det totala antalet värden i datauppsättningen)
  • Största värde

Profillistvy

Profillistvyn ger en tabell med profilstatistikalternativ. Användare kontrollerar de för datauppsättningen viktigaste mätvärdena under kolumnväljaren ikonen Kolumner som återfinns när du skrollar till tabellens högra kant. De nio första värdena är förvalda som standard.

Listvy: välj profilstatistik från menyväljaren som du hittar genom att skrolla till höger i tabellen

Profillistvy av datauppsättning

Profildatavy

Profildatavyn visar din datauppsättning som en vanlig datatabell med fältkolumnnamn och (upp till) de första tjugo värdena.

Datavy: datauppsättningens kolumnnamn och de första tjugo posterna visas

Profildatavy av datauppsättning

Behörigheter

Behörigheter krävs för att kunna profilera och välja exempeldata. Du måste ha en roll i en datauppsättnings utrymme som låter dig profilera datakällor. Mer information finns i Hantera behörigheter i delade utrymmen eller Hantera behörigheter i hanterade utrymmen.

Mer information

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!