Gå till huvudinnehåll

Profilera data

PÅ DEN HÄR SIDAN

Profilera data

Profilstatistik utför kolumnanalyser som mäter incidens, intervall och värden som förekommer inom datauppsättningar. Dessa siffror beskriver relationer mellan fältvärden som:

  • antal distinkta värden (kardinalitet)
  • exempelvärden, vanligaste värden och värdefrekvens
  • redundanser som kan användas för att identifiera standardvärden eller potentiella dubblettvärden
  • antal null-värden, strängvärden och numeriska värden
  • information om värdeintervall, inklusive min, max, medel, summa och standardavvikelse.

Profilering ger dataadministratörer tillgång till omfattande teknisk information avseende sina datauppsättningar. Dessa uppgifter är användbara när resurser och åtkomst ska struktureras och tilldelas. Apputvecklare använder profilstatistik och datasampling för att få idéer och råd när de skapar appar och planerar visualiseringar. Fältprofilering kan hjälpa dataanalytiker och affärsanvändare att nå insikter snabbare. De kan visa och visualisera värdefulla fältprofilsmätvärden uran att behöva skapa en app först.

Catalog provides two different views of field profile data: List view and Tile view. List view is a tabular summary of configurable profile statistics and Tile view is a card-based, visual representation of fields laid out as a grid. Select the Tile Select tile icon for tile view or List Select list icon for list view icon to switch between profile views.

Brickvy: Fält profileras av mätvärden som är meningsfulla för den typ av data som finns i det fältet (till exempel text jämfört med numeriska värden)

Vyn Profilbricka

Listvy:Välj profilstatistik av intresse i listrutan Kolumner

Profillistvy

Vyn Profilbricka

Vyn Profilbricka är en visuell fältprofil som visar det mest informativa innehållet för den typen av fält. Vilken vykorttyp som visas som standard bestäms av om det finns flest numeriska värden eller textvärden i fältet. Exempel: Om ett fält har både textvärden och numeriska värden visas korttypen Most Common Values (Vanligaste värden) som standard om det finns flest textvärden, och korttypen Binned Frequency (Bin-frekvens) för numerisk fördelning visas om det finns flest numeriska värden i fältet. En växlingsruta visas så att du kan växla till korttypen Most Common Values Frequency (Frekvens för vanligaste värden) för fält som har icke-unika värden när A är valt. Du kan även växla tillbaka till kortet för numerisk fördelning om #1 är valt. Observera att alla korttyper inkluderar antalet null-värden om det finns null-värden i fältet.

Brickvykort: Binned frequency (Bin-frekvens) för numerisk fördelning, Exempelvärden och Most Common Values Frequency (Frekvens för vanligaste värden)

Brickvy för profilkort

Kortet Exempelvärden

Kortet Exempelvärden visas när alla värden är unika och bara innehåller text. Det visar (upp till) de första tre värdena.

Profilkortet Exempelvärden
Exempelvärden för profilkort

Profilkriterier för Exempelvärden: Fältvärden profileras med det här kortet när kardinaliteten är hög (bara distinkta värden). Om alla värden är textbaserade och unika, ger några exempelvärden den bästa första insynen i den här fälttypens data.

Varje Exempelvärde-profilkort ger: 

  • Fältnamn
  • Kardinalitet
  • Högst tre exempelvärden (fält kan ha färre än tre värden)

Kortet Most Common Values Frequency (Frekvens för vanligaste värden)

Kortet Most Common Values Frequency (Frekvens för vanligaste värden) visar de vanligaste två värdena och frekvensen för dessa och alla andra värden kombinerade som Other (Andra), om det inte bara finns tre värden, i vilket fall alla tre visas med varje värdes frekvens. Detta profilkort kan användas på textvärden, numeriska värden och värden med blandade data.

Profilkortet Most Common Values Frequency (Frekvens för vanligaste värden) med textvärden
Profilkortet frekvens för vanligaste värden
Profilkortet Most Common Values Frequency (Frekvens för vanligaste värden) med numeriska värden
Profilkortet vanligaste värden

Kriterier för Most Common Values Frequency (Frekvens för vanligaste värden): Fält som har få värden eller skev fördelning av värden profileras mot kortet Most Common Values Frequency (Frekvens för vanligaste värden). Denna profilering används endast när det finns flera instanser av samma värden. Användare kan få snabb insikt i fördelningen av fältvärden. Om fältdata innehåller både textvärden och numeriska värden och det finns fler textvärden än numeriska värden visas kortet Most Common Values Frequency (Frekvens för vanligaste värden). Växlingen för Binned frequency (Bin-frekvens) visas när det finns fler än tre numeriska värden i fältet.

Varje Most Common Values Frequency (Frekvens för vanligaste värden)-profilkort ger: 

  • Fältnamn
  • Kardinalitet
  • De vanligaste värdena och deras frekvens
  • Other (Andra), som är den kombinerade frekvensen av övriga värden

Kortet Binned frequency (Bin-frekvens)

Kortet Binned frequency (Bin-frekvens) visar fördelnings och profileringsinformation som är relevant för numeriska fält, inklusive minsta, genomsnittliga och högsta datavärden. Om fältdata innehåller både textvärden och numeriska värden och det finns fler numeriska värden än textvärden visas kortet Binned frequency (Bin-frekvens). Korttypen Most Common Values Frequency (Frekvens för vanligaste värden) är tillgänglig för alla fält som har icke-unika värden.

Profilkortet Binned frequency (Bin-frekvens)

Profilkortet Bin-frekvens

Varje Binned frequency (Bin-frekvens)-profilkort ger: 

  • Fältnamn
  • Kardinalitet
  • Histogram som visar fördelningen av numeriska data
  • Minsta värde
  • Medelvärde (summan av talen delat med det totala antalet värden i datauppsättningen)
  • Största värde

Profillistvy

Profillistvyn ger en tabell med profilstatistikalternativ. Användarna väljer de mätdata av intresse som är mest meningsfulla för datauppsättningen som profileras under Columns. De nio första är förvalda som standard.

Från fliken Startsida i hubben går du till Dina data. Du kan även gå till Katalog och filtrera på TyperData.

  1. Välj Öppna datauppsättning och sedan Profilera data. Sidan Profil öppnas för datauppsättningen. Välj knappen Kolumner och markera rutan intill profilstatistiken du är intresserad av. Statistiken måste väljas (markera i rutan intill den) för att fältet (kolumnen) ska profileras och visas i tabellen. Tillgänglig profilstatistik listas nedan.

    Profilstatistik
    Statistik Beskrivning
    Namn Fältnamn (exempel: CategoryID)
    Datatyp

    Qlik Sense registrerar data från många olika system. En enhetlig mappning av extern till intern datatyp läggs till för fältdata (kolumndata) i informationssyfte. Följande datatypsvärden stöds:

    • Datum: Ett datum som innehåller månad, dag och år i ISO 8601-formatet YYYY-MM-DD

    • Tid: Ett tidsvärde som innehåller timme, minuter och sekunder i ISO 8601-formatet hh.mm.ss.sss±hh:mm
    • Datum och tid: Ett datum och tid-värde som innehåller år, månad, dag, timme, minut, sekund och decimaldelar i formatet YYYY-MM-DDThh.mm.ss.sss
    • Tidsmarkör: Ett tidsmarkörvärde som innehåller år, månad, dag, timme, minut, sekund, decimaldelar och tidszon i formatet YYYY-MM-DDThh.mm.ss.sssZ
    • Sträng: Teckendata som representerar text
    • Dubbel: En numerisk datatyp med ett 64-bitars IEEE 754-flyttal med dubbel precision
    • Decimal: En exakt numerisk datatyp som definieras av dess precision (totalt antal siffror) och skala (antal siffror till höger om decimaltecknet)
    • Heltal: Positiva eller negativa hela tal
    • Boolesk: Ett booleskt värde (SANT/FALSKT)
    • Binär: Kategoriska data som kan vara ett av exakt två möjliga värden, som ”1” och ”2”
    • Anpassad: Typ som inte är en mappad systemkänd typ
    Distinkta värden Kardinalitet, antal distinkta värden som finns för det här fältet
    Exempelvärden Exempelvärden (visning med tre exempelvärden)
    Sum Summan av alla värden i det här fältet (”0” visas för strängfält)
    Min Minsta observerade värdet för det här fältet (numeriska fält)
    Max Största observerade värdet för det här fältet (numeriska fält)
    Medel Medelvärdet för observerade värden för det här fältet
    Systemtaggar Filtaggar som används för att identifiera koduppsättningen (t.ex. $ascii, $text)
    Standardavvikelse Standardavvikelse för numeriska fält
    Positiva Antal positiva värden
    Negativa Antal negativa värden
    Nollvärden Antal ”0”-värden
    Tomma strängar Antal tomma strängar
    Minsta längd Lägsta observerade antalet tecken
    Genomsnittlig längd Genomsnittliga observerade antalet tecken
    Maximal längd Högsta observerade antalet tecken
    Första sorterade värde Det första (lägsta) värdet med sorteringsvikt (strängfält)
    Senast sorterade värde Det sista (högsta) värdet med sorteringsvikt (strängfält)
    Numeriska värden Antal numeriska värden
    Textvärden Antal textvärden
    Mest frekventa värden Fältets tre vanligaste värden

Exempeldata

Exempeldata är en underuppsättning av datauppsättningen för en population. Detta är användbart när dataadministratörer vill försäkra sig om att data följer förväntade mönster och format. Användare som skapar appar kan få en uppfattning om hur fält och fältdata uppträder tillsammans med andra poster och datauppsättningen. Dessa vyer ger en första insyn i data, och utvecklare kan börja utforska data avseende analys och potentiella korrelationer.

Välj Dataexempel om du vill visa ett exempel med de 20 första datavärdena för varje fält.

Prov på motor för datauppsättningen
  • Välj knappen ikon listrutepil och sedan Exempel om du vill visa ett exempel (n=20) med datavärden för varje fält.

Behörigheter

Behörigheter krävs för att kunna profilera och välja exempeldata. Åtgärden att profilera data motsvarar den vidare behörigheten Profilera datakälla. Mer information finns i Hantera behörigheter i delade utrymmen eller Hantera behörigheter i hanterade utrymmen.

  • Profilera data > Profilera datakälla

Exempel