Visa insikter om dina träningsdata

När du lägger till dina träningsdata och kör versioner av träningen kan du få tillgång till insikter om hur dina data hanteras. Insikter ger information om mål och funktioner i ditt experiment, till exempel funktioner som har tagits bort, är otillgängliga eller kommer att kodas med särskild bearbetning.

Kolumnen Insikter finns i Schema Schemavy när du är på fliken Konfiguration/Träningsdata. Förkortade insikter finns även i Tabell Datavy. Insikter skapas individuellt för varje modell som tränas i experimentet.

Insikter som visas om varje funktionskolumn i träningsdatamängden — Insikter-kolumnen i Schemavy

Insikter genereras:

Efter att du har lagt till eller ändrat träningsdata, men ännu inte har körts några experimentversioner.
Efter att varje experimentversion har körts. En separat uppsättning insikter skapas för varje tränad modell.

Insikterna kan skilja sig åt före och efter att en version körs. Detta beror på att när träningen börjar kan Qlik Predict förbehandla dina data och ställa ytterligare diagnos på problem med data. Mer information finns i Automatisk förberedelse och omvandling av data.

Visa insikter före träning

Innan du kör en version av experimentet kan du analysera Insikter för att se hur aktuella träningsdata tolkas. Dessa insikter kan ändras efter att du har kört versionen.

Gör följande:

I ett experiment ser du till att du har lagt till de träningsdata som du vill använda för experimentversionen.
Öppna fliken Konfiguration/Träningsdata.
Se till att du är i Schemavy.
Analysera kolumnen Insikter. Verktygstips ger ytterligare sammanhang till insikterna. Mer förklaringar av vad varje insikt betyder finns i Tolka insikter om datamängder.

Visa insikter för en modell

Efter att modellerna har tränats klart för en experimentversion väljer du en modell och kontrollerar hur data hanterades.

Gör följande:

Kör en experimentversion och öppna sedan fliken Konfiguration/Träningsdata.
Välj en modell i rullgardinsmenyn i verktygsfältet.
Se till att du är i Schemavy.
Analysera kolumnen Insikter. Verktygstips ger ytterligare sammanhang till insikterna. Mer förklaringar av vad varje insikt betyder finns i Tolka insikter om datamängder.

Tolka insikter om datamängder

Följande tabeller ger mer information om de möjliga insikter som kan visas i schemat.

Allmänna insikter

Insikter om datamängder — Allmänt
Insikt	Betydelse	Inverkan på konfiguration	När insikten fastställs	Ytterligare referenser
Konstant	Kolumnen har samma värde för alla rader.	Kolumnen kan inte användas som mål eller inkluderad funktion.	Före och efter att versionen körs	Kardinalitet
One-hot-kodad	Funktionstypen är kategorisk och kolumnen har färre än 14 unika värden.	Ingen inverkan på konfigurationen.	Före och efter att versionen körs	Kategorisk kodning
Impact-kodad	Funktionstypen är kategorisk och kolumnen har 14 eller fler unika värden.	Ingen inverkan på konfigurationen.	Före och efter att versionen körs	Kategorisk kodning
Hög kardinalitet	Kolumnen har för många unika värden och kan påverka modellens prestanda negativt om den används som en funktion.	Kolumnen kan inte användas som mål. Den kommer att uteslutas automatiskt som en funktion, men kan fortfarande inkluderas vid behov.	Före och efter att versionen körs	Kardinalitet
Glesa data	Kolumnen har för många null-värden.	Kolumnen kan inte användas som mål eller inkluderad funktion.	Före och efter att versionen körs	Imputation av nullvärden
Underrepresenterad klass	Kolumnen har en klass med färre än 10 rader.	Kolumnen kan inte användas som mål, men kan inkluderas som en funktion.	Före och efter att versionen körs	-
Funktionstransformering misslyckades	Funktionstypen för en funktion ändrades manuellt från dess standardtyp. Med denna konfiguration uppstod ett fel.	Experimentversionen kan inte köras med den här funktionstransformeringen. Återställ funktionstypen för funktionen till dess tidigare värde, eller uteslut funktionen från träningen.	Efter att versionen har körts	Ändra funktionstyper

Insikter om automatisk funktionsteknik

Insikter om datamängder — Automatisk funktionsteknik
Insikt	Betydelse	Inverkan på konfiguration	När insikten fastställs	Ytterligare referenser
<antal> automatiskt genererade funktioner	Kolumnen är den överordnade funktionen som kan användas för att generera automatiskt genererade funktioner.	Om denna överordnade funktion tolkas som en datumfunktion tas den automatiskt bort från konfigurationen. Vi rekommenderar att du istället använder de automatiskt genererade datumfunktionerna som kan skapas från den. Det är möjligt att åsidosätta denna inställning och inkludera funktionen istället för de automatiskt genererade funktionerna.	Före och efter att versionen körs	Automatisk egenskapsgenerering
Automatiskt genererad funktion	Kolumnen är en automatiskt genererad funktion som kan, eller har, genererats från en överordnad datumfunktion. Den fanns inte med i den ursprungliga datamängden.	Du kan ta bort en eller flera av dessa automatiskt genererade funktioner under experimentträningen. Om du ändrar funktionstypen för den överordnade funktionen till kategorisk tas alla automatiskt genererade funktioner bort.	Före och efter att versionen körs	Automatisk egenskapsgenerering
Kunde inte bearbetas som datum	Kolumnen innehåller eventuellt datum- och tidsinformation, men kunde inte användas för att skapa automatiskt genererade datumfunktioner.	Funktionen tas bort från konfigurationen. Om automatiskt genererade funktioner tidigare har skapats från denna överordnade funktion tas de bort från framtida experimentversioner. Du kan fortfarande använda funktionen i experimentet, men du måste ändra dess funktionstyp till kategorisk.	Efter att versionen har körts	Automatisk egenskapsgenerering
Möjlig fritext	Kolumnen kan eventuellt vara tillgänglig för användning som en fritextfunktion.	Fritextfunktionstypen tilldelas kolumnen. Du måste köra en experimentversion för att bekräfta om funktionen kan bearbetas som fritext.	Före att versionen körs	Automatisk egenskapsgenerering
Fritext	Kolumnen har bekräftats innehålla fritext. Den kan bearbetas som fritext.	Inga ytterligare konfigurationer krävs för funktionen.	Efter att versionen har körts	Automatisk egenskapsgenerering
Kunde inte bearbetas som fritext	Vid närmare analys kan kolumnen inte bearbetas som fritext.	Du måste avmarkera funktionen från konfigurationen för nästa experimentversion. Om funktionen inte har hög kardinalitet kan du alternativt ändra funktionstypen till kategorisk.	Efter att versionen har körts	Automatisk egenskapsgenerering

Insikter om intelligent modelloptimering

Insikter om datamängder — Intelligent modelloptimering
Insikt	Betydelse	Inverkan på konfiguration	När insikten fastställs	Ytterligare referenser
Målläckage	Funktionen misstänks vara påverkad av målläckage. I så fall innehåller den information om målkolumnen som du försöker förutsäga. Funktioner med målläckage kan ge en falsk känsla av säkerhet om modellens prestanda. I verkliga förutsägelser gör de att modellen presterar mycket dåligt.	Funktionen har inte använts för att träna modellen.	Efter att versionen har körts	Dataläckage
Låg permutationsbetydelse	Funktionen har inte mycket, om ens något, inflytande på modellens förutsägelser. Att ta bort dessa funktioner förbättrar modellens prestanda genom att minska statistiskt brus.	Funktionen har inte använts för att träna modellen.	Efter att versionen har körts	Förstå permutationsbetydelse
Starkt korrelerad	Funktionen är starkt korrelerad med en eller flera andra funktioner i experimentet. Att ha funktioner som är starkt korrelerade med varandra minskar modellens prestanda.	Funktionen har inte använts för att träna modellen. Funktionen som den är starkt korrelerad med har inte tagits bort på grund av hög korrelation, men kan ha tagits bort av en annan anledning, till exempel låg permutationsbetydelse.	Efter att versionen har körts	Korrelation

Insikter om tidsserieprognoser

Insikter om datamängder — Tidsserieprognoser
Insikt	Betydelse	Inverkan på konfiguration	När insikten fastställs	Ytterligare referenser
Möjligt datumindex	Funktionen kan eventuellt användas som ett datumindex för tidsserieexperimentet.	Om den används som ett datumindex för tidsserier kan data i kolumnen påverka aspekter av tidsseriekonfigurationen, till exempel hur långt in i framtiden du kan göra prognoser. Värdena i datumindexet måste öka för varje rad eller unikt gruppvärde med ett fast tidsintervall.	Före att versionen körs	Arbeta med tidsserieexperiment Datumindex

Insikter om biasdetektering

Insikter om datamängder — Biasdetektering
Insikt	Betydelse	Inverkan på konfiguration	När insikten fastställs	Ytterligare referenser
Databias detekterad	Med avseende på värdena i målkolumnen är vissa grupper (värden) underrepresenterade jämfört med andra.	Analysera resultat från biasdetektering för att fastställa nästa steg – dessa kan inkludera att ta bort funktionen, ändra datamängden eller skapa ett nytt experiment med ett reviderat ramverk.	Efter att versionen har körts	Identifiera snedvridning i maskininlärningsmodeller
Representationsbias detekterad	Bias har detekterats i hur den tränade modellen använder data från funktionen för att skapa förutsägelser.	Analysera resultat från biasdetektering för att fastställa nästa steg – dessa kan inkludera att ta bort funktionen, ändra datamängden eller skapa ett nytt experiment med ett reviderat ramverk.	Efter att versionen har körts	Identifiera snedvridning i maskininlärningsmodeller

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!

Lämna din feedback här