Visa insikter om dina träningsdata
När du lägger till dina träningsdata och kör versioner av träningen kan du få tillgång till insikter om hur dina data hanteras. Insikter ger information om mål och funktioner i ditt experiment, till exempel funktioner som har tagits bort, är otillgängliga eller kommer att kodas med särskild bearbetning.
Kolumnen Insikter finns i Schemavy när du är på fliken Konfiguration/Träningsdata. Förkortade insikter finns även i
Datavy. Insikter skapas individuellt för varje modell som tränas i experimentet.
Insikter-kolumnen i Schemavy
Insikter genereras:
-
Efter att du har lagt till eller ändrat träningsdata, men ännu inte har körts några experimentversioner.
-
Efter att varje experimentversion har körts. En separat uppsättning insikter skapas för varje tränad modell.
Insikterna kan skilja sig åt före och efter att en version körs. Detta beror på att när träningen börjar kan Qlik Predict förbehandla dina data och ställa ytterligare diagnos på problem med data. Mer information finns i Automatisk förberedelse och omvandling av data.
Visa insikter före träning
Innan du kör en version av experimentet kan du analysera Insikter för att se hur aktuella träningsdata tolkas. Dessa insikter kan ändras efter att du har kört versionen.
Gör följande:
-
I ett experiment ser du till att du har lagt till de träningsdata som du vill använda för experimentversionen.
-
Öppna fliken Konfiguration/Träningsdata.
-
Se till att du är i
Schemavy.
-
Analysera kolumnen Insikter. Verktygstips ger ytterligare sammanhang till insikterna. Mer förklaringar av vad varje insikt betyder finns i Tolka insikter om datamängder.
Visa insikter för en modell
Efter att modellerna har tränats klart för en experimentversion väljer du en modell och kontrollerar hur data hanterades.
Gör följande:
-
Kör en experimentversion och öppna sedan fliken Konfiguration/Träningsdata.
-
Välj en modell i rullgardinsmenyn i verktygsfältet.
-
Se till att du är i
Schemavy.
-
Analysera kolumnen Insikter. Verktygstips ger ytterligare sammanhang till insikterna. Mer förklaringar av vad varje insikt betyder finns i Tolka insikter om datamängder.
Tolka insikter om datamängder
Följande tabeller ger mer information om de möjliga insikter som kan visas i schemat.
Allmänna insikter
| Insikt | Betydelse | Inverkan på konfiguration | När insikten fastställs | Ytterligare referenser |
|---|---|---|---|---|
| Konstant | Kolumnen har samma värde för alla rader. | Kolumnen kan inte användas som mål eller inkluderad funktion. | Före och efter att versionen körs | Kardinalitet |
| One-hot-kodad | Funktionstypen är kategorisk och kolumnen har färre än 14 unika värden. | Ingen inverkan på konfigurationen. | Före och efter att versionen körs | Kategorisk kodning |
| Impact-kodad | Funktionstypen är kategorisk och kolumnen har 14 eller fler unika värden. | Ingen inverkan på konfigurationen. | Före och efter att versionen körs | Kategorisk kodning |
| Hög kardinalitet | Kolumnen har för många unika värden och kan påverka modellens prestanda negativt om den används som en funktion. | Kolumnen kan inte användas som mål. Den kommer att uteslutas automatiskt som en funktion, men kan fortfarande inkluderas vid behov. | Före och efter att versionen körs | Kardinalitet |
| Glesa data | Kolumnen har för många null-värden. | Kolumnen kan inte användas som mål eller inkluderad funktion. | Före och efter att versionen körs | Imputation av nullvärden |
| Underrepresenterad klass | Kolumnen har en klass med färre än 10 rader. | Kolumnen kan inte användas som mål, men kan inkluderas som en funktion. | Före och efter att versionen körs | - |
| Funktionstransformering misslyckades | Funktionstypen för en funktion ändrades manuellt från dess standardtyp. Med denna konfiguration uppstod ett fel. | Experimentversionen kan inte köras med den här funktionstransformeringen. Återställ funktionstypen för funktionen till dess tidigare värde, eller uteslut funktionen från träningen. | Efter att versionen har körts | Ändra funktionstyper |
Insikter om automatisk funktionsteknik
| Insikt | Betydelse | Inverkan på konfiguration | När insikten fastställs | Ytterligare referenser |
|---|---|---|---|---|
| <antal> automatiskt genererade funktioner | Kolumnen är den överordnade funktionen som kan användas för att generera automatiskt genererade funktioner. | Om denna överordnade funktion tolkas som en datumfunktion tas den automatiskt bort från konfigurationen. Vi rekommenderar att du istället använder de automatiskt genererade datumfunktionerna som kan skapas från den. Det är möjligt att åsidosätta denna inställning och inkludera funktionen istället för de automatiskt genererade funktionerna. | Före och efter att versionen körs | Automatisk egenskapsgenerering |
| Automatiskt genererad funktion | Kolumnen är en automatiskt genererad funktion som kan, eller har, genererats från en överordnad datumfunktion. Den fanns inte med i den ursprungliga datamängden. | Du kan ta bort en eller flera av dessa automatiskt genererade funktioner under experimentträningen. Om du ändrar funktionstypen för den överordnade funktionen till kategorisk tas alla automatiskt genererade funktioner bort. | Före och efter att versionen körs | Automatisk egenskapsgenerering |
| Kunde inte bearbetas som datum | Kolumnen innehåller eventuellt datum- och tidsinformation, men kunde inte användas för att skapa automatiskt genererade datumfunktioner. | Funktionen tas bort från konfigurationen. Om automatiskt genererade funktioner tidigare har skapats från denna överordnade funktion tas de bort från framtida experimentversioner. Du kan fortfarande använda funktionen i experimentet, men du måste ändra dess funktionstyp till kategorisk. | Efter att versionen har körts | Automatisk egenskapsgenerering |
| Möjlig fritext | Kolumnen kan eventuellt vara tillgänglig för användning som en fritextfunktion. | Fritextfunktionstypen tilldelas kolumnen. Du måste köra en experimentversion för att bekräfta om funktionen kan bearbetas som fritext. | Före att versionen körs | Automatisk egenskapsgenerering |
| Fritext | Kolumnen har bekräftats innehålla fritext. Den kan bearbetas som fritext. | Inga ytterligare konfigurationer krävs för funktionen. | Efter att versionen har körts | Automatisk egenskapsgenerering |
| Kunde inte bearbetas som fritext | Vid närmare analys kan kolumnen inte bearbetas som fritext. | Du måste avmarkera funktionen från konfigurationen för nästa experimentversion. Om funktionen inte har hög kardinalitet kan du alternativt ändra funktionstypen till kategorisk. | Efter att versionen har körts | Automatisk egenskapsgenerering |
Insikter om intelligent modelloptimering
| Insikt | Betydelse | Inverkan på konfiguration | När insikten fastställs | Ytterligare referenser |
|---|---|---|---|---|
| Målläckage | Funktionen misstänks vara påverkad av målläckage. I så fall innehåller den information om målkolumnen som du försöker förutsäga. Funktioner med målläckage kan ge en falsk känsla av säkerhet om modellens prestanda. I verkliga förutsägelser gör de att modellen presterar mycket dåligt. | Funktionen har inte använts för att träna modellen. | Efter att versionen har körts | Dataläckage |
| Låg permutationsbetydelse | Funktionen har inte mycket, om ens något, inflytande på modellens förutsägelser. Att ta bort dessa funktioner förbättrar modellens prestanda genom att minska statistiskt brus. | Funktionen har inte använts för att träna modellen. | Efter att versionen har körts | Förstå permutationsbetydelse |
| Starkt korrelerad | Funktionen är starkt korrelerad med en eller flera andra funktioner i experimentet. Att ha funktioner som är starkt korrelerade med varandra minskar modellens prestanda. | Funktionen har inte använts för att träna modellen. Funktionen som den är starkt korrelerad med har inte tagits bort på grund av hög korrelation, men kan ha tagits bort av en annan anledning, till exempel låg permutationsbetydelse. | Efter att versionen har körts | Korrelation |
Insikter om tidsserieprognoser
| Insikt | Betydelse | Inverkan på konfiguration | När insikten fastställs | Ytterligare referenser |
|---|---|---|---|---|
| Möjligt datumindex | Funktionen kan eventuellt användas som ett datumindex för tidsserieexperimentet. |
Om den används som ett datumindex för tidsserier kan data i kolumnen påverka aspekter av tidsseriekonfigurationen, till exempel hur långt in i framtiden du kan göra prognoser. Värdena i datumindexet måste öka för varje rad eller unikt gruppvärde med ett fast tidsintervall. |
Före att versionen körs |
Insikter om biasdetektering
| Insikt | Betydelse | Inverkan på konfiguration | När insikten fastställs | Ytterligare referenser |
|---|---|---|---|---|
| Databias detekterad | Med avseende på värdena i målkolumnen är vissa grupper (värden) underrepresenterade jämfört med andra. | Analysera resultat från biasdetektering för att fastställa nästa steg – dessa kan inkludera att ta bort funktionen, ändra datamängden eller skapa ett nytt experiment med ett reviderat ramverk. | Efter att versionen har körts | Identifiera snedvridning i maskininlärningsmodeller |
| Representationsbias detekterad | Bias har detekterats i hur den tränade modellen använder data från funktionen för att skapa förutsägelser. | Analysera resultat från biasdetektering för att fastställa nästa steg – dessa kan inkludera att ta bort funktionen, ändra datamängden eller skapa ett nytt experiment med ett reviderat ramverk. | Efter att versionen har körts | Identifiera snedvridning i maskininlärningsmodeller |