Visa insikter om dina träningsdata
När du lägger till dina träningsdata och kör versioner av träningen kan du komma åt insikter om hur dina data hanteras. Insikter ger information om mål och funktioner i ditt experiment, som funktioner som har släppts, inte är tillgängliga eller kommer att krypteras med specialbearbetning.
Kolumnen Insikter finns på fliken Data när du är i Schemavy. Förkortade insikter finns även i Datavy. Insikter skapas separat för varje modell som tränas i experimentet.
Insikter genereras:
-
Efter att du har lagt till eller ändrat träningsdata men inte ännu kört några experimentversioner.
-
Efter varje experimentversion har körts En separat uppsättning insikter skapas för varje modell som tränas.
Insikterna kan vara annorlunda före och efter att en version har körts. Det beror på att när träningen inleds kan AutoML förbereda dina data och ytterligare diagnostisera problem med dina data. Se Automatisk förberedelse och omvandling av data för mer information.
Visa insikter före träning
Innan du kör en version av experimentet kan du analysera Insikterna och se hur aktuella träningsdata tolkas. Dessa insikter kan ändras allteftersom du kör versionen.
Gör följande:
I ett experiment ska du se till att du har lagt till de träningsdata som du vill använda för experimentversionen.
Öppna fliken Data.
Kontrollera att du är i Schemavy.
Analysera kolumnen Insikter. Beskrivningar ger ytterligare kontext bakom insikterna. Se Tolka datauppsättningsinsikter för ytterligare beskrivningar om vad varje insikt innebär.
Visa insikterna för en modell
Efter att modellen har slutfört träningen för en experimentversion väljer du en modell och ser över hur data har hanterats:
Gör följande:
Kör en experimentversion och öppna sedan fliken Data.
Välj en modell i listrutan i det verktygsfältet.
Kontrollera att du är i Schemavy.
Analysera kolumnen Insikter. Beskrivningar ger ytterligare kontext bakom insikterna. Se Tolka datauppsättningsinsikter för ytterligare beskrivningar om vad varje insikt innebär.
Tolka datauppsättningsinsikter
Följande tabell ger mer detaljer om de möjliga insikter som kan visas i schemat.
Insikt | Betydelse | Konsekvenser för konfigurationen | När insikten har fastställts | Ytterligare referenser |
---|---|---|---|---|
Konstant | Kolumnen har samma värde för alla rader. | Kolumnen kan inte användas som mål eller inkluderad funktion. | Före och efter körning av versionen | Kardinalitet |
One-hot-kodad | Funktionen är kategorisk och kolumnen har färre än 14 unika värden. | Ingen effekt på konfigurationen. | Före och efter körning av versionen | Kategorisk kodning |
Effektkodad | Funktionstypen är kategorisk och kolumnen har 14 eller fler unika värden. | Ingen effekt på konfigurationen. | Före och efter körning av versionen | Kategorisk kodning |
Hög kardinalitet | Kolumnen har för många unika värden och kan påverka modellens prestanda negativt om den används som funktion. | Kolumnen kan inte användas som mål. Den kommer att uteslutas automatiskt som en funktion, men kan fortfarande inkluderas om det behövs. | Före och efter körning av versionen | Kardinalitet |
Gles data | Kolumnen har för många nollvärden. | Kolumnen kan inte användas som mål eller inkluderad funktion. | Före och efter körning av versionen | Tillräkning av nollor |
Underrepresenterad klass | Kolumnen har en klass med färre än tio rader. | Kolumnen kan inte användas som mål, men kan ingå som en funktion. | Före och efter körning av versionen | – |
<antal> autogenererade funktioner | Kolumnen är den överordnade funktion som kan användas för att generera autogenererade funktioner. | Om denna överordnade funktion tolkas som en datumfunktion tas den automatiskt bort från konfigurationen. Vi rekommenderar att du använder de autogenererade datumfunktionerna som kan genereras från den. Det är möjligt att åsidosätta den här inställningen och inkludera funktionen snarare än de autogenererade funktionerna. | Före och efter körning av versionen | Automatisk funktionsgenerering |
autogenererad funktion | Kolumnen är en autogenererad funktion som kan, eller har, genererats från en överordnad datumfunktion. Den förekom inte i den ursprungliga datumuppsättningen. | Du kan ta bort en eller flera av de här autogenererade funktionerna under experimentträningen. Om du växlar funktionstypen för den överordnade funktionen till kategorisk tas alla autogenererade funktioner bort. | Före och efter körning av versionen | Automatisk funktionsgenerering |
Kunde inte bearbeta som ett datum | Kolumnen innehåller eventuellt datum- och tidsinformation, men kunde inte användas för att skapa autogenererade datumfunktioner. | Funktionen tas bort från konfigurationen. Om autogenererade funktioner hade genererats tidigare från den här överordnade funktionen tas de bort från framtida experimentversioner. Du kan fortfarande använda funktionen i experimentet, men du måste ändra dess funktionstyp till kategorisk. | Efter körning av versionen | Generering av datumfunktioner |
Eventuell fritext | Kolumnen kan eventuellt vara tillgänglig för användning som en fritextfunktion. | Funktionstypen fritext tilldelas till kolumnen. Du måste köra en experimentversion för att bekräfta om funktionen kan bearbetas som fritext. | Före körning av versionen | Hantering av fritextdata |
Fritext | Kolumnen har bekräftats innehålla fritext. Den kan bearbetas som fritext. | Ingen ytterligare konfigurering krävs för funktionen. | Efter körning av versionen | Hantering av fritextdata |
Kunde inte bearbeta som fritext | Ytterligare analys har visat att kolumnen inte kan bearbetas som fritext. | Du måste välja bort funktionen för konfigurationen för nästa experimentversion. Om funktionen inte har hög kardinalitet kan du alternativt ändra funktionstypen till kategorisk. | Efter körning av versionen | Hantering av fritextdata |
Målläckage | Funktionen misstänks vara påverkad av målläckage. I så fall innehåller den information om målkolumnen som du försöker förutsäga. Funktioner med målläckage kan ge en falsk känsla av säkerhet gällande modellens prestanda. I verkliga prognoser kan detta göra att modellen presterar mycket dåligt. | Funktionen har inte använts för att träna modellen. | Efter körning av versionen | Dataläckage |
Låg permutationsbetydelse | Funktionen har liten, eller ingen, påverkan på modellens prognoser. Tas dessa funktioner bort förbättras modellens prestanda då statistiskt brus minskas. | Funktionen har inte använts för att träna modellen. | Efter körning av versionen | Förstå permutationsbetydelse |
Stark korrelation | Funktionen har stark korrelation med en eller flera andra funktioner i experimentet. Att ha funktioner med stark korrelation med varandra sänker modellen prestanda. | Funktionen har inte använts för att träna modellen. Funktionen som den har stark korrelation till har inte släppts på grund av stark korrelation men kan ha släppts av annan anledning, som låg permutationsbetydelse. | Efter körning av versionen | Korrelation |