Förfining av modeller
När du väl har skapat några första modeller är det viktigt att förfina dem för att öka deras effektivitet och potentiella noggrannhet. Modellpoängen anger olika mått på dessa prestanda. Målet med att förfina modellerna är att öka dessa poäng, men en högre poäng är inte alltid ett tecken på en bättre modell.
Du kan förfina dina modeller genom att exkludera eller inkludera funktioner, ändra träningsdata och modifiera andra konfigurationsparametrar. Genom att göra det kan du jämföra olika versioner och se vilken påverkan dina ändringar har.
Genom att tolka poängen lär du dig hur du kan förfina modellen. Värdena för de olika måtten kan ge dig insikter om vilka åtgärder du ska vidta för att förbättra resultatet.
Krav och behörigheter
Mer information om användarkraven för att arbeta med ML-experiment finns i Arbeta med experiment.
Konfigurera en ny version
När du har kört en experimentversion kan du förfina dina modeller vid behov genom att skapa en ny version.
Gör följande:
-
Från fliken Data, Modeller eller Analysera väljer du modellen som ska användas som grund för nästa version.
-
Klicka på Visa konfiguration.
Experimentets konfigurationspanel öppnas.
-
Klicka på Ny version.
När du har skapat en ny version kan du göra ändringar i dess konfiguration, till exempel:
-
Utesluta befintliga funktioner
-
Inkludera tidigare uteslutna funktioner
-
Ändra eller uppdatera datauppsättningen
-
Välja eller välja bort algoritmer
Mer information om de här alternativen finns i följande avsnitt.
När du gör ett utkast till en ny version klickar du på ikonen filtrera under Funktioner i experimentets konfigurationspanel. När du filtrerar kan du enklare visualisera vilka funktioner som har lanserats sedan du ändrade träningsdatauppsättningen. Du kan också visa vilka funktioner som är autogenererade och icke-genererade.
Förbättring av datauppsättningen
Om din modell inte får bra poäng kan det vara lämpligt att se över datauppsättningen för att åtgärda eventuella problem. Läs mer om hur du kan förbättra datauppsättningen i Gör din datauppsättning redo för träning.
Uteslutning av funktioner
Fler funktioner ger inte nödvändigtvis en bättre modell. För att förfina modellen behöver du utesluta otillförlitliga och irrelevanta funktioner, t.ex följande:
-
Funktioner med för hög korrelation. Av två korrelerade funktioner utesluts den med mindre betydelse.
-
Funktioner med för liten funktionsbetydelse. Dessa funktioner har inget inflytande på det du försöker lära dig något om.
-
Funktioner med för stor funktionsbetydelse. Detta kan bero på dataläckage.
Testa att ta bort funktionen från träningsdata, kör sedan träningen igen och kontrollera om modellen förbättras. Gör det stor skillnad eller ingen skillnad för modellens poäng?
Gör följande:
-
Öppna ett experiment från Catalog.
-
Från fliken Data, Modeller eller Analysera väljer du modellen som ska användas som grund för nästa version.
-
Klicka på Visa konfiguration.
Experimentets konfigurationspanel öppnas.
-
Klicka på Ny version för att konfigurera en ny experimentversion.
-
Under Funktioner avmarkerar du kryssrutorna för alla funktioner som du inte vill använda i träningen.
Lägga till funktioner
Om din modell fortfarande inte får bra poäng kan det bero på att de funktioner som har ett samband med målet ännu inte finns med i datauppsättningen. Du kan återbearbeta och modifiera din datauppsättning för att optimera datakvaliteten och lägga till nya funktioner och information. När du är klar kan den nya datauppsättningen läggas till i kommande experimentversioner. Se Ändra eller uppdatera datauppsättningen.
Läs mer om hur du hittar eller utvecklar nya funktioner i Skapa nya funktionskolumner.
Välja algoritmer
Baserat på målkolumnens datatyp väljs automatiskt lämpliga algoritmer för träning. Du kanske vill utesluta algoritmer som inte fungerar lika bra eller är långsammare. På så sätt behöver du inte slösa tid på dem för träning.
Mer information om hur algoritmer väljs finns i Förstå modellalgoritmer.
Gör följande:
-
Öppna ett experiment från Catalog.
-
Från fliken Data, Modeller eller Analysera väljer du modellen som ska användas som grund för nästa version.
-
Klicka på Visa konfiguration.
Experimentets konfigurationspanel öppnas.
-
Klicka på Ny version för att konfigurera en ny experimentversion.
-
Under Algoritmer avmarkerar du kryssrutorna för alla algoritmer som du inte vill använda i träningen.
Ändra eller uppdatera datauppsättningen
Om dina träningsdata har ändrats sedan den senaste experimentversionen kan du ändra eller uppdatera datauppsättningen för kommande versioner av experimentet.
Detta kan vara användbart om du vill jämföra modellmått och prestanda för olika datauppsättningar inom samma experiment. Detta är användbart om exempelvis:
-
En ny uppsättning dataposter är tillgängliga, eller uppdateringar av den ursprungliga uppsättningen dataposter har gjorts. Exempelvis kan den senaste månadens transaktioner ha blivit tillgängliga och vara lämpliga för användning i träning, eller ett problem vid datainsamling kan ha identifierats och åtgärdats.
-
Den ursprungliga träningsdatauppsättningen har återbearbetats eller modifierats, kanske i syfte att förbättra modellträningen. Du kan exempelvis ha förbättrat logiken för att definiera kolumnvärden, eller till och med ha lagt till nya funktionskolumner.
Att ändra eller uppdatera datauppsättningen påverkar inte befintliga modeller som redan har tränats med tidigare experimentversioner. Inom en experimentversion tränas modellerna bara på träningsdata som definierats inom den specifika versionen.
Krav
När du ändrar eller uppdaterar datauppsättningen för en ny experimentversion måste den nya datauppsättningen uppfylla följande krav.
-
Målkolumnens namn och funktionstyp måste vara samma som målet i den ursprungliga träningsdatauppsättningen.
- Antalet distinkta värden i målkolumnen måste ligga inom det intervall som krävs för den aktuella experimenttypen. För ett experiment med multiklassklassificering till exempel måste målkolumnen i den nya datauppsättningen fortfarande ha mellan tre och tio unika värden. De specifika intervallen finns i Bestämma den typ av modell som skapas.
Övriga funktionskolumner kan vara helt nya, ha olika namn och innehålla olika data.
Byta datauppsättning
Gör följande:
-
Från fliken Data, Modeller eller Analysera väljer du modellen som ska användas som grund för nästa version.
-
Klicka på Visa konfiguration.
Experimentets konfigurationspanel öppnas.
-
Klicka på Ny version för att konfigurera en ny experimentversion.
-
Under Träningsdata klickar du på Ändra datauppsättning.
-
Välj eller ladda upp den nya datauppsättningen.
Uppdatera datauppsättningen
Gör följande:
-
Från fliken Data, Modeller eller Analysera väljer du modellen som ska användas som grund för nästa version.
-
Klicka på Visa konfiguration.
Experimentets konfigurationspanel öppnas.
-
Klicka på Ny version för att konfigurera en ny experimentversion.
-
Under Träningsdata klickar du på Uppdatera datauppsättning.
Om det finns en uppdatering av datauppsättningen får du ett meddelande. En datauppsättning uppdateras i typfallet när den befintliga datafilen skrivs över när en ny fil med samma namn skapas.
Köra den förfinade versionen
När du är klar med att konfigurera versionen kan du köra den.
Gör följande:
-
Klicka på Kör v2 i det nedre högra hörnet av skärmen.
(Texten på knappen beror på hur många versioner du har kört.)
Jämförelse av experimentversioner
När den nya versionens träning är avslutad jämför du den nya versionen med den gamla för att se vilken effekt dina ändringar hade: Det finns ett antal alternativ för att jämföra modeller mellan experimentversioner.
Snabbanalys
På flikarna Modeller och Data i experimentet kan du jämföra versionen med äldre versioner. På fliken Modeller kan du:
-
Visa resultaten i tabellen Mätvärden för modeller.
-
Växla mellan modeller för att visa skillnader i Sammanfattning av modellträning och andra autogenererade diagram.
Se Utföra snabb modellanalys för mer information om snabb modellanalys.
Djupgående analys
Du kan fördjupa dig i din modellanalys genom att växla till flikarna Jämför och Analysera i experimentet. Flikarna ger en inbäddad analysupplevelse där du interaktivt kan utvärdera modellerna på mer granulär nivå.
På fliken Jämför kan du också jämföra modellpoäng och hyperparametrar för alla modeller. På fliken Analysera kan du fokusera på en specifik modell för att utvärdera prognosnoggrannhet, funktionsbetydelse och andra detaljuppgifter.
Se Jämförelse av modeller och Utföra detaljerad modellanalys för mer information.
Inställningar för att ändra modelloptimering
Du kan stänga av intelligent optimering när du har kört en version där det varit aktiverat. Det gör att du kan använda insikterna du fått från intelligent optimering och samtidigt få den kontroll som behövs för att göra små, minimala finjusteringar. Alternativt kan du slå på intelligent modelloptimering efter att du har kört en eller flera versioner med inställningen avslagen.
Hyperparameteroptimering är en inställning som kan vara användbar att slå på under modellförfiningsprocessen. Generellt rekommenderar vi inte att ha inställningen påslagen för första versionen av experimentet.
Du kan också ändra om du vill använda tidskänslig utbildning eller inte, eller ändra kolumnen som används som datumindex.
Gör följande:
Klicka på Visa konfiguration.
Klicka vid behov på Ny version för att konfigurera en ny experimentversion.
Expandera Modelloptimering i panelen.
Växla mellan inställningarna Intelligent och Manuell för att slå på eller av intelligent modelloptimering.
Om du vill aktivera hyperparameteroptimering klickar du i markeringsrutan Hyperparameteroptimering och ställer in maximal träningstid.
Under Tidsbaserad uppdelning av test och träningkan du ändra inställningarna för tidskänslig träning:
Om du vill aktivera tidskänslig träning ändrar du standardvärdet None genom att välja en specifik Indexkolumn i Datauppsättningen.
För att stänga av tidskänslig träning ställer du in Datumindexet på Inget.
Ändra den valda Datumindex-kolumnen till en annan kolumn.
Radera experimentversioner
Du kan radera experimentversioner som du inte vill behålla. Observera att alla modeller i experimentversionerna också tas bort och inte kan återställas.
Gör följande:
Växla till fliken Modeller.
I tabellen Mätvärden för modeller väljer du en modell från den experimentversion som du vill radera.
Anteckning om tipsDu kan också välja en modell när du är på fliken Data eller Analysera med listrutan i verktygsfältet.Klicka på Radera <versionsnummer> längst ner till höger.
Klicka på Radera i bekräftelsedialogrutan.