Förfina modeller
När du har skapat några inledande modeller är det viktigt att förfina dem för att öka deras effektivitet och potentiella noggrannhet. Modellpoängen indikerar olika mått på denna prestanda. Även om målet med att förfina modellerna är att öka dessa poäng, indikerar en högre poäng inte alltid en bättre modell.
Du kan förfina dina modeller genom att utesluta eller inkludera funktioner, ändra träningsdata och ändra andra konfigurationsparametrar. Genom att göra det kan du jämföra olika versioner för att se vilken effekt dina ändringar har.
Genom att tolka poängen lär du dig hur du förfinar modellen. Värdena för de olika måtten kan ge dig insikter om vilka åtgärder du ska vidta för att förbättra resultatet.
Krav och behörigheter
Mer information om användarkrav för att arbeta med ML-experiment finns i Arbeta med experiment.
Konfigurera en ny version
När du har kört en experimentversion kan du förfina dina modeller vid behov genom att skapa en ny version.
Gör följande:
-
Från fliken Träningsdata, Modeller eller Analysera väljer du den modell som ska användas som bas för nästa version.
-
Klicka på Visa konfiguration.
Panelen för experimentkonfiguration öppnas.
-
Klicka på Skapa ny version.
När du har skapat en ny version kan du göra ändringar i dess konfiguration, till exempel:
-
Utesluta befintliga funktioner
-
Inkludera tidigare uteslutna funktioner
-
Ändra eller uppdatera datamängden
-
Välja eller avmarkera algoritmer
Mer information om dessa alternativ finns i delavsnitten nedan.
När du utformar en ny version klickar du på filterikonen under Funktioner i panelen för experimentkonfiguration. När du filtrerar kan du lättare visualisera vilka funktioner som har introducerats sedan du ändrade träningsdatamängden. Du kan också se vilka funktioner som är automatiskt genererade och icke-genererade.
Förbättra datamängden
Om din modell inte får bra poäng kan du behöva granska datamängden för att åtgärda eventuella problem. Läs mer om hur du förbättrar datamängden i Förbereda din datamängd för träning.
Utesluta funktioner
Fler funktioner ger inte nödvändigtvis en bättre modell. För att förfina modellen bör du utesluta otillförlitliga och irrelevanta funktioner, till exempel:
-
Funktioner med för hög korrelation. Från två korrelerade funktioner utesluter du den med lägre funktionsbetydelse.
-
Funktioner med för låg funktionsbetydelse. De funktionerna har ingen inverkan på det du försöker lära dig om.
-
Funktioner med för hög funktionsbetydelse. Det kan bero på dataläckage.
Testa att ta bort funktionen från träningsdata, kör sedan träningen igen och kontrollera om detta förbättrar modellen. Gör det stor skillnad eller ingen alls för modellpoängen?
Gör följande:
-
Öppna ett experiment från Katalogen.
-
Från fliken Träningsdata, Modeller eller Analysera väljer du den modell som ska användas som bas för nästa version.
-
Klicka på Visa konfiguration.
Panelen för experimentkonfiguration öppnas.
-
Klicka på Skapa ny version för att konfigurera en ny experimentversion.
-
Under Funktioner avmarkerar du kryssrutorna för alla funktioner som du inte vill använda i träningen.
Lägga till funktioner
Om din modell fortfarande inte får bra poäng kan det bero på att de funktioner som har ett förhållande till målet ännu inte har fångats upp i datamängden. Du kan bearbeta om och anpassa din datamängd för att optimera datakvaliteten och lägga till nya funktioner och information. När den är klar kan den nya datamängden läggas till i framtida experimentversioner. Se Ändra och uppdatera datamängden.
Läs mer om hur du samlar in eller skapar nya funktioner i Skapa nya funktionskolumner.
Ändra inställningar för biasdetektering
Du kan ändra vilka funktioner som biasdetektering ska köras på. Om du till exempel har lagt till nya funktioner i datamängden kan du aktivera biasdetektering för dessa funktioner.
Gör följande:
-
Öppna ett experiment från katalogen.
-
Från fliken Träningsdata, Modeller eller Analysera väljer du den modell som ska användas som bas för nästa version.
-
Klicka på Visa konfiguration.
Panelen för experimentkonfiguration öppnas.
-
Klicka på Skapa ny version för att konfigurera en ny experimentversion.
-
Expandera Bias i panelen för träningskonfiguration.
-
Klicka eventuellt på Få rekommendationer för att använda generativ AI för att föreslå funktioner som kan innehålla partiska data. Se Använda generativ AI för att rekommendera funktioner för snedvridningsdetektering.
-
Välj eller avmarkera de funktioner som du vill köra biasdetektering för.
Alternativt kan du ange inställningar för biasdetektering i Schemavy.
Mer information om biasdetektering finns i Identifiera snedvridning i maskininlärningsmodeller.
Välja algoritmer
Lämpliga algoritmer väljs automatiskt ut för träning baserat på datatypen för din målkolumn. Du kanske vill utesluta de algoritmer som inte presterar lika bra eller är långsammare. På så sätt slipper du slösa tid på dem under träningen.
Mer information om hur algoritmer väljs ut finns i Förstå modellalgoritmer.
Gör följande:
-
Öppna ett experiment från Katalogen.
-
Från fliken Data, Modeller eller Analysera väljer du den modell som ska användas som bas för nästa version.
-
Klicka på Visa konfiguration.
Panelen för experimentkonfiguration öppnas.
-
Klicka på Skapa ny version för att konfigurera en ny experimentversion.
-
Under Algoritmer avmarkerar du kryssrutorna för de algoritmer som du inte vill använda i träningen.
Ändra och uppdatera datamängden
Om dina träningsdata har ändrats sedan den senaste experimentversionen kan du ändra eller uppdatera datamängden för framtida versioner av experimentet.
Detta kan vara användbart om du vill jämföra modellmått och prestanda för olika datamängder inom samma experiment. Det är till exempel användbart om:
-
En ny uppsättning dataposter är tillgänglig, eller uppdateringar av den ursprungliga uppsättningen dataposter har gjorts. Till exempel kan den senaste månadens transaktioner ha blivit tillgängliga och lämpliga att använda i träningen, eller så kan ett problem med datainsamlingen ha identifierats och åtgärdats.
-
Den ursprungliga träningsdatamängden har bearbetats om eller anpassats, kanske i syfte att förbättra modellträningen. Du kan till exempel av ha förbättrat logiken för att definiera värden för funktionskolumner, eller till och med lagt till nya funktionskolumner.
Att ändra eller uppdatera datamängden ändrar inte befintliga modeller som redan har tränats från tidigare experimentversioner. Inom en experimentversion tränas modellerna endast på de träningsdata som definierats inom den specifika versionen.
Krav
När du ändrar eller uppdaterar datamängden för en ny experimentversion måste den nya datamängden uppfylla följande krav:
-
Namnet och funktionstypen för målkolumnen måste vara desamma som för målet i den ursprungliga träningsdatamängden.
- Antalet distinkta värden i målkolumnen måste ligga inom samma intervall som krävs för den givna experimenttypen. För ett experiment med klassificering i flera klasser (multiclass classification) måste till exempel målkolumnen i den nya datamängden fortfarande ha mellan tre och tio unika värden. Specifika intervall finns i Konfigurera experiment.
De andra funktionskolumnerna kan vara helt nya, ha andra namn och innehålla andra data.
Ändra datamängden
Gör följande:
-
Från fliken Träningsdata, Modeller eller Analysera väljer du den modell som ska användas som bas för nästa version.
-
Klicka på Visa konfiguration.
Panelen för experimentkonfiguration öppnas.
-
Klicka på Skapa ny version för att konfigurera en ny experimentversion.
-
Under Träningsdata > Granska datamängd klickar du på Ändra datamängd.
-
Välj eller ladda upp den nya datamängden. Du kan välja mellan:
-
Datamängder: Välj en datamängd i valfritt utrymme som du har åtkomst till. Se Tips och riktlinjer för att ladda upp och välja datamängder.
-
Dataprodukter: Välj en datamängd från en aktiv dataprodukt som du har åtkomst till. Mer information om dataprodukter finns i Creating data products.
-
Uppdatera datamängden
Gör följande:
-
Från fliken Träningsdata, Modeller eller Analysera väljer du den modell som ska användas som bas för nästa version.
-
Klicka på Visa konfiguration.
Panelen för experimentkonfiguration öppnas.
-
Klicka på Skapa ny version för att konfigurera en ny experimentversion.
-
Under Träningsdata klickar du på Uppdatera datamängd.
Du meddelas om en uppdatering av datamängden är tillgänglig. En datamängd uppdateras vanligtvis när den befintliga datafilen skrivs över genom att en ny fil med samma namn skapas.
Tips och riktlinjer för att ladda upp och välja datamängder
-
Datauppsättningar kan laddas upp via Skapa-sidan i Analyser aktivitetscentret och är synliga i katalogen. Du kan också ladda upp en ny datauppsättning direkt till katalogen från sidan för val av datauppsättning i experimentet. För att göra detta klickar du på Ladda upp fil och väljer den fil som ska laddas upp.
-
Alla tvådimensionella datastrukturer som kan laddas upp och profileras i Qlik Cloud stöds för användning i Qlik Predict.
För filer med flera tabeller, t.ex. Microsoft Excel-filer med flera ark, importeras endast den första tabellen. Om dataprofilering misslyckas för en tabell (t.ex. om den är tom) stöds filen inte.
Köra den förfinade versionen
När du är klar med konfigureringen av versionen kan du köra den.
Gör följande:
-
Klicka på Kör v2 i det nedre högra hörnet av skärmen.
(Texten på knappen beror på antalet versioner du har kört.)
Jämföra experimentversioner
När den nya versionen har tränats klart jämför du den nya versionen med den gamla för att se effekten av dina ändringar. Du har ett antal alternativ för att jämföra modeller mellan experimentversioner.
Snabbanalys
Använd flikarna Modeller och Träningsdata i experimentet för att jämföra versionen med äldre versioner. På fliken Modeller kan du:
-
Visa resultaten i tabellen Modellmått.
-
Visa rekommenderade modeller baserat på vanliga krav för prediktiv analys, inklusive noggrannhet och prediktionshastighet.
-
Växla mellan modeller för att visa skillnaderna i Sammanfattning av modellträning och andra automatiskt genererade diagram.
Mer information om snabb modellanalys finns i Utföra snabb modellanalys.
Djupanalys
Du kan göra en djupare analys av din modell genom att växla till flikarna Jämför och Analysera i experimentet. Dessa flikar erbjuder en inbäddad analysupplevelse där du interaktivt kan utvärdera modellerna på en mer detaljerad nivå.
Fliken Jämför erbjuder jämförelse av modellpoäng och hyperparametrar för alla modeller. Fliken Analysera låter dig fokusera på en specifik modell för att bedöma prediktionsnoggrannhet, funktionsbetydelse och andra detaljer.
Mer information finns i Jämförelse av modeller och Utföra detaljerad modellanalys.
Ändra inställningar för modelloptimering
Du kan inaktivera intelligent optimering efter att ha kört en version där den var aktiverad. Detta gör att du kan använda de insikter som den intelligenta optimeringen ger, samtidigt som du får den kontroll som krävs för att göra mindre, minimala justeringar. Alternativt kan du aktivera intelligent modelloptimering efter att ha kört en eller flera versioner med inställningen inaktiverad.
Hyperparameteroptimering är en inställning som kan vara användbar att aktivera under modellförfiningsprocessen. Generellt rekommenderas det inte att ha denna inställning aktiverad för den första versionen av experimentet.
Du kan också ändra om du vill använda tidsmedveten träning eller inte, eller ändra kolumnen som används som datumindex.
Gör följande:
-
Klicka på Visa konfiguration.
-
Klicka vid behov på Skapa ny version för att konfigurera en ny experimentversion.
-
I panelen expanderar du Modelloptimering.
-
Växla mellan inställningarna Intelligent och Manuell för att aktivera eller inaktivera intelligent modelloptimering.
-
Om du vill aktivera hyperparameteroptimering markerar du kryssrutan Hyperparameteroptimering och anger en maximal träningstid.
-
Under Tidsbaserad uppdelning för test/träning kan du ändra inställningarna för tidsmedveten träning:
-
För att aktivera tidsmedveten träning ändrar du standardvärdet Inget genom att välja en specifik Datumindex-kolumn i datamängden.
-
För att inaktivera tidsmedveten träning ställer du in Datumindex till värdet Inget.
-
Ändra den valda Datumindex-kolumnen till en annan kolumn.
-
Ta bort experimentversioner
Du kan ta bort experimentversioner som du inte vill behålla. Observera att alla modeller i experimentversionerna också tas bort och inte kan återställas.
Gör följande:
-
Växla till fliken Modeller.
-
I tabellen Modellmått väljer du en modell från den experimentversion du vill ta bort.
Anteckning om tipsDu kan också välja en modell när du är på flikarna Träningsdata eller Analysera med hjälp av rullgardinsmenyn i verktygsfältet. -
Klicka på Ta bort <versionsnummer> längst ned till höger.
-
Klicka på Ta bort i bekräftelsedialogrutan.