Konfigurering av experiment
Konfigureringen av experiment består i att välja målet och de funktioner som modellen ska använda för att förutsäga målet. Du kan också konfigurera ett antal valfria inställningar.
För att du ska få hjälp att välja ett mål analyseras den historiska datauppsättningen och sammanfattande statistik visas för varje kolumn i datauppsättningen. Flera automatiska förbehandlingssteg tillämpas på datauppsättningen för att se till att endast lämpliga data tas med. Mer information om förbehandlingen av data finns i Automatisk förberedelse och omvandling av data.
När du har kört v1 kan du skapa nya experimentversioner vid behov om du behöver förfina modellträningen ytterligare. Se Förfining av modeller för mer information.
Krav och behörigheter
Mer information om användarkraven för att arbeta med ML-experiment finns i Arbeta med experiment.
Gränssnittet
Följande delavsnitt beskriver hur du navigerar i experimentets gränssnitt för att konfigurera experimentet. Se Navigera i experimentets gränssnitt för mer information om gränssnittet.
Fliknavigering
När du skapar ett experiment öppnas fliken Data. Där kan du konfigurera målet och funktionerna för experimentet.
När du har kört minst en experimentversion blir ytterligare flikar tillgängliga. På de övriga flikarna kan du analysera de modeller som du precis tränat i versionen. Om du behöver konfigurera efterföljande versioner med olika funktionsurval kan du gå tillbaka till fliken Data.
Schemavy och Datavy
På fliken Data kan du alternera mellan följande vyer:
-
Schemavy: Standardvyn. I denna vy representeras varje kolumn i datauppsättningen av en rad i schemat med information och statistik.
-
Datavy: Alternativ vy du kan använda för att komma åt mer information och exempeldata för varje kolumn.
Panel för experimentkonfiguration
Klicka på Visa konfiguration för att öppna en panel där du kan anpassa experimentträningen ytterligare. Panelen kan öppnas oaktat vilken flik du visar. Panelen har ett antal ytterligare konfigurationsalternativ.
I panelen för experimentkonfiguration kan du:
-
Välj ett mål innan du tränar den första versionen
-
Lägg till eller ta bort funktioner
-
Konfigurera en ny version av experimentet
-
Välj att ändra eller uppdatera utbildningsdatauppsättningen
-
Lägg till eller ta bort algoritmer
-
Ändra inställningar för modelloptimering
Välja ett mål
Målkolumnen innehåller de värden som du vill att modellen för maskininlärning ska förutsäga. Du kan ändra målkolumnen tills du startar första träningen. Därefter är den låst för redigering.
Gör följande:
I Schemavy eller Datavy hovrar du över kolumnen.
Klicka på -ikonen som visas.
Målkolumnen anges nu med och de andra tillgängliga kolumnerna väljs automatiskt som funktioner.
Målet kan även väljas i träningens konfigurationspanel.
När målet har valts kan du börja köra den första versionen av experimentet. Läs mer i Träningsexperiment. Du kan göra ytterligare konfigurationer nu – som beskrivs nedan – eller justera konfigurationen efter att du har granskat träningsresultaten.
Förklaringar av hur dina data tolkas och bearbetas visas när experimentträningen fortsätter. Se Tolka datauppsättningsinsikter för mer information.
Bestämma den typ av modell som skapas
Kolumnen du väljer som mål bestämmer vilken typ av modell ditt experiment skapar. Detta spelar i sin tur en roll för att avgöra vilka algoritmer som används för att träna modellen. Vissa kolumner i din datauppsättning kanske inte kan väljas som mål för ditt experiment, eller så kan en särskild behandling tillämpas på dem.
Modelltyperna är:
Binär klassificeringsmodell
Multiklassklassificeringsmodell
Regressionsmodell
Tabellen nedan sammanfattar de faktorer i ditt mål som avgör vilken typ av modell som används.
Modelltyp | Antal distinkta värden i kolumnen | Funktionstyp som krävs | Mer information |
---|---|---|---|
Binär klassificering | 2 | Valfri | – |
Multiklassklassificering | 3-10 | Valfri | En kolumn med fler än 10 distinkta, icke-numeriska klasser kan inte väljas som mål. |
Regression | Fler än 10 | Numerisk | – |
Vill du veta vilken typ av modeller experimentet tränar klickar du på Visa konfiguration och expanderar Algoritmer. Modelltypen syns i titeln för delavsnittet.
Välja funktionskolumner
När målet är fastställt kan du välja vilka av de andra tillgängliga kolumnerna som ska ingå i modellens träning. Uteslut alla funktioner som du inte vill ska ingå i modellen. Observera att kolumnen kommer att finnas kvar i datauppsättningen men inte användas av träningsalgoritmen.
Högst upp i experimentets konfigurationspanel kan du se antal celler i datauppsättningen. Om antalet överskrider gränsen för datauppsättningen kan du utesluta funktioner för att komma under gränsen.
Du kan välja funktionskolumnerna på olika sätt:
I Schemavy och Datavy
I huvudvyerna kan du:
Avmarkera Inkludera alla tillgängliga funktioner och välj sedan bara de funktioner som du vill inkludera.
Avmarkera manuellt kryssrutorna för de funktioner som du inte vill inkludera.
Gör en sökning och uteslut eller inkludera alla funktioner i det filtrerade sökresultatet.
I träningens anpassningspanel
Om du expanderar experimentets konfigurationspanel kan du:
Avmarkera manuellt kryssrutorna för de funktioner som du inte vill inkludera.
När du har kört den första versionen av experimentet kan du definiera antal toppfunktioner att inkludera.
När du väljer funktioner tilldelas de automatiskt en funktionstyp. Möjliga funktionstyper är:
Kategorisk
Numerisk
Datum
Fritext
Funktionstypen tilldelas baserat på de data som finns i funktionskolumnen. Om en funktion uppfyller vissa kriterier kan den mellanlagras och bli utgångspunkt för autogenererade funktioner. Vid behov kan du ändra om funktionen används för automatisk funktionsgenerering. Fullständig information om automatisk funktionsgenerering finns i Automatisk funktionsgenerering.
Vissa kolumner i din datauppsättning kanske inte kan väljas som funktioner för ditt experiment, eller så kan en särskild behandling tillämpas på dem. Förklaringar av hur dina data tolkas och bearbetas visas när du navigerar experimentträningen. Se Tolka datauppsättningsinsikter för mer information.
Välja algoritmer
Alla tillgängliga algoritmer inkluderas som standard och du kan utesluta algoritmer som du inte vill använda. Normalt sett skulle du göra detta som en del av modellförfiningen när du har sett de första träningsresultaten. Läs mer i Förfining av modeller.
Ändra funktionstyper
När en datauppsättning läses in behandlas kolumnerna som kategoriska, numeriska, datum eller fritext, beroende på datatypen och andra egenskaper. I vissa fall kan du vilja ändra den här inställningen.
Om t.ex. veckodagarna representeras av siffrorna 1–7 representerar varje siffra ett kategoriskt värde. Som standard behandlas den som ett kontinuerligt rangordnat numeriskt värde, så du måste manuellt ändra konfigurationen för att behandla den som kategorisk.
När datum- och tidsinformation identifieras i en kolumn används de som bas för nya genererade autogenererade funktioner. När detta händer behandlas den ursprungliga kolumnen (den överordnade funktionen) som om den har datumfunktionstypen. Du kan ändra den överordnade funktionen från en datumfunktionstyp till en kategorisk funktionstyp. Men om du gör det kan du inte längre använda dess autogenererade funktioner vid träning av experiment.
Gör följande:
Leta upp funktionen i Schemavyn.
Klicka på i kolumnen Funktionstyp för den här funktionen.
Välj ett värde i listan.
Alternativt kan du ändra funktionstyper från Datavy. Sök reda på funktionen och klicka sedan på bredvid den aktuella funktionstypen. Välj ett värde i listan.
Du kan se alla kolumner som har en ändrad funktionstyp i experimentets konfigurationspanel under Databehandling.
Byta datauppsättning
Du kan ändra träningsdatauppsättningen innan du kör den första experimentversionen och när du har kört någon version.
Om du ändrar datauppsättningen innan du kör den första versionen kommer du att förlora alla konfigureringar som du har gjort innan du ändrade datauppsättningen.
Gör följande:
I experimentets konfigurationspanel under Träningsdata klickar du på Ändra datauppsättning.
Välj en ny datauppsättning.
Mer information om att ändra och uppdatera datauppsättningen under modellförfiningen (när du har kört en experimentversion) finns i Ändra eller uppdatera datauppsättningen.
Konfigurera modelloptimering
Följande inställningar kan anpassas för att optimera dina modeller:
Slå på eller av intelligent modelloptimering
Slå på eller av optimering av hyperparameter
Aktivera eller inaktivera tidskänslig utbildning
Dessa alternativ kan slås på eller av för varje version av experimentet du kör.
Konfigurera intelligent optimering
Som standard använder experiment intelligent modelloptimering. Med intelligent modelloptimering hanterar AutoML modellförfiningsprocessen åt dig genom att upprepa valet av funktioner och tillämpa avancerade omvandlingar på dina data.
Se Intelligent modelloptimering för mer information om intelligent optimering.
Du kan stänga av den här inställningen och manuellt förfina modellerna du tränar. Om du exempelvis vill starta din modellträning med intelligent modelloptimering och sedan växla till manuell förfining för v2 och sedan ytterligare justera konfigurationen.
Gör följande:
Klicka på Visa konfiguration.
Om du redan kört minst en version av experimentet klickar du på Ny version.
Expandera Modelloptimering i panelen.
Växla från Intelligent till Manuell.
Använd skjutreglaget för att ställa in maximal varaktighet för träningen.
Konfigurera hyperparameteroptimering
Du kan optimera modellen med hjälp av hyperparameteroptimering. Observera att detta är ett avancerat alternativ som kan öka träningstiden avsevärt. Hyperparameteroptimering är tillgängligt om du stänger av intelligent optimering.
Se Optimering av hyperparameter för mer information.
Gör följande:
Klicka på Visa konfiguration.
Om du redan kört minst en version av experimentet klickar du på Ny version.
Expandera Modelloptimering i panelen.
Växla från Intelligent till Manuell.
Markera kryssrutan Optimering av hyperparameter.
Du kan också ange en tidsgräns för optimeringen. Standardtidsgränsen är en timme.
Konfiguration av tidskänslig utbildning
Om du vill att dina modeller ska tränas med hänsyn till en tidsseriedimension, aktivera tidskänslig träning för experimentversionen. Om du vill använda det här alternativet måste du ha en kolumn i datauppsättningen som innehåller relevant tidsserieinformation.
När tidskänslig träning är aktiverad använder AutoML specialiserade processer för korsvalidering och tillräkning av nollor för att träna modellerna.
Se Skapa tidskänsliga modeller och Tidsbaserad korsvalidering för mer information.
Gör följande:
Klicka på Visa konfiguration.
Om du redan kört minst en version av experimentet klickar du på Ny version.
Expandera Modelloptimering i panelen.
Under Delning av tidsbaserad testträning väljer du Datumindex för att sortera data.
Visar insikter om träningsdata
På fliken Data i experimentet kan du visa insikter i hantering av träningsdata. Informationen finns i kolumnen Insikter i Schemavy. Informationen visas beroende på om du har du har kört en version med aktuella träningsdata eller inte. Ändringar i kolumnen Insikter kan hjälpa till att identifiera varför funktioner kanske inte är tillgängliga att använda eller varför de automatiskt släppts.
Se Tolka datauppsättningsinsikter för mer information om vad varje insikt innebär.