Gå till huvudinnehåll Gå till ytterligare innehåll

Konfigurering av experiment

Konfigureringen av experiment består i att välja målet och de funktioner som modellen ska använda för att förutsäga målet. Du kan också konfigurera ett antal valfria inställningar.

För att du ska få hjälp att välja ett mål analyseras den historiska datauppsättningen och sammanfattande statistik visas för varje kolumn i datauppsättningen. Flera automatiska förbehandlingssteg tillämpas på datauppsättningen för att se till att endast lämpliga data tas med. Mer information om förbehandlingen av data finns i Automatisk förberedelse och omvandling av data.

När du har kört v1 kan du skapa nya experimentversioner vid behov om du behöver förfina modellträningen ytterligare. Mer information finns i Förfining av modeller.

Krav och behörigheter

Mer information om användarkraven för att arbeta med ML-experiment finns i Arbeta med experiment.

Vyer

Standardvyn är schemaöversikten, där varje kolumn i datauppsättningen representeras av en rad i schemat med information och statistik. För att få mer information och urvalsdata för varje kolumn kan du också använda datavyn. Klicka på Kolumner och Datavy för att växla mellan vyerna.

En förhandsgranskning av datauppsättningen som visas i schemaöversikten

AutoML-schemaöversikten.

En förhandsgranskning av datauppsättningen som visas i datavyn

AutoML-datavyn.

Klicka på Konfigurationsfönster för att öppna eller stänga sidofönstret Experimentkonfiguration. Här hittar du information om ditt experiment och den aktuella konfigurationen.

Sidofönstret visar experimentkonfigurationen för den aktuella versionen

Sidofönstret för konfigurationen av AutoML-experimentet.

Välja ett mål

Målkolumnen innehåller de värden som du vill att modellen för maskininlärning ska förutsäga. Du kan ändra målkolumnen tills du startar den första träningen. Därefter är den låst för redigering.

  • Håll muspekaren över kolumnen och klicka på Mål-ikonen som visas.

    Målkolumnen anges nu med Mål och de andra tillgängliga kolumnerna väljs automatiskt som funktioner.

Välja mål

Datauppsättningskolumn med målsymbol.

När målet har valts kan du börja köra den första versionen av experimentet. Läs mer i Träningsexperiment. Du kan göra ytterligare konfigurationer nu – som beskrivs nedan – eller justera konfigurationen efter att du har granskat träningsresultaten.

Förklaringar av hur dina data tolkas och bearbetas visas när du navigerar experimentträningen. Mer information finns i Vanliga insikter som hittas i träningsdata.

Bestämma den typ av modell som skapas

Kolumnen du väljer som mål bestämmer vilken typ av modell ditt experiment skapar. Detta spelar i sin tur en roll för att avgöra vilka algoritmer som används för att träna modellen. Vissa kolumner i din datauppsättning kanske inte kan väljas som mål för ditt experiment, eller så kan en särskild behandling tillämpas på dem.

Modelltyperna är:

  • Binär klassificeringsmodell

  • Multiklassklassificeringsmodell

  • Regressionsmodell

Tabellen nedan sammanfattar de faktorer i ditt mål som avgör vilken typ av modell som används.

Egenskaper för målkolumnen som avgör modelltypen
Modelltyp Antal distinkta värden i kolumnen Funktionstyp som krävs Mer information
Binär klassificering 2 Valfri
Multiklassklassificering 3-10 Valfri En kolumn med fler än 10 distinkta, icke-numeriska klasser kan inte väljas som mål.
Regression Fler än 10 Numerisk

Välja funktionskolumner

När målet är fastställt kan du välja vilka av de andra tillgängliga kolumnerna som ska ingå i modellens träning. Uteslut alla funktioner som du inte vill ska ingå i modellen. Observera att kolumnen kommer att finnas kvar i datauppsättningen men inte användas av träningsalgoritmen.

Högst upp i fönstret Experimentkonfiguration kan du se antalet celler i datauppsättningen. Om antalet överskrider gränsen för datauppsättningen kan du utesluta funktioner för att komma under gränsen.

Du kan välja funktionskolumnerna på olika sätt:

  • Avmarkera manuellt kryssrutorna för de funktioner som du inte vill inkludera.

  • Klicka på Exkludera alla funktioner och välj sedan bara de funktioner som du vill inkludera.

  • Gör en sökning och uteslut eller inkludera alla funktioner i det filtrerade sökresultatet.

  • När du har kört den första versionen av experimentet kan du definiera antal toppfunktioner att inkludera.

Delavsnittet Funktioner i experimentkonfigurationen

Delavsnittet Funktioner i sidofönstret för konfigurationen av AutoML-experimentet.

När du väljer funktioner tilldelas de automatiskt en funktionstyp. Möjliga funktionstyper är:

  • Kategorisk

  • Numerisk

  • Datum

  • Fritext

Funktionstypen tilldelas baserat på de data som finns i funktionskolumnen. Om en funktion uppfyller vissa kriterier kan den mellanlagras och bli utgångspunkt för autogenererade funktioner. Vid behov kan du ändra om funktionen används för automatisk funktionsgenerering. Fullständig information om automatisk funktionsgenerering finns i Automatisk funktionsgenerering.

Vissa kolumner i din datauppsättning kanske inte kan väljas som funktioner för ditt experiment, eller så kan en särskild behandling tillämpas på dem. Förklaringar av hur dina data tolkas och bearbetas visas när du navigerar experimentträningen. Mer information finns i Vanliga insikter som hittas i träningsdata.

Välja algoritmer

Alla tillgängliga algoritmer inkluderas som standard och du kan utesluta algoritmer som du inte vill använda. Normalt sett skulle du göra detta som en del av modellförfiningen när du har sett de första träningsresultaten. Läs mer i Förfining av modeller.

Algoritmer-delavsnittet i experimentkonfigurationen

Algoritmer-delavsnittet i sidofönstret för konfigurationen av AutoML-experimentet.

Ändra funktionstyper

When a dataset is loaded, the columns are treated as categorical, numeric, date, or free text based on the data type and other characteristics. In some cases, you might want to change this setting.

Om t.ex. veckodagarna representeras av siffrorna 1–7 representerar varje siffra ett kategoriskt värde. Som standard behandlas den som ett kontinuerligt rangordnat numeriskt värde, så du måste manuellt ändra konfigurationen för att behandla den som kategorisk. Du har också möjlighet att konvertera en kategorisk funktionstyp till en numerisk funktionstyp.

När datum- och tidsinformation identifieras i en kolumn används de som bas för nya genererade autogenererade funktioner. När detta händer behandlas den ursprungliga kolumnen (den överordnade funktionen) som om den har datumfunktionstypen. Du kan ändra den överordnade funktionen från en datumfunktionstyp till en kategorisk funktionstyp. Men om du gör det kan du inte längre använda dess autogenererade funktioner vid träning av experiment.

  1. Klicka på i kolumnen Funktionstyp .

  2. Välj ett värde i listan.

Du kan se alla kolumner som har en ändrad funktionstyp i fönstret Experimentkonfiguration under Databehandling.

Byta datauppsättning

Du kan ändra träningsdatauppsättningen innan du kör den första experimentversionen och när du har kört någon version.

Om du ändrar datauppsättningen innan du kör den första versionen kommer du att förlora alla konfigureringar som du har gjort innan du ändrade datauppsättningen.

  1. I fönstret Experimentkonfiguration under Träningsdata klickar du på Ändra datauppsättning.

  2. Välj en ny datauppsättning.

Mer information om att ändra och uppdatera datauppsättningen under modellförfiningen (när du har kört en experimentversion) finns i Ändra eller uppdatera datauppsättningen.

Konfigurera hyperparameteroptimering

Du kan optimera modellen med hjälp av hyperparameteroptimering. Observera att detta är ett avancerat alternativ som kan öka träningstiden avsevärt. Mer information finns i Optimering av hyperparameter.

Avsnittet för modelloptimering i experimentkonfigurationen

Avsnittet för modelloptimering i sidofönstret för AutoML-experimentkonfiguration.
  1. I fönstret Experimentkonfiguration expanderar du delavsnittet Modelloptimering.

  2. Markera kryssrutan Optimering av hyperparameter.

  3. Du kan också ange en tidsgräns för optimeringen. Standardtidsgränsen är en timme.

Vanliga insikter som hittas i träningsdata

Beroende på kvaliteten på din datauppsättning kan det finnas begränsningar för hur du kan använda vissa delar av data i din experimentkonfiguration. Kolumnen Insikter i schemaöversikten hjälper dig att identifiera särskilda egenskaper hos datafälten och hur de kommer att behandlas av algoritmer för maskininlärning.

I följande tabell visas möjliga insikter som kan visas i schemat:

Insikter om datauppsättningen i schemaöversikten
InsiktBetydelseKonsekvenser för konfigurationen
KonstantKolumnen har samma värde för alla rader.Kolumnen kan inte användas som mål eller inkluderad funktion.
One-hot-kodadFunktionen är kategorisk och kolumnen har färre än 14 unika värden.Ingen effekt på konfigurationen.
EffektkodadFunktionstypen är kategorisk och kolumnen har 14 eller fler unika värden.Ingen effekt på konfigurationen.
Hög kardinalitetKolumnen har för många unika värden och kan påverka modellens prestanda negativt om den används som funktion.Kolumnen kan inte användas som mål. Den kommer att uteslutas automatiskt som en funktion, men kan fortfarande inkluderas om det behövs.
Gles dataKolumnen har för många nollvärden.Kolumnen kan inte användas som mål eller inkluderad funktion.
Underrepresenterad klassKolumnen har en klass med färre än tio rader.Kolumnen kan inte användas som mål, men kan ingå som en funktion.
<antal> autogenererade funktionerKolumnen är den överordnade funktion som kan användas för att generera autogenererade funktioner.Om denna överordnade funktion tolkas som en datumfunktion tas den automatiskt bort från konfigurationen. Vi rekommenderar att du använder de autogenererade datumfunktionerna som kan genereras från den. Det är möjligt att åsidosätta den här inställningen och inkludera funktionen snarare än de autogenererade funktionerna.
autogenererad funktionKolumnen är en autogenererad funktion som kan, eller har, genererats från en överordnad datumfunktion. Den förekom inte i den ursprungliga datumuppsättningen.Du kan ta bort en eller flera av de här autogenererade funktionerna under experimentträningen. Om du växlar funktionstypen för den överordnade funktionen till kategorisk tas alla autogenererade funktioner bort.
Kunde inte bearbeta som ett datumKolumnen innehåller eventuellt datum- och tidsinformation, men kunde inte användas för att skapa autogenererade datumfunktioner.Funktionen tas bort från konfigurationen. Om autogenererade funktioner hade genererats tidigare från den här överordnade funktionen tas de bort från framtida experimentversioner. Du kan fortfarande använda funktionen i experimentet, men du måste ändra dess funktionstyp till kategorisk.
Eventuell fritextKolumnen kan eventuellt vara tillgänglig för användning som en fritextfunktion.Funktionstypen fritext tilldelas till kolumnen. Du måste köra en experimentversion för att bekräfta om funktionen kan bearbetas som fritext.
FritextKolumnen har bekräftats innehålla fritext. Den kan bearbetas som fritext.Ingen ytterligare konfigurering krävs för funktionen.
Kunde inte bearbeta som fritextYtterligare analys har visat att kolumnen inte kan bearbetas som fritext.Du måste välja bort funktionen för konfigurationen för nästa experimentversion. Om funktionen inte har hög kardinalitet kan du alternativt ändra funktionstypen till kategorisk.

Mer information

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!