Skapa och konfigurera experimentet
Det första steget är att skapa och konfigurera experimentet. Du kommer att använda träningsdatauppsättningen som du laddade upp tidigare för att träna modellen tills den är klar att distribueras för att göra prognoser.
Skapa ett nytt experiment
Gör följande:
-
Gå till sidan Skapa i aktivitetscentret för Analyser och välj ML-experiment.
-
Ange ett namn för experimentet, till exempel "Handledning för kundförlust".
-
Du kan även lägga till en beskrivning och taggar.
-
Välj en plats för ditt experiment. Det kan vara ditt personliga utrymme eller ett gemensamt utrymme.
-
Klicka på Skapa.
-
Välj träningsdatauppsättningsfil. Det blir någon av följande beroende på om du arbetar med CSV eller QVD:
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
Granskning av data
Nu är du redo att börja konfigurera ditt experiment, men innan du börjar ska vi ta en titt på datauppsättningen.
Vi startar på fliken Data. Standardvy är Schemavy. Här kan vi se en tabell där varje rad representerar en kolumn i din datauppsättning. Statistik och insikter har genererats genom automatisk dataförberedelse. Du kan behöva bläddra till schemats högra sida för att se insikterna.
Vi kan se att AccountID har uteslutits på grund av hög kardinalitet. Det betyder att kolumnen innehåller för många unika värden. Funktionen Country har uteslutits av motsatt anledning: värdet är detsamma för alla rader. Dessa två funktioner skulle inte tillföra något värde till modellerna för maskininlärning.
Vi kan också se att impact encoding har använts för den kategoriska egenskapen Territory. Håll muspekaren över ikonerna varning och information för att läsa mer.
Klicka på Datavy. I den här vyn kan vi se mer information om varje kolumn, inklusive exempeldata.
Välja ett mål
Vi vill att vår maskininlärningsmodell ska förutsäga kundförlust, så vi väljer Churned, den sista kolumnen i datauppsättningen, som vårt mål.
Gör följande:
-
Växla tillbaka till Schemavy.
-
Håll muspekaren över Churned och klicka på målikonen som visas.
På konfigurationspanelen för experiment kan vi nu se att Churned har valts. Vi kan också se vilka funktioner som väljs och utesluts automatiskt. Eftersom Churned är målet kommer den inte att användas som funktion. Vi kan också se att det här experimentet kommer att behandlas som ett binärt klassificeringsproblem.
Välja funktioner
För denna första körning av vårt experiment kommer vi att inkludera alla tillgängliga funktioner och algoritmer som har valts som standard. Men om du redan vet att vissa funktioner inte har någon påverkan på målet – baserat på din kunskap om verksamheten – kan du avmarkera dem i det här läget för att utesluta dem från träningen.
Inställningar för att ändra optimering
Intelligent modelloptimering är som standard påslagen. Med intelligent modelloptimering erbjuder AutoML automatisk förfining av modellträning. Målet med denna introduktionskurs är dock att visa hur du manuellt identifierar vissa problem med dina funktionsdata och träningsresultat.
Se Exempel – Träningsmodeller med automatiserad maskininlärning för ett exempel på hur du tränar modeller med intelligent modelloptimering.
Vi stänger av intelligent modelloptimering för att visa manuell förfining.
Gör följande:
-
I konfigurationspanelen för experiment expanderar du delavsnittet Modelloptimering.
-
Växla från Intelligent till Manuell.
Träning av experimentet
Konfigurationen är klar och vi är redo att börja träningen.
Gör följande:
-
Klicka på Kör experiment i det nedre högra hörnet av experimentfönstret.
När experimentet är färdigt kan vi gå vidare till nästa steg, som är att granska de resulterande modellmätetalen.