Konfigurering av experiment

Konfigureringen av experiment består i att välja målet och de funktioner som modellen ska använda för att förutsäga målet. Du kan också konfigurera ett antal valfria inställningar.

För att du ska få hjälp att välja ett mål analyseras den historiska datauppsättningen och sammanfattande statistik visas för varje kolumn i datauppsättningen. Flera automatiska förbehandlingssteg tillämpas på datauppsättningen för att se till att endast lämpliga data tas med. Mer information om förbehandlingen av data finns i Automatisk förberedelse och omvandling av data.

När du har kört v1 kan du skapa nya experimentversioner vid behov om du behöver förfina modellträningen ytterligare. Se Förfining av modeller för mer information.

Krav och behörigheter

Mer information om användarkraven för att arbeta med ML-experiment finns i Arbeta med experiment.

Gränssnittet

Följande delavsnitt beskriver hur du navigerar i experimentets gränssnitt för att konfigurera experimentet. Se Navigera i experimentets gränssnitt för mer information om gränssnittet.

Fliknavigering

När du skapar ett experiment öppnas fliken Data. Där kan du konfigurera målet och funktionerna för experimentet.

När du har kört minst en experimentversion blir ytterligare flikar tillgängliga. På de övriga flikarna kan du analysera de modeller som du precis tränat i versionen. Om du behöver konfigurera efterföljande versioner med olika funktionsurval kan du gå tillbaka till fliken Data.

Schemavy och Datavy

På fliken Data kan du alternera mellan följande vyer:

Schemavy: Standardvyn. I denna vy representeras varje kolumn i datauppsättningen av en rad i schemat med information och statistik.
Datavy: Alternativ vy du kan använda för att komma åt mer information och exempeldata för varje kolumn.

Panel för experimentkonfiguration

Klicka på Kontroller Visa konfiguration för att öppna en panel där du kan anpassa experimentträningen ytterligare. Panelen kan öppnas oaktat vilken flik du visar. Panelen har ett antal ytterligare konfigurationsalternativ.

I panelen för experimentkonfiguration kan du:

Välj ett mål innan du tränar den första versionen
Lägg till eller ta bort funktioner
Konfigurera en ny version av experimentet
Välj att ändra eller uppdatera utbildningsdatauppsättningen
Lägg till eller ta bort algoritmer
Ändra inställningar för modelloptimering

Utökad anpassningspanel i ett ML-experiment — Panel för experimentkonfiguration

Välja ett mål

Målkolumnen innehåller de värden som du vill att modellen för maskininlärning ska förutsäga. Du kan ändra målkolumnen tills du startar första träningen. Därefter är den låst för redigering.

Gör följande:

I Schemavy eller Datavy hovrar du över kolumnen.
Klicka på -ikonen som visas.

Målkolumnen anges nu med och de andra tillgängliga kolumnerna väljs automatiskt som funktioner.

Datauppsättningskolumn med målsymbol. — Välja mål i Schemavyn

Målet kan även väljas i träningens konfigurationspanel.

När målet har valts kan du börja köra den första versionen av experimentet. Läs mer i Träningsexperiment. Du kan göra ytterligare konfigurationer nu – som beskrivs nedan – eller justera konfigurationen efter att du har granskat träningsresultaten.

Förklaringar av hur dina data tolkas och bearbetas visas när experimentträningen fortsätter. Se Tolka datauppsättningsinsikter för mer information.

Bestämma den typ av modell som skapas

Kolumnen du väljer som mål bestämmer vilken typ av modell ditt experiment skapar. Detta spelar i sin tur en roll för att avgöra vilka algoritmer som används för att träna modellen. Vissa kolumner i din datauppsättning kanske inte kan väljas som mål för ditt experiment, eller så kan en särskild behandling tillämpas på dem.

Modelltyperna är:

Binär klassificeringsmodell
Multiklassklassificeringsmodell
Regressionsmodell

Tabellen nedan sammanfattar de faktorer i ditt mål som avgör vilken typ av modell som används.

Egenskaper för målkolumnen som avgör modelltypen
Modelltyp	Antal distinkta värden i kolumnen	Funktionstyp som krävs	Mer information
Binär klassificering	2	Valfri	-
Multiklassklassificering	3-10	Valfri	En kolumn med fler än 10 distinkta, icke-numeriska klasser kan inte väljas som mål.
Regression	Fler än 10	Numerisk	-

Vill du veta vilken typ av modeller experimentet tränar klickar du på Schema Visa konfiguration och expanderar Algoritmer. Modelltypen syns i titeln för delavsnittet.

Välja funktionskolumner

När målet är fastställt kan du välja vilka av de andra tillgängliga kolumnerna som ska ingå i modellens träning. Uteslut alla funktioner som du inte vill ska ingå i modellen. Observera att kolumnen kommer att finnas kvar i datauppsättningen men inte användas av träningsalgoritmen.

Högst upp i experimentets konfigurationspanel kan du se antal celler i datauppsättningen. Om antalet överskrider gränsen för datauppsättningen kan du utesluta funktioner för att komma under gränsen.

Du kan välja funktionskolumnerna på olika sätt:

I Schemavy och Datavy

I huvudvyerna kan du:

Avmarkera Inkludera alla tillgängliga funktioner och välj sedan bara de funktioner som du vill inkludera.
Avmarkera manuellt kryssrutorna för de funktioner som du inte vill inkludera.
Gör en sökning och uteslut eller inkludera alla funktioner i det filtrerade sökresultatet.

I träningens anpassningspanel

Om du expanderar experimentets konfigurationspanel kan du:

Avmarkera manuellt kryssrutorna för de funktioner som du inte vill inkludera.
När du har kört den första versionen av experimentet kan du definiera antal toppfunktioner att inkludera.

Avsnittet Funktioner i panelen för anpassning av träning i AutoML — Delavsnittet Funktioner i experimentets konfigurationspanel

När du väljer funktioner tilldelas de automatiskt en funktionstyp. Möjliga funktionstyper är:

Kategorisk
Numerisk
Datum
Fritext

Funktionstypen tilldelas baserat på de data som finns i funktionskolumnen. Om en funktion uppfyller vissa kriterier kan den mellanlagras och bli utgångspunkt för autogenererade funktioner. Vid behov kan du ändra om funktionen används för automatisk funktionsgenerering. Fullständig information om automatisk funktionsgenerering finns i Automatisk funktionsgenerering.

Vissa kolumner i din datauppsättning kanske inte kan väljas som funktioner för ditt experiment, eller så kan en särskild behandling tillämpas på dem. Förklaringar av hur dina data tolkas och bearbetas visas när du navigerar experimentträningen. Se Tolka datauppsättningsinsikter för mer information.

Välja algoritmer

Alla tillgängliga algoritmer inkluderas som standard och du kan utesluta algoritmer som du inte vill använda. Normalt sett skulle du göra detta som en del av modellförfiningen när du har sett de första träningsresultaten. Läs mer i Förfining av modeller.

Avsnittet Algoritmer i panelen för anpassning av träning i AutoML — Delavsnittet Algoritmerr i experimentets konfigurationspanel

Ändra funktionstyper

När en datauppsättning läses in behandlas kolumnerna som kategoriska, numeriska, datum eller fritext, beroende på datatypen och andra egenskaper. I vissa fall kan du vilja ändra den här inställningen.

Om t.ex. veckodagarna representeras av siffrorna 1–7 representerar varje siffra ett kategoriskt värde. Som standard behandlas den som ett kontinuerligt rangordnat numeriskt värde, så du måste manuellt ändra konfigurationen för att behandla den som kategorisk.

När datum- och tidsinformation identifieras i en kolumn används de som bas för nya genererade autogenererade funktioner. När detta händer behandlas den ursprungliga kolumnen (den överordnade funktionen) som om den har datumfunktionstypen.

Du kan ändra den överordnade funktionen från en datumfunktion till en kategorisk eller numerisk funktion. Detta är till exempel användbart när en funktion identifieras som ett datum, men du vill att den ska behandlas som en sträng eller ett nummer. När du gör det kan du inte längre använda dess autogenererade funktioner vid experimentträning.

Gör följande:

Leta upp funktionen i Schemavyn.
Klicka på i kolumnen Funktionstyp för den här funktionen.
Välj ett värde i listan.

Alternativt kan du ändra funktionstyper från Tabell Datavy. Sök reda på funktionen och klicka sedan på Pil ned bredvid den aktuella funktionstypen. Välj ett värde i listan.

Du kan se alla kolumner som har en ändrad funktionstyp i experimentets konfigurationspanel under Databehandling.

Påverkan på förutsägelser

När du ändrar funktionstypen för en funktion manuellt och sedan distribuerar en resulterande modell, kommer åsidosättandet av funktionstypen att tillämpas på funktionen i den tillämpade datauppsättningen som används i prognoser som görs med den modellen.

Byta datauppsättning

Du kan ändra träningsdatauppsättningen innan du kör den första experimentversionen och när du har kört någon version.

Om du ändrar datauppsättningen innan du kör den första versionen kommer du att förlora alla konfigureringar som du har gjort innan du ändrade datauppsättningen.

Gör följande:

I experimentets konfigurationspanel under Träningsdata klickar du på Ändra datauppsättning.
Välj en ny datauppsättning.

Mer information om att ändra och uppdatera datauppsättningen under modellförfiningen (när du har kört en experimentversion) finns i Ändra eller uppdatera datauppsättningen.

Konfigurera modelloptimering

Följande inställningar kan anpassas för att optimera dina modeller:

Slå på eller av intelligent modelloptimering
Slå på eller av optimering av hyperparameter
Aktivera eller inaktivera tidskänslig utbildning

Dessa alternativ kan slås på eller av för varje version av experimentet du kör.

Konfigurera intelligent optimering

Som standard använder experiment intelligent modelloptimering. Med intelligent modelloptimering hanterar AutoML modellförfiningsprocessen åt dig genom att upprepa valet av funktioner och tillämpa avancerade omvandlingar på dina data.

Se Intelligent modelloptimering för mer information om intelligent optimering.

Du kan stänga av den här inställningen och manuellt förfina modellerna du tränar. Om du exempelvis vill starta din modellträning med intelligent modelloptimering och sedan växla till manuell förfining för v2 och sedan ytterligare justera konfigurationen.

Gör följande:

Klicka på Visa konfiguration.
Om du redan kört minst en version av experimentet klickar du på Ny version.
Expandera Modelloptimering i panelen.
Växla från Intelligent till Manuell.
Använd skjutreglaget för att ställa in maximal varaktighet för träningen.

Aktivera Intelligent modelloptimering under Modelloptimering i panelen för anpassning av AutoML-utbildning — Konfigurera modelloptimering

Konfigurera hyperparameteroptimering

Du kan optimera modellen med hjälp av hyperparameteroptimering. Observera att detta är ett avancerat alternativ som kan öka träningstiden avsevärt. Hyperparameteroptimering är tillgängligt om du stänger av intelligent optimering.

Se Optimering av hyperparameter för mer information.

Gör följande:

Klicka på Visa konfiguration.
Om du redan kört minst en version av experimentet klickar du på Ny version.
Expandera Modelloptimering i panelen.
Växla från Intelligent till Manuell.
Markera kryssrutan Optimering av hyperparameter.
Du kan också ange en tidsgräns för optimeringen. Standardtidsgränsen är en timme.

AutoML panel för träningsanpassning med hyperparameteroptimering aktiverad — Konfigurera hyperparameteroptimering

Konfiguration av tidskänslig utbildning

Om du vill att dina modeller ska tränas med hänsyn till en tidsseriedimension, aktivera tidskänslig träning för experimentversionen. Om du vill använda det här alternativet måste du ha en kolumn i datauppsättningen som innehåller relevant tidsserieinformation.

När tidskänslig träning är aktiverad använder AutoML specialiserade processer för korsvalidering och tillräkning av nollor för att träna modellerna.

Se Skapa tidskänsliga modeller och Tidsbaserad korsvalidering för mer information.

Gör följande:

Klicka på Visa konfiguration.
Om du redan kört minst en version av experimentet klickar du på Ny version.
Expandera Modelloptimering i panelen.
Under Delning av tidsbaserad testträning väljer du Datumindex för att sortera data.

Panel för anpassning av AutoML-träning med datumkolumn vald för att aktivera tidskänslig träning — Konfigurera tidskänslig träning genom att välja en kolumn i träningsdata att använda som index

Visar insikter om träningsdata

På fliken Data i experimentet kan du visa insikter i hantering av träningsdata. Informationen finns i kolumnen Insikter i Tabellrader Schemavy. Informationen visas beroende på om du har du har kört en version med aktuella träningsdata eller inte. Ändringar i kolumnen Insikter kan hjälpa till att identifiera varför funktioner kanske inte är tillgängliga att använda eller varför de automatiskt släppts.

Se Tolka datauppsättningsinsikter för mer information om vad varje insikt innebär.

RELATERAD INFORMATION:

Introduktion till Qlik AutoML

Mer information

Introduktion till Qlik AutoML

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!

Lämna din feedback här