Gå till huvudinnehåll Gå till ytterligare innehåll

Konfigurering av experiment

Konfigureringen av experiment består i att välja målet och de funktioner som modellen ska använda för att förutsäga målet. Du kan också konfigurera ett antal valfria inställningar.

För att du ska få hjälp att välja ett mål analyseras den historiska datauppsättningen och sammanfattande statistik visas för varje kolumn i datauppsättningen. Flera automatiska förbehandlingssteg tillämpas på datauppsättningen för att se till att endast lämpliga data tas med. Mer information om förbehandlingen av data finns i Automatisk förberedelse och omvandling av data.

När du har kört v1 kan du skapa nya experimentversioner vid behov om du behöver förfina modellträningen ytterligare. Mer information finns i Förfining av modeller.

Krav och behörigheter

Mer information om användarkraven för att arbeta med ML-experiment finns i Arbeta med experiment.

Gränssnittet

Följande delavsnitt beskriver hur du navigerar i experimentets gränssnitt för att konfigurera experimentet. Se Navigera i experimentets gränssnitt för mer information om gränssnittet.

Fliknavigering

När du skapar ett experiment öppnas fliken Data. Där kan du konfigurera målet och funktionerna för experimentet.

När du har kört minst en experimentversion blir ytterligare flikar tillgängliga. På de övriga flikarna kan du analysera de modeller som du precis tränat i versionen. Om du behöver konfigurera efterföljande versioner med olika funktionsurval kan du gå tillbaka till fliken Data.

Schemavy och Datavy

På fliken Data kan du alternera mellan följande vyer:

  • Rader Schemavy: Standardvyn. I denna vy representeras varje kolumn i datauppsättningen av en rad i schemat med information och statistik.

  • Tabell Datavy: Alternativ vy du kan använda för att komma åt mer information och exempeldata för varje kolumn.

Schemavy i ett ML-experiment

Schemavy i ett ML-experiment

Datavy i ett ML-experiment

Datavy i ett ML-experiment

Panel för experimentkonfiguration

Klicka på Kontroller Visa konfiguration för att öppna en panel där du kan anpassa experimentträningen ytterligare. Panelen kan öppnas oaktat vilken flik du visar. Panelen har ett antal ytterligare konfigurationsalternativ.

I panelen för experimentkonfiguration kan du:

  • Välj en mål och experimenttyp

  • Lägg till eller ta bort funktioner

  • Konfigurera en ny version av experimentet

  • Välj att ändra eller uppdatera utbildningsdatauppsättningen

  • Lägg till eller ta bort algoritmer

  • Ändra inställningar för modelloptimering

  • För tidsseriemodeller, ange prognosinställningarna

Panel för experimentkonfiguration

Utökad anpassningspanel i ett ML-experiment

Välja mål och experimenttyp

Du kan ändra målkolumnen och experimenttypen tills du startar den första träningen. Därefter är de låsta för redigering.

Målkolumnen innehåller de värden som du vill att modellen för maskininlärning ska förutsäga.

Experimenttypen bestäms av målet och vilken typ av data det innehåller. Experimenttypen definierar vilken typ av modell du vill träna. Följande alternativ kan vara tillgängliga:

  • Binär klassificering: Tränar modeller för att förutsäga ett mål som har två möjliga värden (till exempel ja eller nej). Data kan vara av vilken funktionstyp som helst.

  • Flerklassklassificering: Tränar modeller för att förutsäga ett mål med 3–10 möjliga värden (till exempel en lista med kategorier). Data kan vara av vilken funktionstyp som helst, men en kolumn med fler än 10 distinkta, icke-numeriska klasser (värden) kan inte väljas som mål.

  • Regression: Tränar modeller för att förutsäga ett mål med fler än 10 möjliga värden — specifikt ett mål med numerisk funktionstyp.

  • Tidsserier: Tränar modeller för att prognostisera målvärden för specifika framtida tidsperioder, med hjälp av historiska data. Målet måste ha fler än 10 distinkta värden och innehålla den numeriska funktionstypen. Mer information finns i Arbeta med tidsserieexperiment.

  1. I Rader Schemavy eller Tabell Datavy hovrar du över kolumnen.

  2. Klicka på Mål-ikonen som visas.

    Målkolumnen anges nu med Mål och de andra tillgängliga kolumnerna väljs automatiskt som funktioner.

    Välja mål i Schemavyn

    Datauppsättningskolumn med målsymbol.
  3. Klicka på Schema Visa konfiguration för att expandera panelen för experimentkonfiguration.

  4. Expandera Mål och experimenttyp.

  5. Experimenttyp visas. Om tidsserieprognoser är möjliga för din datamängd och ditt mål, finns det ett alternativ för att ändra experimenttypen från Regression till Tidsserie.

När målet och experimenttypen har valts kan du börja köra den första versionen av experimentet. Läs mer i Träningsexperiment. Du kan göra ytterligare konfigurationer nu – som beskrivs nedan – eller justera konfigurationen efter att du har granskat träningsresultaten.

Förklaringar av hur dina data tolkas och bearbetas visas när experimentträningen fortsätter. Mer information finns i Tolka datauppsättningsinsikter.

Välja funktionskolumner

När målet är fastställt kan du välja vilka av de andra tillgängliga kolumnerna som ska ingå i modellens träning. Uteslut alla funktioner som du inte vill ska ingå i modellen. Observera att kolumnen kommer att finnas kvar i datauppsättningen men inte användas av träningsalgoritmen.

Högst upp i experimentets konfigurationspanel kan du se antal celler i datauppsättningen. Om antalet överskrider gränsen för datauppsättningen kan du utesluta funktioner för att komma under gränsen.

Du kan välja funktionskolumnerna på olika sätt:

I Schemavy och Datavy

I huvudvyerna kan du:

  • Avmarkera Inkludera alla tillgängliga funktioner och välj sedan bara de funktioner som du vill inkludera.

  • Avmarkera manuellt kryssrutorna för de funktioner som du inte vill inkludera.

  • Gör en sökning och uteslut eller inkludera alla funktioner i det filtrerade sökresultatet.

I panelen för experimentkonfiguration

Om du expanderar experimentets konfigurationspanel kan du:

  • Avmarkera manuellt kryssrutorna för de funktioner som du inte vill inkludera.

  • När du har kört den första versionen av experimentet kan du definiera antal toppfunktioner att inkludera.

Delavsnittet Funktioner i experimentets konfigurationspanel

Delavsnittet Funktioner i panelen för utbildningskonfiguration Qlik Predict

När du väljer funktioner tilldelas de automatiskt en funktionstyp. Möjliga funktionstyper är:

  • Kategorisk

  • Numerisk

  • Datum

  • Fritext

Funktionstypen tilldelas baserat på de data som finns i funktionskolumnen. Om en funktion uppfyller vissa kriterier kan den mellanlagras och bli utgångspunkt för autogenererade funktioner. Vid behov kan du ändra om funktionen används för automatisk funktionsgenerering. Fullständig information om automatisk funktionsgenerering finns i Automatisk egenskapsgenerering.

Vissa kolumner i din datauppsättning kanske inte kan väljas som funktioner för ditt experiment, eller så kan en särskild behandling tillämpas på dem. Förklaringar av hur dina data tolkas och bearbetas visas när du navigerar experimentträningen. Mer information finns i Tolka datauppsättningsinsikter.

Välja algoritmer

Alla tillgängliga algoritmer inkluderas som standard och du kan utesluta algoritmer som du inte vill använda. Normalt sett skulle du göra detta som en del av modellförfiningen när du har sett de första träningsresultaten. Läs mer i Förfining av modeller.

Delavsnittet Algoritmerr i experimentets konfigurationspanel

Delavsnittet Algoritmer i panelen för utbildningskonfiguration Qlik Predict.

Ändra funktionstyper

När en datauppsättning läses in behandlas kolumnerna som kategoriska, numeriska, datum eller fritext, beroende på datatypen och andra egenskaper. I vissa fall kan du vilja ändra den här inställningen.

Om t.ex. veckodagarna representeras av siffrorna 1–7 representerar varje siffra ett kategoriskt värde. Som standard behandlas den som ett kontinuerligt rangordnat numeriskt värde, så du måste manuellt ändra konfigurationen för att behandla den som kategorisk.

När datum- och tidsinformation identifieras i en kolumn används de som bas för nya genererade autogenererade funktioner. När detta händer behandlas den ursprungliga kolumnen (den överordnade funktionen) som om den har datumfunktionstypen.

Du kan ändra den överordnade funktionen från en datumfunktion till en kategorisk eller numerisk funktion. Detta är till exempel användbart när en funktion identifieras som ett datum, men du vill att den ska behandlas som en sträng eller ett nummer. När du gör det kan du inte längre använda dess autogenererade funktioner vid experimentträning.

  1. Leta upp funktionen i Rader Schemavyn.

  2. Klicka på Pil ned i kolumnen Funktionstyp för den här funktionen.

  3. Välj ett värde i listan.

Alternativt kan du ändra funktionstyper från Tabell Datavy. Sök reda på funktionen och klicka sedan på Pil ned bredvid den aktuella funktionstypen. Välj ett värde i listan.

Du kan se alla kolumner som har en ändrad funktionstyp i experimentets konfigurationspanel under Databehandling.

Prognostisering av tidsserier

Om du tränar ett tidsserieexperiment, tillämpas vissa funktionstyptransformationer automatiskt beroende på din konfiguration. Om du till exempel väljer några grupper att använda för multivariat prognostisering, ändras funktionstyperna för dessa grupper automatiskt till kategoriska.

Påverkan på prognoser

När du ändrar funktionstypen för en funktion manuellt och sedan distribuerar en resulterande modell, kommer åsidosättandet av funktionstypen att tillämpas på funktionen i den tillämpade datauppsättningen som används i prognoser som görs med den modellen.

Byta datauppsättning

Du kan ändra träningsdatauppsättningen innan du kör den första experimentversionen och när du har kört någon version.

Om du ändrar datauppsättningen innan du kör den första versionen kommer du att förlora alla konfigureringar som du har gjort innan du ändrade datauppsättningen.

  1. I experimentets konfigurationspanel under Träningsdata klickar du på Ändra datauppsättning.

  2. Välj en ny datauppsättning.

Mer information om att ändra och uppdatera datauppsättningen under modellförfiningen (när du har kört en experimentversion) finns i Ändra och uppdatera datauppsättningen.

Konfigurera modelloptimering

Om din experimenttyp är binär klassificering, flerkategoriklassificering, eller regression, kan du justera följande inställningar för att optimera dina modeller:

  • Slå på eller av intelligent modelloptimering

  • Slå på eller av optimering av hyperparameter

  • Aktivera eller inaktivera tidskänslig utbildning

Dessa alternativ kan slås på eller av för varje version av experimentet du kör.

Konfigurera intelligent optimering

Som standard använder experiment intelligent modelloptimering. Med intelligent modelloptimering hanterar Qlik Predict modellförfiningsprocessen åt dig genom att upprepa valet av funktioner och tillämpa avancerade omvandlingar på dina data.

Se Intelligent modelloptimering för mer information om intelligent optimering.

Du kan stänga av den här inställningen och manuellt förfina modellerna du tränar. Om du exempelvis vill starta din modellträning med intelligent modelloptimering och sedan växla till manuell förfining för v2 och sedan ytterligare justera konfigurationen.

  1. Klicka på Kontroller Visa konfiguration.

  2. Om du redan kört minst en version av experimentet klickar du på Ny version.

  3. Expandera Modelloptimering i panelen.

  4. Växla från Intelligent till Manuell.

  5. Använd skjutreglaget för att ställa in maximal varaktighet för träningen.

Konfigurera modelloptimering

Aktivera Intelligent modelloptimering under Modelloptimering i panelen för utbildningskonfiguration Qlik Predict

Konfigurera hyperparameteroptimering

Du kan optimera modellen med hjälp av hyperparameteroptimering. Observera att detta är ett avancerat alternativ som kan öka träningstiden avsevärt. Hyperparameteroptimering är tillgängligt om du stänger av intelligent optimering.

Mer information finns i Optimering av hyperparameter.

  1. Klicka på Kontroller Visa konfiguration.

  2. Om du redan kört minst en version av experimentet klickar du på Ny version.

  3. Expandera Modelloptimering i panelen.

  4. Växla från Intelligent till Manuell.

  5. Markera kryssrutan Optimering av hyperparameter.

  6. Du kan också ange en tidsgräns för optimeringen. Standardtidsgränsen är en timme.

Konfigurera hyperparameteroptimering

Panelen för utbildningskonfiguration Qlik Predict med aktiverad hyperparameteroptimering

Konfiguration av tidskänslig utbildning

Om du vill att dina modeller ska tränas med hänsyn till en tidsseriedimension, aktivera tidskänslig träning för experimentversionen. Om du vill använda det här alternativet måste du ha en kolumn i datauppsättningen som innehåller relevant tidsserieinformation.

När tidskänslig träning är aktiverad använder Qlik Predict specialiserade processer för korsvalidering och tillräkning av nollor för att träna modellerna.

Se Skapa tidskänsliga modeller och Tidsbaserad korsvalidering för mer information.

  1. Klicka på Kontroller Visa konfiguration.

  2. Om du redan kört minst en version av experimentet klickar du på Ny version.

  3. Expandera Modelloptimering i panelen.

  4. Under Delning av tidsbaserad testträning väljer du Datumindex för att sortera data.

Konfigurera tidskänslig träning genom att välja en kolumn i träningsdata att använda som index

Panelen för utbildningskonfiguration Qlik Predict Panel med datumkolumn vald för att aktivera tidskänslig träning

Visar insikter om träningsdata

På fliken Data i experimentet kan du visa insikter i hantering av träningsdata. Informationen finns i kolumnen Insikter i Tabellrader Schemavy. Informationen visas beroende på om du har du har kört en version med aktuella träningsdata eller inte. Ändringar i kolumnen Insikter kan hjälpa till att identifiera varför funktioner kanske inte är tillgängliga att använda eller varför de automatiskt släppts.

Se Tolka datauppsättningsinsikter för mer information om vad varje insikt innebär.

RELATERAD INFORMATION:

Mer information

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!