Konfigurera experiment | Qlik CloudHjälp
Gå till huvudinnehåll Gå till ytterligare innehåll

Konfigurera experiment

Konfigurationen av experiment består av att välja målet och de funktioner som modellen ska använda för att förutsäga målet. Du kan även konfigurera ett antal valfria inställningar.

För att hjälpa dig att välja ett mål analyseras den historiska datamängden och sammanfattande statistik visas för varje kolumn i datamängden. Flera automatiska förbearbetningssteg tillämpas på datamängden för att säkerställa att endast lämpliga data inkluderas. Mer information om dataförbearbetning finns i Automatisk förberedelse och omvandling av data.

Efter att du har kört v1 kan du skapa nya experimentversioner om det behövs för att ytterligare förfina modellträningen. Mer information finns i Förfina modeller.

Krav och behörigheter

Mer information om användarkrav för att arbeta med ML-experiment finns i Arbeta med experiment.

Gränssnittet

Följande delavsnitt beskriver hur du navigerar i experimentgränssnittet för att konfigurera ditt experiment. Mer information om gränssnittet finns i Navigera i experimentgränssnittet.

Fliknavigering

När du skapar ett experiment öppnas fliken Konfiguration. Det är här du kan konfigurera målet och funktionerna för experimentet.

Efter att du har kört minst en experimentversion ändras fliken Konfiguration till Träningsdata. Andra flikar blir också tillgängliga. Dessa andra flikar låter dig analysera de modeller som du precis har tränat i versionen. Om du behöver konfigurera efterföljande versioner med andra funktionsval kan du återgå till fliken Träningsdata.

Schemavy och Datavy

På fliken Konfiguration/Träningsdata kan du växla mellan följande vyer:

  • Rader Schemavy: Standardvyn. I den här vyn representeras varje kolumn i din datamängd av en rad i schemat med information och statistik.

  • Tabell Datavy: En alternativ vy som du kan använda för att få tillgång till mer information och exempeldata för varje kolumn.

Schemavy i ett ML-experiment

Schemavy i ett ML-experiment

Datavy i ett ML-experiment

Datavy i ett ML-experiment

Panel för experimentkonfiguration

I panelen för experimentkonfiguration kan du anpassa experimentträningen ytterligare. Den här panelen är öppen som standard i nya experiment.

Efter att du har kört en version klickar du på Kontroller Visa konfiguration för att öppna panelen och konfigurera nästa version.

Med panelen för experimentkonfiguration kan du:

  • Välj ett mål och en experimenttyp

  • Ange ett versionsnamn

  • Lägg till eller ta bort funktioner

  • Konfigurera en ny version av experimentet

  • Visa vilken typ av modell du tränar

  • Välj att ändra eller uppdatera träningsdatauppsättningen

  • Lägg till eller ta bort algoritmer

  • Ändra inställningar för modelloptimering

  • För tidsseriemodeller anger du prognosinställningarna

  • Konfigurera biasdetektering

Konfigurationspanel för experiment

Konfigurationspanel för experiment med valt mål, experimenttyp och standardfunktionsval

Välja mål och experimenttyp

Du kan ändra målkolumnen och experimenttypen tills du startar den första träningen. Efter det är de låsta för redigering.

Målkolumnen innehåller de värden som du vill att maskininlärningsmodellen ska förutsäga.

Experimenttypen bestäms av målet och den typ av data det innehåller. Experimenttypen definierar vilken typ av modell du vill träna. Följande alternativ kan vara tillgängliga:

  • Binär klassificering: Tränar modeller för att förutsäga ett mål som har två möjliga värden (till exempel ja eller nej). Data kan vara av valfri funktionstyp.

  • Flerklassificering: Tränar modeller för att förutsäga ett mål med 3–10 möjliga värden (till exempel en lista med kategorier). Data kan vara av valfri funktionstyp, men en kolumn med fler än 10 distinkta, icke-numeriska klasser (värden) kan inte väljas som mål.

  • Regression: Tränar modeller för att förutsäga ett mål med fler än 10 möjliga värden – specifikt ett mål med numerisk funktionstyp.

  • Tidsserie: Tränar modeller för att prognostisera målvärden för specifika framtida tidsperioder genom att utnyttja historiska data. Målet måste ha fler än 10 distinkta värden och innehålla numeriska data. Mer information finns i Arbeta med tidsserieexperiment.

  1. I Rader Schemavy eller Tabell Datavy håller du muspekaren över kolumnen.

  2. Klicka på ikonen Mål som visas.

    Målkolumnen indikeras nu av Mål och de andra tillgängliga kolumnerna väljs automatiskt som funktioner.

    Välja målet i Schemavy

    Datamängdskolumn med målsymbol.
  3. I panelen för experimentkonfiguration, under Experimentinställningar, kan du ändra målet före träningen om det behövs.

  4. Anteckning om informationExperimentinställningar kan innehålla en väljare för Experimenttyp. Om till exempel tidsserieprognoser är möjliga för din datamängd och ditt mål finns det ett alternativ för att ändra experimenttypen från Regression till Tidsserie.

När målet och experimenttypen har valts kan du börja köra den första versionen av experimentet. Läs mer i Träningsexperiment. Du kan göra ytterligare konfigurationer i det här skedet – beskrivs nedan – eller justera konfigurationen efter att du har granskat träningsresultaten.

Förklaringar av hur dina data tolkas och bearbetas visas under tiden som experimentträningen pågår. Mer information finns i Tolka insikter om datamängder.

Välja funktionskolumner

När målet har angetts kan du välja vilka av de andra tillgängliga kolumnerna som ska inkluderas i träningen av modellen. Uteslut alla funktioner som du inte vill ska ingå i modellen. Observera att kolumnen kommer att finnas kvar i datamängden men inte kommer att användas av träningsalgoritmen.

Längst upp i panelen för experimentkonfiguration kan du se antalet celler i din datamängd. Om antalet överskrider gränsen för din datamängd kan du utesluta funktioner för att komma under gränsen.

Du kan välja funktionskolumnerna på olika sätt:

I Schemavy och Datavy

I huvudvyerna kan du:

  • Avmarkera Inkludera alla tillgängliga funktioner och välj sedan endast de som du vill inkludera.

  • Avmarkera manuellt kryssrutorna för de funktioner som du inte vill inkludera.

  • Göra en sökning och utesluta eller inkludera alla funktioner i ditt filtrerade sökresultat.

I panelen för experimentkonfiguration

I panelen för experimentkonfiguration kan du:

  • Avmarkera manuellt kryssrutorna för de funktioner som du inte vill inkludera.

  • Efter att du har kört den första versionen av experimentet kan du definiera Antal främsta funktioner att inkludera.

Delavsnittet Funktioner i panelen för experimentkonfiguration

Delavsnittet Funktioner i panelen för experimentkonfiguration för Qlik Predict

När du väljer funktioner tilldelas de automatiskt en funktionstyp. De möjliga funktionstyperna är:

  • Kategorisk

  • Numerisk

  • Datum

  • Fritext

Funktionstypen tilldelas baserat på de data som finns i funktionskolumnen. Om en funktion uppfyller vissa kriterier kan den väljas för att ligga till grund för automatiskt genererade funktioner. Om du vill kan du ändra om funktionen ska användas för automatisk funktionsteknik. Fullständig information om automatisk funktionsteknik finns i Automatisk egenskapsgenerering.

Vissa kolumner i din datamängd kanske inte kan väljas som funktioner för ditt experiment, eller så kan de ha specifik bearbetning tillämpad på sig. Förklaringar av hur dina data tolkas och bearbetas visas när du navigerar i experimentträningen. Mer information finns i Tolka insikter om datamängder.

Konfigurera bias-detektering

Du kan aktivera bias-detektering för funktioner som innehåller känsliga data. Bias-detektering utförs när du kör experimentet. Du kan också klicka på Få rekommendationer för att använda generativ AI för att skanna dina träningsdata efter eventuellt känsliga funktioner innan du kör bias-detektering.

Bias-detektering avgör om funktionen ökar modellens sannolikhet att främja orättvisa resultat i sina förutsägelser, eller om källdata i sig är partiska.

  1. I ett ML-experiment, expandera Bias i konfigurationspanelen för träning.

  2. Innan du väljer funktioner för identifiering av snedvridning, klicka eventuellt på Hämta rekommendationer för att använda generativ AI för att föreslå funktioner som kan innehålla snedvridna data. Se Använda generativ AI för att rekommendera funktioner för snedvridningsdetektering.

  3. Välj eller avmarkera funktioner som du vill köra identifiering av snedvridning på.

Alternativt, aktivera biasdetektering för de önskade funktionerna i Rader Schema view.

Mer information om bias-detektering finns i Identifiera snedvridning i maskininlärningsmodeller.

Välja algoritmer

Alla tillgängliga algoritmer inkluderas som standard och du kan utesluta de algoritmer som du inte vill använda. Normalt gör du detta som en del av modellförfiningen när du har sett de första träningsresultaten. Läs mer i Förfina modeller.

Delavsnittet Algoritmer i panelen för experimentkonfiguration

Delavsnittet Algoritmer i panelen för experimentkonfiguration för Qlik Predict.

Ändra funktionstyper

När en datamängd läses in behandlas kolumnerna som kategoriska, numeriska, datum eller fritext baserat på datatyp och andra egenskaper. I vissa fall kanske du vill ändra den här inställningen.

Om till exempel veckodagarna representeras av siffrorna 1–7 representerar varje siffra ett kategoriskt värde. Som standard behandlas det som ett kontinuerligt rangordnat numeriskt värde, så du skulle behöva ändra konfigurationen manuellt för att behandla det som kategoriskt.

När en kolumn identifieras som att den innehåller datum- och tidsinformation används den som bas för nya genererade automatiska funktioner. När detta händer behandlas den ursprungliga kolumnen (den överordnade funktionen) som att den har funktionstypen datum.

Du kan ändra den överordnade funktionen från en datumfunktion till en kategorisk eller numerisk funktion. Detta är till exempel användbart när en funktion identifieras som ett datum, men du behöver att den behandlas som en sträng eller ett tal. När du gör detta kan du inte längre använda dess automatiskt genererade funktioner i experimentträningen.

  1. I Rader Schemavy letar du reda på funktionen.

  2. I kolumnen Funktionstyp för den här funktionen klickar du på Pil ned.

  3. Välj ett värde i listan.

Du kan alternativt ändra funktionstyper från Tabell Datavy. Leta reda på funktionen och klicka sedan på Pil ned bredvid den aktuella funktionstypen. Välj ett värde i listan.

Tidsserieprognoser

Om du tränar ett tidsserieexperiment tillämpas vissa funktionstypstransformeringar automatiskt beroende på din konfiguration. Om du till exempel väljer några grupper som ska användas för multivariat prognostisering ändras funktionstyperna för dessa grupper automatiskt till kategoriska.

Inverkan på förutsägelser

När du ändrar funktionstypen för en funktion manuellt och sedan distribuerar en resulterande modell, kommer åsidosättandet av funktionstypen att tillämpas på funktionen i den tillämpade datauppsättningen som används i prognoser som görs med den modellen.

Ändra datamängd

Du kan ändra träningsdatamängden innan du kör den första experimentversionen, samt efter att du har kört valfri version.

Om du ändrar datamängden innan du kör den första versionen förlorar du alla konfigurationer som du har gjort innan du ändrade datamängden.

  1. I panelen för experimentkonfiguration under TräningsdataGranska datamängd klickar du på Ändra datamängd.

  2. Välj en ny datamängd.

Mer information om att ändra och uppdatera datamängden under modellförfining (efter att ha kört en experimentversion) finns i Ändra och uppdatera datamängden.

Konfigurera modelloptimering

Om din experimenttyp är binär klassificering, flerklassificering eller regression kan du justera följande inställningar för att optimera dina modeller:

  • Slå på eller av intelligent modelloptimering

  • Slå på eller av hyperparameteroptimering

  • Slå på eller av tidsmedveten träning

Dessa alternativ kan slås på eller av för varje version av experimentet som du kör.

Delavsnittet Modelloptimering i panelen för experimentkonfiguration

Delavsnittet Modelloptimering i panelen för träningskonfiguration för Qlik Predict

Konfigurera intelligent optimering

Som standard använder experimentet intelligent modelloptimering. Med intelligent modelloptimering hanterar Qlik Predict modellförfiningen åt dig genom att iterera funktionsval och tillämpvancerade transformeringar på dina data.

Mer information om intelligent optimering finns i Intelligent modelloptimering.

Du kan stänga av den här inställningen för att manuellt förfina de modeller du tränar. Du kanske till exempel vill starta din modellträning med intelligent modelloptimering och sedan byta till manuell förfining för v2 för att justera konfigurationen ytterligare.

  1. Klicka på Kontroller Visa konfiguration.

  2. Om du redan har kört minst en version av experimentet klickar du på Ny version.

  3. I panelen expanderar du Modelloptimering.

  4. Växla från Intelligent till Manuell.

  5. Använd skjutreglaget för att ställa in den maximala körtiden för träningen.

Konfigurera hyperparameteroptimering

Du kan optimera modellerna med hjälp av hyperparameteroptimering. Observera att detta är ett avancerat alternativ som kan öka träningstiden avsevärt. Hyperparameteroptimering är tillgänglig om du stänger av intelligent optimering.

Mer information finns i Hyperparameteroptimering.

  1. Klicka på Kontroller Visa konfiguration.

  2. Om du redan har kört minst en version av experimentet klickar du på Ny version.

  3. I panelen expanderar du Modelloptimering.

  4. Växla från Intelligent till Manuell.

  5. Markera kryssrutan Hyperparameteroptimering.

  6. Du kan även ange en tidsgräns för din optimering. Standardtidsgränsen är en timme.

Konfigurera tidsmedveten träning

Om du vill att dina modeller ska tränas med hänsyn till en tidsseriedimension aktiverar du tidsmedveten träning för experimentversionen. För att använda detta alternativ måste du av en kolumn i din datamängd som innehåller den relevanta tidsserieinformationen.

När tidsmedveten träning är påslagen använder Qlik Predict specialiserade processer för korsvalidering och null-imputering för att träna modellerna.

Mer information finns i Skapa tidskänsliga modeller och Tidsbaserad korsvalidering.

  1. Klicka på Kontroller Visa konfiguration.

  2. Om du redan har kört minst en version av experimentet klickar du på Ny version.

  3. I panelen expanderar du Modelloptimering.

  4. Under Tidsbaserad test-träningsuppdelning väljer du Datumindex som ska användas för att sortera data.

Visa insikter om träningsdata

På fliken Konfiguration/Träningsdata i experimentet kan du visa insikter om hanteringen av träningsdata. Den här informationen är tillgänglig i kolumnen Insikter i Tabellrader Schemavy. Informationen som visas beror på om du har kört en version med aktuella träningsdata eller inte. Ändringarna i kolumnen Insikter kan hjälpa dig att identifierar varför funktioner kanske inte är tillgängliga för användning, eller varför de har tagits bort automatiskt.

Mer information om vad varje insikt betyder finns i Tolka insikter om datamängder.

RELATERAD INFORMATION:

Mer information

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!