Exempel – Träningsmodeller med automatiserad maskininlärning

I exemplet tränar du maskininlärningsmodeller med intelligent modelloptimering. Med intelligent modelloptimering hanterar AutoML processen med upprepning och förfining av modellerna åt dig.

Se Intelligent modelloptimering för mer information om intelligent modelloptimering.

Vad du kommer att lära dig

I exemplet får du lära dig:

Hur du skapar och konfigurerar ett ML-experiment
Hur intelligent optimering kan tillhandahåll automatisk modellförfining
Hur du visar och analyserar träningsresultat

Andra överväganden

Intelligent modelloptimering är till stor hjälp för att förfina modeller som baseras på en väl förberedd datauppsättning. Du säkerställer att dina modeller är av hög kvalitet i verkliga användningsfall genom att börja med att följa det struktererade ramverket och förbereda en träningsdatauppsättning med relevanta funktioner och data. Mer information finns här:

Intelligent modelloptimering kan alternativt stängas av för varje experimentversion. När du slår av denna inställning optimerar du dina modeller manuellt. Manuell optimering kan vara praktiskt om du vill göra specifika justeringar av experimentets konfiguration. Du kan köra en version med intelligent modelloptimering och sedan stänga av för att göra små manuella finjusteringar och fortfarande dra nytta av den automatiska förfining som görs.

Exemplet tar upp träning med intelligent optimering. Se Introduktionskurs – Generera och visualisera förutsägelsedata för en fullständig handledning som visar hur du använder manuell optimering. Denna introduktionskurs innehåller även vägledning från början till slut för att distribuera modeller, göra prognoser och visualisera prognosdata med interaktiva Qlik Sense-appar.

Vilka ska gå igenom detta exempel

Du ska gå igenom exemplet om du vill se hur du använder intelligent modelloptimering för att förfina dina maskininlärningsmodeller.

Du behöver följande när du går igenom detta exempel:

Användarrättighet Professional eller Full User
Automl Experiment Contributor-säkerhetsroll i klientorganisationen
Om du arbetar i ett samarbetsutrymme behöver du nödvändiga utrymmesroller för utrymmen där du kommer att arbeta. Se: Hantera behörigheter i delade utrymmen

Om du inte kan visa eller skapa ML-resurser betyder det antagligen att du inte har de nödvändiga rollerna, rättigheterna eller behörigheterna. Kontakta huvudadministratören för mer information

Se Vem kan arbeta med Qlik AutoML för mer information.

Vad du behöver göra innan du börjar

Hämta det här paketet och packa upp det på skrivbordet:

AutoML-exempel – Intelligent modelloptimering

Paketet innehåller träningsdatauppsättningen som du ska använda för attt träna modeller. Datauppsättningen innehåller information om kunder vars tidsfrist för förnyelse har gått ut och som har fattat beslut om att säga upp sin prenumeration eller fortsätta prenumerera på tjänsten.

Gör följande:

Öppna aktivitetscentret för Analyser.
Gå till sidan Skapa, välj Datauppsättning och välj sedan Ladda upp datafil.
Dra filen AutoML Example - Churn data - training.csv till dialogrutan för uppladdning.
Välj ett utrymme. Det kan vara ditt personliga utrymme eller ett delat utrymme om du vill att andra användare ska kunna få tillgång till dessa data.
Klicka på Ladda upp.

Nu när daatauppsättningen har laddats upp kan du fortsätta med att skapa ett experiment

Del 1: Skapa ett experiment

Gör följande:

Gå till sidan Skapa i aktivitetscentret för Analyser och välj ML-experiment.
Ange namn för ditt experiment, exempelvis, Intelligent optimeringsexempel.
Du kan även lägga till en beskrivning och taggar.
Välj en plats för ditt experiment. Det kan vara ditt personliga utrymme eller ett gemensamt utrymme.
Klicka på Skapa.
Välj AutoML Example - Churn data - training.csv-filen.

Del 2: Konfigurera experimentet

Nu kan vi konfigurera experimentet.

Intelligent modelloptimering behöver mindre inledande konfiguration än manuell optimering. I detta fallet ska vi välja ett mål och använda alla funktioner som är inkluderade som standard.

Välja mål

Vi vill att vår maskininlärningsmodell ska förutsäga kundförlust, så vi väljer Churned, den sista kolumnen i datauppsättningen, som vårt mål.

I experimentet ska enbart fliken Data visas. Du kan välja mål på flera sätt men här använder vi Tabellrader Schemavy som har öppnats som standard.

Gör följande:

I schemat hovrar du över Churned och klickar på målikonen som visas.

Datauppsättningskolumn med målsymbol. — Välja mål i Schemavyn

Bekräfta funktionsurval

När du har valt mål inkluderas alla tillgängliga och rekommenderade funktioner som standard. I Tabellrader Schemavy bekräftar du att alla utom två funktioner är inkluderade. Det ska finnas markerade rutor bredvid alla inkluderade funktioner. Country är inte tillgängligt att använda. AccountID rekommenderas inte för användning på grund av dess höga kardinalitet så vi låter dem vara omarkerade.

Schemavyn visar alla tillgängliga och rekommenderade funktioner som inkluderas i experimentversionen — Schema som visar standardurval av funktioner

Bekräfta intelligent optimering

En panel ska öppnas till höger på sidan där du kan konfigurera fler inställningar. Vi vill kontrollera att intelligent modelloptimering är påslagen.

Gör följande:

Om experimentets konfigurationspanel inte är öppen ska du klicka på Visa kconfiguration för att öppna den.
Expandera Modelloptimering i panelen.
Valt alternativ för optimering ska vara Intelligent.

Experimentets konfigurationspanel visar att inställningsalternativet för Modelloptimering är inställt på "Intelligent" — Bekräfta att experimentversionen körs med alternativet Intelligent optimering

Kör träningen

Klicka på Kör experiment längst ner till höger på sidan för att starta modellträningen.

Del 3: Visa resultaten

När träningen är slutförd visas och öppnas fliken Modeller. Här kan du visa vilka optimeringar som gjordes under träningen. Den översta modellen, med en Trofé -ikon, väljs automatiskt. Låt oss analysera den här modellen.

Titta på Sammanfattning av modellträning. Här visas resultaten av intelligent optimering av den här modellen. I detta fallet kan vi se att följande funktioner släppts och anledningen till det:

DaysSinceLastService släpptes på grund av misstänkt målläckage. I detta fallet innehöll kolumnen data med inkorrekt logik. Dagarna efter senaste serviceärende fortfarande var aktivt räknas för kunder som annullerat sitt serviceärende (i vissa fall sedan flera år). Funktionen behövde tas bort eftersom den skulle gett modellen falska prestandapoäng och gjort att modellen hade visat väldigt dåliga resultat om den distribuerats. Se Dataläckage
PriorPeriodUsage och PriorPeriodUsage-Rounded uteslöts eftersom de var för starkt korrelerade till annan funktion. Funktionen de korrelerade till var fortfarande inkluderad i träningen. Se Korrelation.
CurrentPeriodUsage, CustomerTenure, StartMonth, Territory, DeviceType och StartWeek uteslöts alla på grund av låg permutationsbetydelse. Funktioner med liten påverkan på modellen anses vara statistiskt brus och kan tas bort för bättre prestanda. Se Förstå permutationsbetydelse.

Diagram för sammanfattning av träning för de bästa modellerna som visar funktioner som släppts på grund av målläckage, hög korrelation och liten permutationsbetydelse — Diagrammet Sammanfattning av modellträning visar funktioner som släppts med intelligent optimering

Nu när dessa funktioner tagits bort kan vi se visualiseringar som visar funktionerna med störst påverkan samt även vissa indikatorer på modellens prognosprestanda. Det som visas i dessa diagram kan hjälpa dig bedöma om något saknas i funktionsuppsättningen eller om resultaten är skeva.

Se Utföra snabb modellanalys för mer information om att analysera modeller med dessa visualiseringar.

Fördjupning i analys

Om du vill utforska modellens mätvärden ytterligare ska du växla till flikarna Jämför och Analysera i experimentet. Flikarna ger en mer detaljerad, interaktiv bild av mätvärdena.

Se Jämförelse av modeller och Utföra detaljerad modellanalys för mer information.

Nästa steg

Med en datauppsättning av hög kvalitet kan intelligent optimering skapa modeller som är klara att distribueras med lite eller ingen ytterligare iteration. Från denna punkt rekommenderar vi att du distribuerar modellen med bäst resultat. I annat fall kan du fortsätta förfina modellerna manuellt eller uppdatera träningsdata och köra intelligent modelloptimering på nytt.

Mer information om nästa steg, se:

Tack!

Du är klar med detta exemplet. Vi hoppas att du sett hur du kan använda intelligent modelloptimering för att enkelt träna distributionsklara maskininlärningsmodeller.

Vill du lära dig mer?

Om du vill lära dig mer finns det en uppsjö av möjligheter i Qlik.
Onlinehjälpen för Qlik är tillgänglig.
Utbildning, inklusive kostnadsfria onlinekurser, finns på Qlik Learning.
Diskussionsforum, bloggar med mera finns i Qlik Community.

Din åsikt är viktig

Vi tar tacksamt emot all din feedback. I avsnittet nedan kan du berätta vad du tycker om oss.

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!

Lämna din feedback här