Gå till huvudinnehåll Gå till ytterligare innehåll

Skapa nya funktionskolumner

Funktionsutveckling är processen att skapa nya funktionskolumner från befintliga kolumner. Det kan hjälpa dig att få ytterligare prognosförmåga från källdata som du har samlat in för att besvara en affärsfråga.

Till exempel kan en kunds adress uteslutas från träningsdata på grund av hög kardinalitet. Istället för att använda adressen kan vi funktionsutveckla en kolumn för avstånd. Om vi känner till kundens adress och de olika butikernas placering kan avstånden till butikerna beräknas. De nya kolumnerna kommer att ha ett numeriskt värde som kan användas för att upptäcka mätbara mönster i data.

Du kan utföra funktionsgenerering på din datauppsättning som förberedelse för användning i AutoML. AutoML föreslår dessutom nya funktioner som kan genereras automatiskt från befintliga funktioner.

Nya kolumner för avstånd till olika butiker

Tabell med exempeldata.

Granska funktionerna i din datauppsättning för att fastställa eventuella problem som kan finnas eller förbättringar som kan göras. Att utveckla bra funktioner kräver skicklighet och affärserfarenhet. Du vill att funktionerna ska uttryckas på ett sätt som är direkt kopplat till målkolumnen.

Saker att tänka på:

  • Bör tiden spela in i funktionen?

  • Spelar förändringshastigheten någon roll?

  • Bör en funktion normaliseras för att ta hänsyn till skillnader mellan delmängder av data?

  • Betyder nollvärden något?

Autogenererade funktioner

Med automatisk funktionsgenerering skapas nya funktioner till automatiskt från befintliga.

AutoML genererar autogenererade funktioner från kolumner som innehåller datum- och tidsinformation. De här nya funktionerna separerar varje komponent i kolumnvärdena till deras egna funktioner.

Det går dessutom att använda särskild bearbetning på kolumner som innehåller fritext. De ursprungliga fritextfunktionerna omvandlas till nya funktioner för att förbättra modellträningen.

Autogenererade funktioner förbättrar prognos- och analysvärdet för dina modeller när du tränar dem. Mer information finns i Automatisk funktionsgenerering.

Exempel: utveckling av funktioner

Använd följande exempel för att börja fundera kring hur du kan utveckla funktioner som kan förbättra de prediktiva egenskaperna i dina data.

Kommer en försäljningsmöjlighet att avslutas?

Målkolumnen anger om försäljningsmöjligheten har avslutats (ja eller nej).

  • Ursprunglig funktion: antal möten

  • Alternativa funktioner: möten per månad eller antal möten i ett visst steg

Omvandling av sättet att mäta mötesfrekvens avspeglar förändringen bättre. Genom att mäta möten i ett visst steg av försäljningsprocessen kan man bättre uttrycka försäljningsdynamiken och ta hänsyn till cykeln.

Förutsäg ett framtida transaktionsbelopp

Målkolumnen är beloppet för nästa transaktion.

  • Ursprunglig funktion: belopp för den senast ordern

  • Alternativa funktioner: det genomsnittliga beställningsbeloppet eller den procentuella förändringen av beställningsbeloppet

Genomsnittsbeloppet ger dig en bredare bild av beställningsbeteendet. Förändringen i köpmönstret ger ett normaliserat värde.

Kommer en kund att förloras?

Målkolumnen är om kunden kommer att förloras (ja eller nej).

  • Ursprunglig funktion: stämningsläge hos kunderna

  • Alternativa funktioner: förändring av kundernas stämningsläge eller antal dagar med det nuvarande stämningsläget

Att mäta förändringen i stämningsläge leder mer sannolikt till åtgärder. Antalet dagar anger hur länge det aktuella tillståndet varar.

Kommer en anställd att säga upp sig frivilligt?

Målkolumnen anger om en anställd kommer att säga upp sig (ja eller nej).

  • Ursprunglig funktion: lön

  • Alternativa funktioner: lön jämfört med kollegor eller lön jämfört med branschgenomsnittet

Genom att jämföra lönen med andra löntagares kan du få bättre överensstämmelse med den anställdes erfarenhet eller stämningsläge. Jämförelsen med den genomsnittliga lönen i branschen stämmer bättre överens med den anställdes alternativkostnad.

Kommer ett ämne att omvandlas till en möjlighet?

Målkolumnen är om ett ämne omvandlas (ja eller nej).

  • Ursprunglig funktion: hur hittade du oss?

  • Alternativa funktioner: svar (ja eller nej)

Det är handlingen som är det viktiga här och inte svaret. Observera att nollor i det här fallet betyder något: inaktivitet.

Datum

Med AutoML:s automatiska funktionsgenerering parsas komponenterna i datum och tidsstämplar automatiskt till separata kolumner.

Datum kan också användas på många andra sätt för att skapa flera funktioner i en datauppsättning, t.ex:

  • Aggregera datum till årstider, kvartal eller terminer.

  • Beräkna datumskillnad, till exempel antal dagar sedan det senaste köpet.

RELATERAD INFORMATION:

Mer information

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!