Ga naar hoofdinhoud Ga naar aanvullende inhoud

Nieuwe kenmerkkolommen maken

Kenmerkontwikkeling is het proces waarbij nieuwe kenmerkkolommen worden gemaakt vanuit bestaande kolommen. Het kan u helpen meer voorspellingskracht te krijgen uit de brongegevens die u hebt verzameld om een zakelijke vraag te beantwoorden.

Zo kan bijvoorbeeld het adres van een klant worden uitgesloten uit de trainingsgegevens vanwege hoge kardinaliteit. In plaats van dat het adres wordt gebruikt, kunnen we kenmerk-engineering toepassen op een afstandskolom. Als we het adres van de klant en verschillende winkellocaties weten, dan kunnen de afstanden naar de winkels worden berekend. De nieuwe kolommen krijgen een numerieke waarde die kan worden gebruikt om meetbare patronen in de gegevens te onthullen.

U kunt kenmerkontwikkeling uitvoeren op uw gegevensverzameling ter voorbereiding voor gebruik in AutoML. Daarnaast stelt AutoML nieuwe kenmerken voor die automatisch kunnen worden gegeneerd op basis van bestaande kenmerken.

Nieuwe kolommen voor afstanden naar verschillende winkels

Tabel met voorbeeldgegevens.

Bekijk de kenmerken in uw gegevensverzameling om mogelijke problemen of eventuele verbeteringen vast te stellen. Goede kenmerken opzetten vereist vaardigheid en zakelijke ervaring. U wilt kenmerken dusdanig opstellen dat ze direct verband houden met de doelkolom.

Dingen om over na de denken:

  • Moet tijd worden ingebouwd in het kenmerk?

  • Doet snelheid van verandering ertoe?

  • Moet een kenmerk worden genormaliseerd om rekening te houden met verschillen in gegevenssubsets?

  • Betekenen null-waarden iets?

Automatisch ontwikkelde kenmerken

Met automatische kenmerkontwikkeling worden nieuwe kenmerken automatisch gemaakt op basis van bestaande kenmerken.

AutoML genereert automatisch ontwikkelde kenmerken vanuit kolommen met datum- en tijdinformatie. Deze nieuwe kenmerken scheiden ieder component van de kolomwaarden in hun eigen kenmerken.

Daarnaast kan er een speciale verwerking worden toegepast op kolommen die vrije tekst bevatten. De originele vrijetekstkenmerken worden getransformeerd in nieuwe kenmerken om de training van het model te verbeteren.

Automatisch ontwikkelde kenmerken verbeteren de voorspellende en analytische waarde van uw modellen naarmate u ze traint. Ga voor meer informatie naar Automatische kenmerkontwikkeling.

Voorbeelden: Kenmerken opstellen

Gebruik de volgende voorbeelden om te beginnen met brainstormen over hoe kenmerken moeten worden opgesteld om de voorspellende aard in uw gegevens te verbeteren.

Zal een verkoopkans worden afgesloten?

De doelkolom is of de verkoop is gesloten (Ja of Nee).

  • Oorspronkelijk kenmerk: Aantal ontmoetingen

  • Alternatieve kenmerken: Ontmoetingen per maand of aantal ontmoetingen in een specifieke fase

De meting omzetten in ontmoetingsfrequentie biedt meer ruimte voor verandering. Ontmoetingen in een specifieke fase in het verkoopproces meten, geeft beter uitdrukking aan het verkoopmomentum en houdt rekening met cycli.

Voorspel een toekomstig transactiebedrag

De doelkolom is het bedrag van de volgende transactie.

  • Oorspronkelijk kenmerk: Bedrag van laatste bestelling

  • Alternatieve kenmerken: Het gemiddelde bestellingsbedrag of het percentage verandering in bestelbedrag

Het gemiddelde bedrag biedt een breder beeld van het bestelgedrag. De verandering in het kooppatroon levert een genormaliseerde waarde op.

Zal een klant vertrekken?

De doelkolom is of de klant al dan niet zal vertrekken (Ja of Nee).

  • Oorspronkelijk kenmerk: Sentiment van de klant

  • Alternatieve kenmerken: Verandering in het sentiment van de klant of het aantal dagen met het huidige sentiment

De verandering in het sentiment meten vergroot de kans dat er actie wordt ondernomen. Het aantal dagen geeft de duur van de huidige staat weer.

Zal een werknemer een dienstverband vrijwillig beëindigen?

De doelkolom is of een werknemer al dan niet zijn of haar ontslag zal indienen (Ja of Nee).

  • Oorspronkelijk kenmerk: Salaris

  • Alternatieve kenmerken: Salaris in vergelijking met collega's of salaris vergeleken met het gemiddelde in de sector

Vergelijking van het salaris met dat van collega's sluit beter aan op de ervaring of het sentiment van de werknemer. De vergelijking met het gemiddelde salaris in de sector sluit beter aan op de opportuniteitskosten van de werknemer.

Zal een lead worden geconverteerd in een kans?

De doelkolom is of een lead al dan niet wordt geconverteerd (Ja of Nee).

  • Oorspronkelijk kenmerk: Hoe hebt u ons gevonden?

  • Alternatieve kenmerken: Beantwoord (Ja of Nee)

De actie is hetgeen wat hier telt en niet wat het antwoord was. In dit geval betekent null iets: inactiviteit.

Datums

Met de automatische kenmerkontwikkelfunctie van AutoML, worden componenten van datums en tijdstempels automatisch in afzonderlijke kolommen geparseerd.

Datums kunnen ook op allerlei andere manieren worden bewerkt om verschillende kenmerken in één gegevensverzameling te creëren zoals:

  • Aggregeer datums in seizoenen, kwartalen of semesters.

  • Bereken het datumverschil, bijvoorbeeld het aantal dagen sinds de laatste aankoop.

GERELATEERD LESMATERIAAL:

Meer informatie

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een typfout, een ontbrekende stap of een technische fout – laat het ons weten zodat we dit kunnen verbeteren!