Datadrift
Na verloop van tijd kan de nauwkeurigheid van uw model afnemen omdat de gegevens in een of meer functies veranderen in distributie, omvang en andere eigenschappen. Omdat het oorspronkelijke model is getraind met functies die specifieke patronen en distributies bevatten, zullen toekomstige wijzigingen in deze distributies de precisie en kwaliteit van voorspellingen beïnvloeden.
Datadrift kan worden gekwantificeerd en op een aantal manieren worden berekend. In Qlik Predict wordt datadrift berekend met de formule voor de populatiestabiliteitsindex. Zie Gegevensdrift in geïmplementeerde modellen bewaken.
Een best practice is om uw model te controleren op datadrift door de oorspronkelijke trainingsgegevensset te vergelijken met de meest actuele toepassingsgegevensset waarop u voorspellingen genereert. Wanneer datadrift een specifieke drempel bereikt, traint u het model opnieuw of configureert u een nieuw model als uw oorspronkelijke machine learning-probleem aanzienlijk is veranderd.
Voor meer informatie over het beoordelen van modelprestaties in de loop van de tijd, zie De prestaties van het model in de loop van de tijd evalueren.
Voorbeeld
Stel dat een bedrijf een reeks producten heeft waarvan is vastgesteld dat ze voornamelijk populair zijn bij consumenten van 45 jaar en ouder. De waardedistributie voor een functie Leeftijd kan er als volgt uitzien.
Staafdiagram dat laat zien dat de verkoop van het bedrijf meer in de smaak valt bij consumenten ouder dan 45 jaar.

Onlangs heeft het bedrijf een nieuw product geïntroduceerd dat op de markt wordt gebracht om ook jongere consumenten aan te spreken. Wanneer het product verkoopt zoals verwacht, zien we een aanzienlijke functiedrift voor de functie Leeftijd.
Staafdiagram dat laat zien dat de verkoop van het bedrijf gelijkmatiger is verdeeld, waarbij de verkoop van het bedrijf consumenten van alle leeftijden meer in gelijke mate aanspreekt.

Datadrift monitoren in Qlik Predict
Qlik Predict heeft ingebouwde tools om u te helpen datadrift per functie te detecteren binnen uw geïmplementeerde modellen. Voor meer informatie, zie Gegevensdrift in geïmplementeerde modellen bewaken.