Datadrift | Qlik Cloud Help
Ga naar hoofdinhoud Ga naar aanvullende inhoud

Datadrift

Na verloop van tijd kan de nauwkeurigheid van uw model afnemen omdat de gegevens in een of meer functies veranderen in distributie, omvang en andere eigenschappen. Omdat het oorspronkelijke model is getraind met functies die specifieke patronen en distributies bevatten, zullen toekomstige wijzigingen in deze distributies de precisie en kwaliteit van voorspellingen beïnvloeden.

Datadrift kan worden gekwantificeerd en op een aantal manieren worden berekend. In Qlik Predict wordt datadrift berekend met de formule voor de populatiestabiliteitsindex. Zie Gegevensdrift in geïmplementeerde modellen bewaken.

Een best practice is om uw model te controleren op datadrift door de oorspronkelijke trainingsgegevensset te vergelijken met de meest actuele toepassingsgegevensset waarop u voorspellingen genereert. Wanneer datadrift een specifieke drempel bereikt, traint u het model opnieuw of configureert u een nieuw model als uw oorspronkelijke machine learning-probleem aanzienlijk is veranderd.

Voor meer informatie over het beoordelen van modelprestaties in de loop van de tijd, zie De prestaties van het model in de loop van de tijd evalueren.

Voorbeeld

Stel dat een bedrijf een reeks producten heeft waarvan is vastgesteld dat ze voornamelijk populair zijn bij consumenten van 45 jaar en ouder. De waardedistributie voor een functie Leeftijd kan er als volgt uitzien.

Staafdiagram dat laat zien dat de verkoop van het bedrijf meer in de smaak valt bij consumenten ouder dan 45 jaar.

Staafdiagram dat de verdeling van productaankopen op leeftijd toont voordat het bedrijf een nieuw product heeft geïntroduceerd. In dit geval toont de verdeling van de leeftijdsfrequenties dat de verkoop voornamelijk in de smaak valt bij volwassenen van 45 jaar en ouder.

Onlangs heeft het bedrijf een nieuw product geïntroduceerd dat op de markt wordt gebracht om ook jongere consumenten aan te spreken. Wanneer het product verkoopt zoals verwacht, zien we een aanzienlijke functiedrift voor de functie Leeftijd.

Staafdiagram dat laat zien dat de verkoop van het bedrijf gelijkmatiger is verdeeld, waarbij de verkoop van het bedrijf consumenten van alle leeftijden meer in gelijke mate aanspreekt.

Staafdiagram dat de verdeling van productaankopen op leeftijd toont nadat het bedrijf een nieuw product heeft geïntroduceerd. In dit geval is de verdeling van de leeftijdsfrequenties verschoven van een verkoop die voornamelijk in de smaak valt bij volwassenen van 45 jaar en ouder naar een meer gelijkmatig verdeelde populariteit onder alle leeftijdsgroepen.

Datadrift monitoren in Qlik Predict

Qlik Predict heeft ingebouwde tools om u te helpen datadrift per functie te detecteren binnen uw geïmplementeerde modellen. Voor meer informatie, zie Gegevensdrift in geïmplementeerde modellen bewaken.

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een tikfout, een ontbrekende stap of een technische fout – laat het ons weten!