Datadrift
Över tid kan din modells noggrannhet minska eftersom data i en eller flera funktioner ändras i distribution, storlek och andra egenskaper. Eftersom den ursprungliga modellen tränades med funktioner som innehåller specifika mönster och distributioner, kommer framtida ändringar av dessa distributioner att påverka förutsägelsernas precision och kvalitet.
Datadrift kan kvantifieras och beräknas på ett antal sätt. I Qlik Predict beräknas datadrift med formeln för populationsstabilitetsindex. Se Övervakning av datadrift i distribuerade datamodeller.
Bästa praxis är att övervaka din modell för datadrift genom att jämföra det ursprungliga träningsdatasetet med det mest aktuella tillämpningsdatasetet som du genererar förutsägelser på. När datadriften når en specifik tröskel, träna om modellen eller konfigurera en ny modell om ditt ursprungliga maskininlärningsproblem har förändrats avsevärt.
För mer information om att bedöma modellens prestanda över tid, se Utvärdering av modellens prestanda över tid.
Exempel
Anta att ett företag har en uppsättning produkter som har visat sig vara populära främst bland konsumenter som är 45 år och äldre. Värdefördelningen för en funktion Ålder kan se ut på följande sätt.
Ett stapeldiagram som visar att företagets försäljning tilltalar konsumenter över 45 år i högre grad.

Nyligen har företaget introducerat en ny produkt som marknadsförs för att tilltala även yngre konsumenter. När produkten säljer som förväntat ser vi en betydande funktionsdrift för funktionen Ålder.
Stapeldiagram som visar företagets försäljning som är jämnare fördelad, där företagets försäljning tilltalar konsumenter i alla åldrar mer lika.

Övervakning av datadrift i Qlik Predict
Qlik Predict har inbyggda verktyg som hjälper dig att upptäcka datadrift per funktion i dina distribuerade modeller. För mer information, se Övervakning av datadrift i distribuerade datamodeller.