Datadrift | Qlik CloudHjälp
Gå till huvudinnehåll Gå till ytterligare innehåll

Datadrift

Över tid kan din modells noggrannhet minska eftersom data i en eller flera funktioner ändras i distribution, storlek och andra egenskaper. Eftersom den ursprungliga modellen tränades med funktioner som innehåller specifika mönster och distributioner, kommer framtida ändringar av dessa distributioner att påverka förutsägelsernas precision och kvalitet.

Datadrift kan kvantifieras och beräknas på ett antal sätt. I Qlik Predict beräknas datadrift med formeln för populationsstabilitetsindex. Se Övervakning av datadrift i distribuerade datamodeller.

Bästa praxis är att övervaka din modell för datadrift genom att jämföra det ursprungliga träningsdatasetet med det mest aktuella tillämpningsdatasetet som du genererar förutsägelser på. När datadriften når en specifik tröskel, träna om modellen eller konfigurera en ny modell om ditt ursprungliga maskininlärningsproblem har förändrats avsevärt.

För mer information om att bedöma modellens prestanda över tid, se Utvärdering av modellens prestanda över tid.

Exempel

Anta att ett företag har en uppsättning produkter som har visat sig vara populära främst bland konsumenter som är 45 år och äldre. Värdefördelningen för en funktion Ålder kan se ut på följande sätt.

Ett stapeldiagram som visar att företagets försäljning tilltalar konsumenter över 45 år i högre grad.

Stapeldiagram som visar fördelningen av produktköp efter ålder innan företaget har introducerat en ny produkt. I det här fallet visar fördelningen av åldersfrekvenserna att försäljningen främst tilltalar vuxna som är 45 år och äldre.

Nyligen har företaget introducerat en ny produkt som marknadsförs för att tilltala även yngre konsumenter. När produkten säljer som förväntat ser vi en betydande funktionsdrift för funktionen Ålder.

Stapeldiagram som visar företagets försäljning som är jämnare fördelad, där företagets försäljning tilltalar konsumenter i alla åldrar mer lika.

Stapeldiagram som visar fördelningen av produktköp efter ålder efter att företaget har introducerat en ny produkt. I det här fallet har fördelningen av åldersfrekvenserna skiftat från en försäljning som främst tilltalar vuxna som är 45 år och äldre mot en jämnare fördelad popularitet bland alla åldersgrupper.

Övervakning av datadrift i Qlik Predict

Qlik Predict har inbyggda verktyg som hjälper dig att upptäcka datadrift per funktion i dina distribuerade modeller. För mer information, se Övervakning av datadrift i distribuerade datamodeller.

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!