Dryf danych
Z biegiem czasu dokładność modelu może spaść, ponieważ dane w jednej lub kilku cechach zmieniają się pod względem rozkładu, wielkości i innych właściwości. Ponieważ oryginalny model został wytrenowany na cechach zawierających określone wzorce i rozkłady, przyszłe zmiany tych rozkładów wpłyną na precyzję i jakość predykcji.
Dryf danych można określić ilościowo i obliczyć na wiele sposobów. W Qlik Predict dryf danych jest obliczany za pomocą wzoru na wskaźnik stabilności populacji. Zobacz Monitorowanie dryfu danych we wdrożonych modelach.
Najlepszą praktyką jest monitorowanie modelu pod kątem dryfu danych poprzez porównanie oryginalnego zestawu danych treningowych z najbardziej aktualnym zestawem danych do zastosowania, na którym generowane są predykcje. Gdy dryf danych osiągnie określony próg, należy ponownie wytrenować model lub skonfigurować nowy model, jeśli pierwotny problem uczenia maszynowego uległ znacznej zmianie.
Aby uzyskać więcej informacji na temat oceny wydajności modelu w czasie, zobacz Ocena wydajności modelu w czasie.
Przykład
Załóżmy, że firma posiada zestaw produktów, o których wiadomo, że są popularne głównie wśród konsumentów w wieku 45 lat i starszych. Rozkład wartości dla cechy Wiek może wyglądać następująco.
Wykres słupkowy pokazujący sprzedaż firmy, która jest bardziej atrakcyjna dla konsumentów powyżej 45 roku życia.

Niedawno firma wprowadziła nowy produkt, który jest reklamowany tak, aby przyciągnąć również młodszych konsumentów. Gdy produkt sprzedaje się zgodnie z oczekiwaniami, obserwujemy znaczny dryf cechy dla cechy Wiek.
Wykres słupkowy pokazujący sprzedaż firmy, która jest bardziej równomiernie rozłożona, przy czym sprzedaż firmy jest w równym stopniu atrakcyjna dla konsumentów w każdym wieku.

Monitorowanie dryfu danych w Qlik Predict
Qlik Predict ma wbudowane narzędzia pomagające wykrywać dryf danych dla poszczególnych cech we wdrożonych modelach. Aby uzyskać więcej informacji, zobacz Monitorowanie dryfu danych we wdrożonych modelach.