Dryf danych | Qlik Cloud Pomoc
Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Dryf danych

Z biegiem czasu dokładność modelu może spaść, ponieważ dane w jednej lub kilku cechach zmieniają się pod względem rozkładu, wielkości i innych właściwości. Ponieważ oryginalny model został wytrenowany na cechach zawierających określone wzorce i rozkłady, przyszłe zmiany tych rozkładów wpłyną na precyzję i jakość predykcji.

Dryf danych można określić ilościowo i obliczyć na wiele sposobów. W Qlik Predict dryf danych jest obliczany za pomocą wzoru na wskaźnik stabilności populacji. Zobacz Monitorowanie dryfu danych we wdrożonych modelach.

Najlepszą praktyką jest monitorowanie modelu pod kątem dryfu danych poprzez porównanie oryginalnego zestawu danych treningowych z najbardziej aktualnym zestawem danych do zastosowania, na którym generowane są predykcje. Gdy dryf danych osiągnie określony próg, należy ponownie wytrenować model lub skonfigurować nowy model, jeśli pierwotny problem uczenia maszynowego uległ znacznej zmianie.

Aby uzyskać więcej informacji na temat oceny wydajności modelu w czasie, zobacz Ocena wydajności modelu w czasie.

Przykład

Załóżmy, że firma posiada zestaw produktów, o których wiadomo, że są popularne głównie wśród konsumentów w wieku 45 lat i starszych. Rozkład wartości dla cechy Wiek może wyglądać następująco.

Wykres słupkowy pokazujący sprzedaż firmy, która jest bardziej atrakcyjna dla konsumentów powyżej 45 roku życia.

Wykres słupkowy pokazujący rozkład zakupów produktów według wieku przed wprowadzeniem przez firmę nowego produktu. W tym przypadku rozkład częstości wieku pokazuje, że sprzedaż jest atrakcyjna głównie dla dorosłych w wieku 45 lat i starszych.

Niedawno firma wprowadziła nowy produkt, który jest reklamowany tak, aby przyciągnąć również młodszych konsumentów. Gdy produkt sprzedaje się zgodnie z oczekiwaniami, obserwujemy znaczny dryf cechy dla cechy Wiek.

Wykres słupkowy pokazujący sprzedaż firmy, która jest bardziej równomiernie rozłożona, przy czym sprzedaż firmy jest w równym stopniu atrakcyjna dla konsumentów w każdym wieku.

Wykres słupkowy pokazujący rozkład zakupów produktów według wieku po wprowadzeniu przez firmę nowego produktu. W tym przypadku rozkład częstości wieku przesunął się ze sprzedaży atrakcyjnej głównie dla dorosłych w wieku 45 lat i starszych w kierunku bardziej równomiernie rozłożonej popularności we wszystkich grupach wiekowych.

Monitorowanie dryfu danych w Qlik Predict

Qlik Predict ma wbudowane narzędzia pomagające wykrywać dryf danych dla poszczególnych cech we wdrożonych modelach. Aby uzyskać więcej informacji, zobacz Monitorowanie dryfu danych we wdrożonych modelach.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!