Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Dryf danych

Z biegiem czasu dokładność modelu może spadać, ponieważ dane w jednej lub kilku cechach zmieniają się pod względem rozkładu, wielkości i innych właściwości. Ponieważ oryginalny model został nauczony przy użyciu cech, które zawierają określone wzorce i rozkłady, przyszłe zmiany tych rozkładów będą miały wpływ na precyzję i jakość przewidywań.

Dryf danych można określić ilościowo i obliczyć na różne sposoby. W Qlik AutoML dryf danych jest obliczany za pomocą formuły wskaźnika stabilności populacji. Zob. Monitorowanie dryfu danych we wdrożonych modelach.

Najlepszą praktyką jest monitorowanie modelu danych pod kątem dryfu danych poprzez porównanie oryginalnego zestawu danych do uczenia z najbardziej aktualnym zestawem danych do zastosowania, na którym generowane są prognozy. Gdy dryf danych osiągnie określony próg, należy ponownie nauczyć model lub skonfigurować nowy model, jeśli pierwotny problem uczenia maszynowego znacznie się zmienił.

Więcej informacji na temat oceny wydajności modelu w czasie zawiera temat Ocena wydajności modelu w czasie.

Przykład

Załóżmy, że firma ma zestaw produktów, który został uznany za popularny głównie wśród konsumentów w wieku 45 lat i starszych. Rozkład wartości dla cechy Age (Wiek) może wyglądać następująco.

Wykres słupkowy pokazujący sprzedaż firmy bardziej atrakcyjną dla konsumentów w wieku powyżej 45 lat.

Wykres słupkowy pokazujący rozkład zakupów produktów według wieku przed wprowadzeniem przez firmę nowego produktu.

Niedawno firma wprowadziła na rynek nowy produkt, który ma również przemawiać do młodszych konsumentów. Kiedy produkt sprzedaje się zgodnie z oczekiwaniami, obserwujemy znaczny dryf cech w odniesieniu do cechy Age (Wiek).

Wykres słupkowy pokazujący sprzedaż firmy, która jest bardziej równomiernie rozłożona, przy czym jest atrakcyjna w równiejszym stopniu dla konsumentów w każdym wieku.

Wykres słupkowy pokazujący rozkład zakupów produktów według wieku po wprowadzeniu przez firmę nowego produktu.

Monitorowanie dryfu danych w AutoML

AutoML ma wbudowane narzędzia, które pomagają wykrywać dryf danych w poszczególnych cechach w ramach wdrożonych modeli. Więcej informacji zawiera temat Monitorowanie dryfu danych we wdrożonych modelach.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!