Praca z predykcjami dla modeli szeregów czasowych
Po wdrożeniu modelu szeregów czasowych można go użyć do tworzenia predykcji na nowych danych. Aby utworzyć predykcje szeregów czasowych, przygotuj zestaw danych do zastosowania zawierający wymagane dane i strukturę. Szczegółowe informacje można znaleźć w sekcji Przygotowanie zestawu danych aplikacyjnych.
Mechanizm predykcji
Proces predykcji dla modeli szeregów czasowych różni się nieco od modeli klasyfikacji i regresji.
Modele klasyfikacji i regresji przewidują przyszłe wartości dla całej kolumny, która nie istnieje lub jest nieznana w zbiorze danych zastosowania. Na przykład załóżmy, że masz model klasyfikacji binarnej, który przewiduje przyszłe wartości kolumny Rezygnacja. Zbiór danych zastosowania zazwyczaj nie będzie zawierał kolumny Rezygnacja, a jeśli jest ona obecna, zostanie zignorowana — zamiast tego wartości dla tej kolumny są generowane przez model jako predykcje.
Z drugiej strony, w przypadku modelu szeregów czasowych predykcje są tworzone jako wiersze, a nie kolumny. Predykcje są nadal generowane dla kolumny docelowej, ale są to rekordy odpowiadające określonym przyszłym wartościom czasu. Struktura kolumn nie zmienia się między zbiorami danych uczących i zastosowania.
Ponadto zbiór danych zastosowania dla modelu klasyfikacji lub regresji nie powinien zawierać żadnej wartości docelowej, dla której chcesz wygenerować predykcje. Z drugiej strony zbiór danych zastosowania dla modelu szeregów czasowych musi zawierać pewne historyczne wartości docelowe i wartości cech, odpowiadające oknu zastosowania dla modelu. Wymagania te zostały dokładniej określone w Przygotowanie zestawu danych aplikacyjnych.
Dostępne narzędzia do tworzenia zestawu danych do zastosowania
Następujące narzędzia są dostępne w Qlik Cloud, aby pomóc Ci budować i dynamicznie generować zestawy danych:
-
Skrypty Qlik, dostępne w narzędziu Edytor ładowania danych w aplikacjach, a także samodzielny edytor skryptów dostępny z centrum aktywności Analytics.
-
Przepis na tabelę, dostępny jako samodzielne narzędzie w centrum aktywności Analytics. Przepis na tabelę jest przeznaczony do tworzenia zestawów danych z jedną tabelą, takich jak te używane w uczeniu maszynowym.
Ładowanie i przygotowywanie danych za pomocą przepisu na tabelę
-
Przepływ danych, dostępny jako samodzielne narzędzie z centrum aktywności Analytics.
Ładowanie i przygotowywanie danych przy użyciu Przepływu danych
-
Menedżer danych w aplikacjach analitycznych.
Ładowanie danych i zarządzanie nimi za pomocą Menedżera danych
Często wymagane operacje
Zmiana typów cech
Możliwe, że podczas przygotowywania zestawu danych do zastosowania konieczne będzie przekształcenie kolumn w celu zmodyfikowania ich typów cech.
Najczęstszym przykładem jest sytuacja, w której masz kolumnę numeryczną skonfigurowaną jako grupa w modelu. Po wybraniu cechy jako grupy w eksperymencie jej typ cechy jest automatycznie zmieniany na kategoryczny, jeśli jeszcze taki nie jest, aby można było ją traktować jako grupę. Po dodaniu zestawu danych do zastosowania dla predykcji dane w kolumnie prawdopodobnie nadal zawierają numeryczne dane cech, więc konieczna będzie zmiana kolumny na dane ciągów znaków, aby została zidentyfikowana jako cecha kategoryczna. Przekształcenie to można łatwo wykonać za pomocą skryptów Qlik — używając funkcji text() — lub za pomocą innych narzędzi do przygotowywania danych Qlik, takich jak przepis na tabelę i przepływ danych.
Przykład użycia skryptów Qlik można znaleźć w sekcji Przygotowanie zestawu danych.
Ponowne trenowanie modelu
Jeśli musisz utworzyć predykcje dla nowych wartości grup (które nie były obecne w danych treningowych), musisz wytrenować nowy model na danych treningowych, które obejmują te nowe wartości grup. Więcej informacji można znaleźć w sekcji Przygotowanie zestawu danych aplikacyjnych.
Brakujące wartości grup w czasie predykcji
Podczas predykcji za pomocą wdrożonego modelu szeregów czasowych brakujące wartości grup są obsługiwane inaczej w zależności od tego, czy te wartości dotyczą grup podstawowych czy drugorzędnych. Więcej informacji i obejścia można znaleźć w sekcji Przygotowanie zestawu danych aplikacyjnych.
Ograniczenia
-
Monitorowanie dryfu danych nie jest dostępne dla modeli szeregów czasowych.
-
Zestawy danych SHAP nie mogą być generowane podczas przewidywań z modelami szeregów czasowych.
-
Łącznik Qlik Predict analityczny nie obsługuje modeli szeregów czasowych.
Ograniczenia związane z eksperymentami szeregów czasowych można znaleźć w sekcji Ograniczenia i uwagi.