Tworzenie i konfigurowanie eksperymentu szeregów czasowych
Pierwszym krokiem jest utworzenie i skonfigurowanie eksperymentu szeregów czasowych. Użyjesz przesłanego wcześniej zbioru danych treningowych do wytrenowania modelu, dopóki nie będzie on gotowy do wdrożenia w celu tworzenia prognoz.
Tworzenie nowego eksperymentu
Wykonaj następujące czynności:
-
Przejdź do strony Tworzenie w Analytics centrum aktywności i wybierz Eksperyment ML.
-
Wprowadź nazwę eksperymentu, na przykład Prognozy sprzedaży.
-
Opcjonalnie dodaj opis i tagi.
-
Wybierz przestrzeń dla swojego eksperymentu. Może to być Twoja przestrzeń prywatna lub przestrzeń udostępniona.
-
Kliknij Utwórz.
-
Wybierz plik treningowego zbioru danych ML - Multivariate forecasting - training.csv.
Eksperyment ML z wybranym treningowym zbiorem danych szeregów czasowych.

Konfigurowanie ustawień prognozowania szeregów czasowych
Krok 1: Wybór celu
Zacznij od zdefiniowania kolumny docelowej. Chcemy prognozować przyszłą sprzedaż, więc wybierz tę kolumnę jako cel.
Wykonaj następujące czynności:
-
W obszarze
Widok schematu kliknij przycisk opcji obok pozycji sales. Przycisk zostanie zastąpiony ikoną celu
.
Wybór kolumny docelowej dla eksperymentu szeregów czasowych.

Krok 2: Konfigurowanie eksperymentu jako eksperymentu szeregów czasowych
Wykonaj następujące czynności:
-
Kliknij
Wyświetl konfigurację, aby rozwinąć panel konfiguracji eksperymentu, jeśli nie jest jeszcze otwarty.
-
Rozwiń sekcję Ustawienia eksperymentu.
-
W obszarze Typ eksperymentu wybierz Szeregi czasowe. Ta opcja pojawia się dopiero po wybraniu kolumny numerycznej o wysokiej kardynalności.
Krok 3: Wybór indeksu daty
Następnie należy wybrać kolumnę indeksu szeregów czasowych, która ma zostać użyta.
Wykonaj następujące czynności:
-
W panelu konfiguracji pojawi się nowa sekcja Ustawienia szeregów czasowych. W obszarze Indeks daty kliknij menu rozwijane, aby je rozwinąć.
-
Wybierz date.
Panel konfiguracji eksperymentu z wybraną opcją Szeregi czasowe jako typem eksperymentu i kolumną date wybraną jako kolumna indeksu daty.

Krok 4: Ustawianie okna prognozy i luki
Po wybraniu indeksu daty w panelu pojawią się nowe informacje.
Przejdź do sekcji Na podstawie Twoich danych. Ta sekcja przedstawia zakres czasowy danych historycznych i umożliwia skonfigurowanie zakresu przyszłych dat, dla których chcesz uzyskać prognozy.
Wartość Szacowana maksymalna prognoza wynosi 180 dni. Te szacunki opierają się na dostępnych danych historycznych, gdzie okno prognozy stanowi ułamek wszystkich dostępnych danych historycznych. Reprezentuje ono maksymalną liczbę przyszłych kroków czasowych (w tym przypadku dni), dla których szacuje się możliwość prognozowania celu. Po uruchomieniu wersji treningu znanych będzie więcej informacji, a te szacunki zostaną zastąpione ostateczną maksymalną prognozą.
Opcja Żądany rozmiar okna prognozy określa, o ile kroków czasowych w przyszłość chcesz prognozować. Na przykład w tym samouczku ustawienie okna prognozy na 7 oznaczałoby, że model ma prognozować tydzień przyszłych dat docelowych.
Opcja Rozmiar luki prognozy określa liczbę kroków czasowych bezpośrednio po zakończeniu danych treningowych, dla których nie chcesz otrzymywać prognoz. Na przykład możesz chcieć prognozować sprzedaż tylko dla dat odległych o trzy lub więcej dni w przyszłość.
Wykonaj następujące czynności:
-
W sekcji Na podstawie Twoich danych ustaw opcję Żądany rozmiar okna prognozy na 7 kroków czasowych.
-
Ustaw opcję Żądany rozmiar luki prognozy na 3 kroki czasowe.
Krok 4: Wybór grup
Treningowy zbiór danych w tym samouczku jest przeznaczony do prognozowania wielowymiarowego. W przypadku prognozowania wielowymiarowego celem jest prognozowanie wartości docelowych wraz z innymi wymiarami, które zmieniają się bezpośrednio wraz z celem. Na przykład w tym samouczku dane zawierają wskaźniki sprzedaży śledzone indywidualnie dla każdego sklepu i rodziny produktów. Prognozowanie wielowymiarowe pozwala połączyć każdy z tych wymiarów — które w przeciwnym razie mogłyby wymagać trenowania jako osobne modele — w jeden eksperyment, umożliwiając modelom lepsze poznanie wzorców i interakcji między różnymi kohortami danych.
Eksperymenty wielowymiarowe konfiguruje się, wybierając maksymalnie dwie kolumny z danych treningowych, które mają być używane jako grupy.
Celem tego samouczku jest wytrenowanie modeli do uczenia się i prognozowania sprzedaży wraz z numerem sklepu i rodziną produktów, dlatego wybierz te dwie kolumny jako grupy.
Wykonaj następujące czynności:
-
Wybierz kolumny store_nbr and family jako Grupy.
Krok 5: Konfigurowanie współzmiennych (cech)
Terminy „współzmienna” i „cecha” są często używane synonimicznie w uczeniu maszynowym, ale w prognozowaniu szeregów czasowych w Qlik Predict termin „współzmienna” jest powszechnie używany i bardziej opisowy. W wielowymiarowym modelu szeregów czasowych wyróżnia się trzy typy współzmiennych: statyczne, przeszłe i przyszłe.
Współzmienne statyczne i przeszłe należą do Cech uwzględnianych w treningu eksperymentu, innych niż grupy, indeks daty i przyszłe cechy. Współzmienne statyczne i przeszłe są identyfikowane automatycznie przez system. Nie trzeba ich konfigurować poza uwzględnieniem ich jako cech (i unikaniem konfigurowania ich jako przyszłych cech).
Współzmienne przyszłe, czyli przyszłe cechy, również odnoszą się do Cech uwzględnianych w treningu. Przyszłe współzmienne to cechy, które mają przyszłe dane znane z góry — w szczególności masz dostęp do przyszłych wartości tej cechy obejmujących wybrany forecast horizon. W przypadku przyszłych cech musisz również znać wartości danych dla historycznego zakresu czasu, na którym trenowany jest model.
Oprócz uwzględnienia przyszłej cechy na liście treningowych Cech, należy ją również skonfigurować jako przyszłą cechę w panelu konfiguracji treningu. W momencie prognozowania model będzie oczekiwał danych przyszłych cech obejmujących horyzont prognozy w celu wygenerowania dokładnych prognoz.
W danych treningowych cecha onpromotion śledzi, ile produktów jest przecenionych po cenach promocyjnych dla określonej daty. Są to informacje znane z wyprzedzeniem i dostępne są dla nich przyszłe dane, więc można ich użyć jako przyszłej cechy.
Wykonaj następujące czynności:
-
Poniżej listy rozwijanej Grupy rozwiń sekcję Przyszłe cechy i wybierz onpromotion.
Podsumowując:
-
Kolumna onpromotion została wybrana jako przyszła cecha.
-
Poza indeksem daty do treningu nie wybrano żadnych innych współzmiennych.
Panel konfiguracji eksperymentu pokazujący skonfigurowane grupy, przyszłą cechę oraz podsumowanie wszystkich wybranych cech.

Poniższy diagram ilustruje pojęcia związane z prognozowaniem szeregów czasowych i ich powiązanie z konfiguracją eksperymentu. Więcej informacji na temat pojęć związanych z prognozowaniem szeregów czasowych można znaleźć w sekcji Praca z prognozowaniem szeregów czasowych wielu zmiennych.
Uproszczona ilustracja przedstawiająca składniki problemu prognozowania szeregów czasowych w Qlik Predict.

Potwierdzanie innych ustawień
Po zakończeniu konfiguracji szeregów czasowych przejrzyj pozostałe ustawienia treningu w panelu konfiguracji.
-
W obszarze Cechy widać, że wybrano cztery cechy.
-
W obszarze Algorytmy widać, że wybrano wszystkie dostępne algorytmy.
Trenowanie eksperymentu
Konfiguracja została zakończona i możemy rozpocząć trening.
Wykonaj następujące czynności:
-
Kliknij Urun eksperyment.
Po zakończeniu działania eksperymentu możemy przejść do następnego kroku, którym jest przejrzenie wynikowych metryk modelu.