Het maken en configureren van het tijdreeksexperiment
De eerste stap is het maken en configureren van een tijdreeksexperiment. U gebruikt de trainingsgegevensset die u eerder hebt geüpload om het model te trainen totdat het klaar is om te worden geïmplementeerd voor het doen van voorspellingen.
Een nieuw experiment maken
Doe het volgende:
-
Ga naar de pagina Maken van het Analyse activiteitencentrum en selecteer ML-experiment.
-
Voer een naam in voor uw experiment, bijvoorbeeld Verkoopprognoses.
-
Voeg eventueel een beschrijving en tags toe.
-
Kies een ruimte voor uw experiment. Dit kan uw persoonlijke ruimte of een gedeelde ruimte zijn.
-
Klik op Maken.
-
Selecteer het bestand met de trainingsgegevensset ML - Multivariate forecasting - training.csv.
ML-experiment met geselecteerde trainingsgegevensset voor tijdreeksen.

Instellingen voor tijdreeksprognoses configureren
Step 1: Select target
Begin met het definiëren van een doelkolom. We willen de toekomstige verkoop voorspellen, dus selecteer die kolom als het doel.
Doe het volgende:
-
Klik in
Schemaweergave op het keuzerondje naast sales. Een doel-pictogram
vervangt de knop.
De doelkolom selecteren voor het tijdreeksexperiment.

Step 2: Configure the experiment to be a time series experiment
Doe het volgende:
-
Klik op
Configuratie weergeven om het configuratiepaneel van het experiment uit te vouwen als dit nog niet is geopend.
-
Vouw Experimentinstellingen uit.
-
Selecteer onder Experimenttype de optie Tijdreeks. Deze optie verschijnt pas nadat u een numerieke kolom met hoge kardinaliteit hebt geselecteerd.
Step 3: Select a date index
Vervolgens moet u de te gebruiken indexkolom voor de tijdreeks selecteren.
Doe het volgende:
-
Er verschijnt een nieuwe sectie, Tijdreeksinstellingen, in het configuratiepaneel. Klik onder Datumindex op het vervolgkeuzemenu om dit uit te vouwen.
-
Selecteer date.
Configuratiepaneel van het experiment met Tijdreeks geselecteerd als experimenttype en date geselecteerd als de datumindexkolom.

Step 4: Set the forecast window and gap
Nadat u uw datumindex hebt geselecteerd, verschijnt er nieuwe informatie in het paneel.
Ga naar de sectie Op basis van uw gegevens. In deze sectie wordt het tijdsbereik van uw historische gegevens beschreven en kunt u het bereik van toekomstige datums configureren waarvoor u voorspellingen wilt doen.
De Geschatte maximale voorspelling is 180 dagen. Deze schatting is gebaseerd op de beschikbare historische gegevens, waarbij het voorspellingsvenster een fractie is van de totale beschikbare historische gegevens. Het vertegenwoordigt het maximale aantal toekomstige tijdstappen (in dit geval dagen) waarvoor u naar schatting het doel kunt voorspellen. Na het uitvoeren van een versie van de training is er meer informatie bekend en wordt deze schatting vervangen door een definitieve maximale voorspelling.
De Gewenste grootte van voorspellingsvenster stelt in hoeveel tijdstappen in de toekomst u wilt voorspellen. In deze zelfstudie geeft het instellen van het voorspellingsvenster op 7 bijvoorbeeld aan dat het model een week aan toekomstige doeldatums moet voorspellen.
De Grootte van voorspellingstussenruimte stelt het aantal tijdstappen in direct na het einde van uw trainingsgegevens waarvoor u geen voorspellingen wilt. U wilt bijvoorbeeld alleen de verkoop voorspellen voor datums die drie of meer dagen in de toekomst liggen.
Doe het volgende:
-
Stel in de sectie Op basis van uw gegevens de Gewenste grootte van voorspellingsvenster in op 7 tijdstappen.
-
Stel de Gewenste grootte van voorspellingstussenruimte in op 3 tijdstappen.
Step 4: Select groups
De trainingsgegevensset voor deze zelfstudie is ontworpen voor multivariate voorspellingen. Bij multivariate voorspellingen is het doel om doelwaarden te voorspellen samen met andere dimensies die rechtstreeks met het doel variëren. In deze zelfstudie bevatten de gegevens bijvoorbeeld verkoopstatistieken die afzonderlijk worden bijgehouden voor elke winkel en productfamilie. Met multivariate voorspellingen kunt u elk van deze dimensies — die anders mogelijk als afzonderlijke modellen zouden moeten worden getraind — combineren in één experiment, waardoor modellen meer kunnen leren over patronen en interacties tussen verschillende cohorten van gegevens.
U configureert multivariate experimenten door maximaal twee kolommen uit de trainingsgegevens te selecteren om als groepen te gebruiken.
Het doel van deze zelfstudie is om modellen te trainen om de verkoop te leren en te voorspellen samen met het winkelnummer en de productfamilie, dus selecteer deze twee kolommen als groepen.
Doe het volgende:
-
Selecteer store_nbr en family als Groepen.
Step 5: Configure covariates (features)
De termen "covariabele" en "functie" worden in machine learning vaak als synoniemen gebruikt, maar bij tijdreeksprognoses in Qlik Predict is de term "covariabele" gebruikelijker en beschrijvender. In een multivariaat tijdreeksmodel zijn er drie soorten covariabelen: statisch, verleden en toekomst.
Statische covariabelen en covariabelen uit het verleden behoren tot de Functies die u opneemt in de training van het experiment, naast de groepen, datumindex en toekomstige functies. Statische covariabelen en covariabelen uit het verleden worden automatisch door het systeem geïdentificeerd. U hoeft deze niet te configureren, behalve ze op te nemen als functies (en te voorkomen dat u ze configureert als toekomstige functies).
Toekomstige covariabelen, of toekomstige functies, verwijzen ook naar Functies die u opneemt in de training. Toekomstige covariabelen zijn functies met toekomstige gegevens die u vooraf weet — in het bijzonder hebt u toegang tot toekomstige waarden voor deze functie die uw geselecteerde voorspellingshorizon beslaan. Voor toekomstige functies moet u ook de gegevenswaarden kennen voor het historische tijdsbereik waarop het model is getraind.
Naast het opnemen van een toekomstige functie in de lijst met trainingsFuncties, moet u deze ook configureren als een toekomstige functie in het trainingsconfiguratiepaneel. Op het moment van voorspellen verwacht het model gegevens van toekomstige functies die de voorspellingshorizon beslaan om nauwkeurige voorspellingen te genereren.
In de trainingsgegevens houdt de functie onpromotion bij hoeveel producten op de opgegeven datum zijn afgeprijsd tegen actietarieven. Dit is informatie die vooraf bekend is en waarvoor toekomstige gegevens beschikbaar zijn, zodat deze kan worden gebruikt als een toekomstige functie.
Doe het volgende:
-
Vouw onder de vervolgkeuzelijst Groepen de optie Toekomstige functies uit en selecteer onpromotion.
Samengevat:
-
onpromotion is geselecteerd als een toekomstige functie.
-
Behalve de datumindex zijn er geen andere covariabelen geselecteerd voor de training.
Configuratiepaneel van het experiment met geconfigureerde groepen, toekomstige functie en een overzicht van alle geselecteerde functies.

Het volgende diagram illustreert concepten voor tijdreeksprognoses en hoe deze zich verhouden tot de experimentconfiguratie. Zie voor meer informatie over concepten voor tijdreeksprognoses Werken met multivariate tijdreeksvoorspelling.
Vereenvoudigde illustratie die de componenten schetst van een probleem met tijdreeksprognoses in Qlik Predict.

Overige instellingen bevestigen
Nu u de tijdreeksconfiguraties hebt voltooid, controleert u de resterende trainingsinstellingen in het configuratiepaneel.
-
Onder Functies ziet u dat er vier functies zijn geselecteerd.
-
Onder Algoritmen ziet u dat alle beschikbare algoritmen zijn geselecteerd.
Het experiment trainen
De configuratie is voltooid en we zijn klaar om de training te starten.
Doe het volgende:
-
Klik op Experiment uitvoeren.
Wanneer het experiment is voltooid, kunnen we doorgaan naar de volgende stap: het bekijken van de resulterende modelstatistieken.