Ga naar hoofdinhoud Ga naar aanvullende inhoud

Het tijdreeksexperiment maken en configureren

De eerste stap is om het tijdreeksexperiment te maken en configureren. U gebruikt de gegevensverzameling voor training die u eerder hebt geüpload om het model te trainen tot het klaar is om te worden ingezet om voorspellingen te maken.

Een nieuw experiment maken

  1. Ga naar de pagina Maken van het Analyse-activiteitencentrum en selecteer ML-experiment.

  2. Voer een naam in voor uw experiment, bijvoorbeeld, Sales forecasts.

  3. Voer desgewenst een beschrijving en tags in.

  4. Kies een ruimte voor uw experiment. Dit kan uw persoonlijke ruimte of een gedeelde ruimte zijn.

  5. Klik op Maken.

  6. Selecteer het bestand van de trainingsgegevensverzameling ML - Multivariate forecasting - training.csv.

ML-experiment met geselecteerde tijdreeks trainingsdataset.

ML-experiment met geselecteerde tijdreeks trainingsdataset.

Parameters voor tijdreeksprognose configureren

Stap 1: doel selecteren

Begin met het definiëren van een doelkolom. We willen toekomstige verkopen voorspellen, dus selecteer die kolom als het doel.

  • In Tabelrijen Schemaweergave, klikt u op het keuzerondje naast sales. Een doel-Doelpictogram vervangt de knop.

Selecteer de doelkolom voor het tijdreeksexperiment.

De doelkolom selecteren voor het tijdreeksexperiment.

Stap 2: het experiment configureren als een tijdreeksexperiment

  1. Klik op Schema Configuratie weergeven om het venster voor experimentconfiguratie uit te vouwen als het nog niet is geopend.

  2. Vouw Doel en experimenttype uit.

  3. Onder Experimenttype selecteert u Tijdreeks. Deze optie verschijnt alleen na het selecteren van een numerieke kolom met hoge cardinaliteit.

Stap 3: selecteer een datumindex

Vervolgens moet u de te gebruiken tijdreeksindexkolom selecteren.

  1. Nog steeds in de sectie Doel en experimenttype van het configuratievenster, onder Datumindex, klikt u op het vervolgkeuzemenu om het uit te vouwen.

  2. Selecteer date.

Configuratievenster van het experiment met Tijdreeks geselecteerd als experimenttype en date geselecteerd als de datumindexkolom.

Het selecteren van het experimenttype en de datumindex voor het experiment

Nadat u uw datumindex hebt geselecteerd, is er nieuwe informatie verschenen in het venster.U kunt nu Groepen en Toekomstige functies configureren en de prognose-instellingen aanpassen.

Stap 4: groepen selecteren

De trainingsgegevensverzameling voor deze zelfstudie is ontworpen voor multivariate prognoses. Bij multivariate prognoses is het doel om doelwaarden te voorspellen naast andere dimensies die direct variëren naast het doel. In deze zelfstudie bevatten de gegevens bijvoorbeeld verkoopstatistieken die afzonderlijk worden bijgehouden voor elke winkel en productfamilie. Multivariate prognoses stellen u in staat om elk van deze dimensies — die anders als afzonderlijke modellen getraind zouden moeten worden — te combineren in één enkel experiment, waardoor modellen meer kunnen leren over patronen en interacties tussen verschillende cohorten van gegevens.

U configureert multivariate experimenten door maximaal twee kolommen uit de trainingsgegevens te selecteren om als groepen te gebruiken.

Het doel van deze zelfstudie is om modellen te trainen om verkopen te leren en te voorspellen naast winkelnummer en productfamilie, dus selecteer deze twee kolommen als groepen.

  • Selecteer store_nbr en family als Groepen.

Informatie Als er geen groep expliciet is geselecteerd, zoekt het model automatisch naar een geschikte groepering met alleen categorische functies. Zodra een geldige groep is geïdentificeerd, gaat het proces verder met trainen. Als we willen dat het systeem automatisch detecteert store_nbr als een geldige groepskolom, moet het worden gemarkeerd als een categorische functie.

Stap 5: covariaten (functies) configureren

De termen "covariaat" en "functie" worden vaak synoniem gebruikt in machine learning, maar in tijdreeksprognoses in Qlik Predict wordt de term "covariaat" vaker gebruikt en is deze beschrijvender. In een multivariate tijdreeksmodel zijn er drie typen covariaten: statisch, verleden en toekomst.

Statische en verleden covariaten behoren tot de functies die u opneemt in de experimenttraining, afgezien van de groepen, datumindex en toekomstige functies. Statische covariaten en covariaten uit het verleden worden automatisch door het systeem geïdentificeerd. U hoeft deze niet verder te configureren en alleen maar op te nemen als functies (configureer ze niet als toekomstige functies).

Toekomstige covariaten, of toekomstige functies, verwijzen ook naar functies die u opneemt in de training. Toekomstige covariaten zijn functies die toekomstige gegevens hebben die u van tevoren weet — in het bijzonder hebt u toegang tot toekomstige waarden voor deze functie die uw geselecteerde prognosehorizon overspannen. Voor toekomstige functies moet u ook de gegevenswaarden weten voor het historische tijdsbereik waarop het model is getraind.

Naast het opnemen van een toekomstige functie in de lijst met trainingsfuncties, moet u deze ook configureren als een toekomstige functie in het configuratievenster voor training. Tijdens de voorspelling verwacht het model toekomstige functiegegevens die de prognosehorizon overspannen om nauwkeurige voorspellingen te genereren.

In de trainingsgegevens houdt de onpromotion-functie bij hoeveel producten worden afgeprijsd tegen promotietarieven voor de opgegeven datum. Dit is informatie die van tevoren bekend is, en er zijn toekomstige gegevens voor beschikbaar, dus het kan worden gebruikt als een toekomstige functie.

  • Onder de vervolgkeuzelijst Groepen, vouwt u Toekomstige functies uit en selecteert u onpromotion.

Samenvattend:

  • onpromotion is geselecteerd als een toekomstige functie.

  • Behalve de datumindex zijn er geen andere covariaten geselecteerd voor de training.

Stap 6: stel het voorspellingsvenster en de kloof in

Nadat u uw datumindex hebt geselecteerd, is er nieuwe informatie verschenen in het venster.

Ga naar de sectie Op basis van uw gegevens. Deze sectie beschrijft het tijdsbereik van uw historische gegevens en stelt u in staat om het bereik van toekomstige datums te configureren waarvoor u voorspellingen wilt.

De Verwachte maximum prognose is 180 dagen. Deze schatting is gebaseerd op de beschikbare historische gegevens, waarbij het prognosevenster een fractie is van de totale beschikbare historische gegevens. Het vertegenwoordigt het maximale aantal toekomstige tijdstappen (in dit geval dagen) waarvoor u naar schatting het doel kunt voorspellen. Nadat een versie van de training is uitgevoerd, is er meer informatie bekend en wordt deze schatting vervangen door een definitieve maximum prognose.

De Grootte prognosevenster stelt in hoeveel tijdstappen in de toekomst u wilt voorspellen. In deze zelfstudie geeft het instellen van het prognosevenster op 7 bijvoorbeeld aan dat het model een week aan toekomstige doeldatums moet voorspellen.

De Grootte prognosekloof stelt het aantal tijdstappen in direct na het einde van uw trainingsgegevens waarvoor u geen voorspellingen wilt. U wilt bijvoorbeeld alleen de verkoop voorspellen voor datums die drie of meer dagen in de toekomst liggen.

  1. In de sectie Op basis van uw gegevens, stelt u de Grootte prognosevenster in op 7 tijdstappen.

  2. Stel de Grootte prognosekloof in op 3 tijdstappen.

InformatieDe prognosehorizon is het prognosevenster plus de grootte prognosekloof gemeten in tijdstappen. In dit geval is de prognosehorizon 10, wat aangeeft dat u op het moment van de prognose 10 tijdstappen vooruit voorspelt, zelfs als er geen werkelijke waarden zijn vastgelegd voor die prognosekloof.

Configuratievenster van experimenten met geconfigureerde groepen, toekomstige functie en een samenvatting van alle geselecteerde functies.

Configuratievenster van experimenten met geconfigureerde groepen, toekomstige functie en een samenvatting van alle geselecteerde functies.

Het volgende diagram illustreert concepten voor tijdreeksprognose en hoe deze zich verhouden tot de experimentconfiguratie. Voor meer informatie over de concepten van tijdreeksprognoses gaat u naar Werken met multivariate tijdreeksvoorspelling.

Vereenvoudigde illustratie van de componenten van een tijdreeksprognoseprobleem in Qlik Predict.

Andere instellingen bevestigen

Nu u de tijdreeksconfiguraties hebt voltooid, controleert u de resterende trainingsinstellingen in het configuratievenster.

  • Onder Functies ziet u dat vier functies zijn geselecteerd.

  • Onder Algoritmen kunt u zien dat alle beschikbare algoritmen zijn geselecteerd.

Het experiment trainen

De configuratie is gereed en we zijn klaar om de training te starten.

  • Klik rechtsonderaan in het experimentvenster op Experiment uitvoeren.

Als het experiment is uitgevoerd, gaan we verder met de volgende stap: controle van de resulterende metrische gegevens van het model.

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een tikfout, een ontbrekende stap of een technische fout – laat het ons weten!