Werken met voorspellingen van multivariate tijdreeksen

Met Qlik Predict kunt u machine learning-modellen trainen om tijdspecifieke statistieken te voorspellen. Met behulp van op neurale netwerken gebaseerde methoden leren en voorspellen modellen complexe patronen met tijdspecifieke associaties, gegroepeerde doelgegevens, historische functies en bekende toekomstige variabelen. Om een tijdreeksvoorspelling te maken, bereidt u een trainingsgegevensset voor, gebruikt u deze in een tijdreeksexperiment, implementeert u een model en maakt u vervolgens toepassingsgegevenssets die u kunt gebruiken om voorspellingen te genereren.

Onderdelen van een tijdreeksprobleem

Bij het voorspellen van tijdreeksen is het doel om doelwaarden voor specifieke datums in de toekomst te voorspellen. U wilt bijvoorbeeld de verkoop voor de volgende week, maand of kwartaal voorspellen.

Definieer de volgende onderdelen bij het ontwikkelen van uw tijdreeksprobleem:

Doel en groepen
Datumindex
Voorspellingshorizon
Covariaten

Dit raamwerk beschrijft hoe u een machine learning-vraag definieert voor problemen met het voorspellen van tijdreeksen. Zie Definieer machine learning-vragen om machine learning-vragen te definiëren voor classificatie- en regressieproblemen.

Klik om op volledige grootte te bekijken — Vereenvoudigde illustratie met de onderdelen van een probleem met het voorspellen van tijdreeksen in Qlik Predict.

Doel

Net als bij andere experimenttypen is het doel de kolom waarvoor u wilt dat het model toekomstige waarden voorspelt. Voor tijdreeksexperimenten moet het doel numerieke gegevens bevatten, bijvoorbeeld verkoop of voorraad.

Als u groepen gebruikt in de tijdreeksvoorspelling, voorspellen modellen één doelwaarde per groep per tijdstap in het voorspellingsvenster. Als u geen groepen gebruikt, voorspellen uw getrainde modellen één doelwaarde voor elke tijdstap in het voorspellingsvenster.

Datumindex

De datumindex volgt de tijdreeksstatistieken over een continu tijdsinterval (tijdstap). U moet in een vroeg stadium beslissen over uw tijdstap: hoe vaak moet u toekomstige waarden voorspellen?

Specifiek is de datumindex een kolom die wordt weergegeven in uw trainings- en toepassingsgegevenssets voor tijdreeksproblemen. De datumindex bepaalt de structuur van beide toepassingsgegevenssets: elke rij vertegenwoordigt een stap in de tijd (of, met groepen, een stap in de tijd voor elke unieke groepering).

Wanneer u uw trainingsgegevensset toevoegt in een tijdreeksexperiment, worden mogelijke datumindexkolommen automatisch geïdentificeerd en aan u gepresenteerd als Inzichten op kolomniveau. U kunt ze identificeren aan de hand van het inzicht Mogelijke datumindex in de schemaweergave.

Groepen

Groepen zijn functies die categorische informatie bevatten waarvoor u afzonderlijk voorspellingen wilt genereren. Klassieke voorbeelden van groepen zijn winkelnummer en product, die gebruikt hadden kunnen worden om gegevens te ordenen voor een doel zoals verkoop. Door winkelnummer en producttype als groepen te selecteren, bieden uw tijdreeksmodellen voorspellingen voor elke afzonderlijke waarde in deze kolommen. Bijvoorbeeld, met een verkoopdoel, als u drie winkelnummers hebt — 1, 2 en 3 — en twee producttypen — kruidenierswaren en versproducten — genereert uw model verkoopvoorspellingen voor elke unieke combinatie van deze waarden.

U moet groepen opnemen in uw tijdreeksprobleem als u over de gegevens beschikt en individuele voorspellingen per categorie nodig hebt. Een ander voordeel van groepen is dat modellen globaal kunnen leren, waardoor ze de patronen die bestaan tussen de verschillende groeperingen die u definieert, beter begrijpen.

U kunt de groepen configureren die voor elke experimentversie moeten worden gebruikt. Als u geen groepen opgeeft, maar er wel groepen zijn geïdentificeerd in uw trainingsgegevensset, gebruikt de training groepen.

Groepen worden geïdentificeerd door gedupliceerde waarden in de datumindexkolom. Voor een datum van 14-1-2025 hebt u bijvoorbeeld twee records: één voor winkel A en de andere voor winkel B.

Elke groep in een tijdreeksexperiment — inclusief alleen het doel — wordt beschouwd als afzonderlijke tijdreeksen binnen uw gegevensset. Zie Wat is een tijdreeks?.

Primaire en secundaire groepen

Voor tijdreeksproblemen met twee groepskolommen is de ene groep de primaire groep en de andere de secundaire groep. Zie voor voorbeelden Een trainingsgegevensset voorbereiden, Voorbeeld van trainingsgegevensset — twee groepen en Voorbeeld van toepassingsgegevensset — twee groepen.

De primaire groepering definieert onafhankelijke tijdreeksen. Elke winkel wordt bijvoorbeeld een eigen afzonderlijke tijdreeks, waardoor het model verschillend gedrag en patronen in winkels kan leren.

De secundaire groepering wordt anders behandeld. In plaats van volledig afzonderlijke reeksen te maken, draait het systeem die waarden naar extra functies (covariaten), waardoor gerelateerde subreeksen contextuele informatie aan elkaar kunnen bieden.

U hoeft over het algemeen niet te weten welke groep de primaire en welke de secundaire is, hoewel u optioneel een primaire groep in uw experiment kunt kiezen. Er gelden bepaalde overwegingen voor het voorspellen met geïmplementeerde tijdreeksmodellen—zie Een toepassingsgegevensset voorbereiden.

Alle primaire groepen moeten dezelfde secundaire groepen delen. Als winkels bijvoorbeeld primaire groepen zijn en producten secundaire groepen, moet elke winkel dezelfde set producten bevatten. Ontbrekende secundaire groepen zouden leiden tot inconsistente functiedimensies in tijdreeksen.

Als u verwacht dat secundaire groepswaarden niet overeenkomen met primaire groepswaarden op het moment van voorspellen, is een mogelijke benadering om de oorspronkelijke primaire en secundaire groepswaarden te combineren in een nieuwe groeperingskolom en deze als de primaire groep te gebruiken bij het opnieuw trainen van het model. In deze opzet is het model niet langer afhankelijk van secundaire groepen, maar kan gecorreleerde informatie tussen groepen worden verminderd.

Voorspellingshorizon

De voorspellingshorizon specificeert hoe ver in de toekomst u wilt voorspellen. De voorspellingshorizon bestaat uit het voorspellingsvenster (het aantal tijdstappen waarvoor u voorspellingen nodig hebt) en de voorspellingskloof (een optioneel aantal tijdstappen na uw historische gegevens waarvoor u geen voorspellingen wilt).

U stelt het voorspellingsvenster en de kloofgrootte in bij het configureren van een experimentversie. Deze waarden worden zowel gebruikt tijdens het trainen van modellen als bij het genereren van voorspellingen uit modellen die zijn geïmplementeerd als ML-implementaties.

Het voorspellingsvenster is het aantal tijdstappen waarvoor u in de toekomst wilt voorspellen. Als uw tijdstap bijvoorbeeld één dag is en u de verkoop voor de komende twee weken wilt voorspellen, stelt u uw voorspellingsvenster in op 14.

De voorspellingskloof is de hoeveelheid tijd in de toekomst waarvoor u geen voorspellingen nodig hebt. Het instellen van een voorspellingskloof is optioneel, omdat u er misschien wel of geen nodig hebt. De voorspellingskloof begint aan het einde van de geregistreerde historische trainingsgegevens die u hebt verstrekt. Het voorspellingsvenster begint waar de voorspellingskloof eindigt.

U wilt bijvoorbeeld toekomstige verkopen voorspellen, maar u bent alleen geïnteresseerd in toekomstige verkopen voor datums later dan één week na het einde van uw invoergegevens. In dit geval, met een tijdstap van dagen, kunt u uw voorspellingskloofgrootte instellen op zeven tijdstappen.

Uw geselecteerde voorspellingsvenster, naast de hoeveelheid trainingsgegevens die u hebt, beperkt hoe ver in de toekomst u kunt voorspellen. Zie Maximaal voorspellingsvenster voor meer informatie.

Covariaten

In tijdreeksproblemen worden functies vaak covariaten genoemd. Net als bij andere machine learning-problemen zijn covariaten de andere variabelen waarvan u vermoedt dat ze invloed hebben op de uitkomst van het doel. Elke covariaat wordt weergegeven als een enkele kolom in uw trainingsgegevensset.

Bij het voorspellen van tijdreeksen zijn er verschillende soorten covariaten en ze hebben enkele belangrijke verschillen:

Statische covariaten: Kolommen die niet variëren in de loop van een tijdreeks. Statische covariaten zijn van toepassing in tijdreeksexperimenten waarbij groepen worden gebruikt. Stel bijvoorbeeld dat u groepen hebt voor Product en Winkelnummer, en er is een functie Standaardkorting. Als Product A in Winkel 1 een standaardkorting van 10% heeft en Product B in Winkel 2 een standaardkorting van 20% heeft, zou Standaardkorting een statische covariaat zijn. Dat wil zeggen, het varieert niet binnen de gegevens voor de groep waarin het voorkomt.

Statische covariaten worden automatisch gedetecteerd uit historische functies die u in het experiment opneemt. U hoeft niet aan te geven welke functies statische covariaten zijn.
Eerdere covariaten: Tijdsafhankelijke variabelen die alleen beschikbaar zijn in de historische gegevens en die variëren in deze gegevens. Eerdere covariaten worden automatisch gedetecteerd uit historische functies die u in het experiment opneemt. U hoeft niet expliciet aan te geven welke functies eerdere covariaten zijn.
Toekomstige covariaten: Toekomstige covariaten, ook wel bekend als toekomstige functies, zijn tijdsafhankelijke variabelen waarvan u de toekomstige waarden binnen de voorspellingshorizon zult kennen. Wanneer u toekomstige covariaten in de training gebruikt, moet u deze aangeven als toekomstige functies in de trainingsconfiguratie.

Toekomstige functies

Met toekomstige functies kunt u extra gegevens aan uw modellen verstrekken over toekomstige informatie die u al kent of redelijkerwijs kunt verwachten. In het bijzonder hebt u toegang tot toekomstige waarden voor deze functie die uw geselecteerde voorspellingshorizon beslaan. Bij het definiëren van toekomstige functies moet u zowel historische als toekomstige gegevens verstrekken.

Voor een model dat statistieken voorspelt die kunnen worden beïnvloed door toekomstige kortingen die door een winkel worden aangeboden, kunt u bijvoorbeeld de historisch waargenomen kortingen opnemen, evenals de kortingen voor toekomstige tijdsperioden binnen het voorspellingsvenster. Andere voorbeelden van toekomstige functies kunnen weers- of kalenderinformatie zijn.

Andere belangrijke concepten

Deze sectie schetst concepten die relevant zijn voor uw tijdreeksprobleem, maar die u niet rechtstreeks configureert in een experiment of ML-implementatie. Dit zijn eigenschappen die worden gedefinieerd door uw gegevens of door andere eigenschappen die u voor het model configureert.

Tijdstappen

De tijdstap wordt gedefinieerd door uw trainingsgegevensset en is belangrijk voor zowel training als voorspellingen.

In uw trainingsgegevensset is de tijdstap het interval waarmee de gegevens in uw datumindex worden geregistreerd. De tijdstap kan bijvoorbeeld dagelijks, elk uur, elke minuut of elke seconde zijn. De kleinste gedetecteerde tijdstap is milliseconden.

Het is belangrijk om op de hoogte te zijn van de tijdstap die in uw trainingsgegevens wordt gebruikt. Andere experimentparameters die u definieert, zoals voorspellingsvenster en voorspellingskloofgrootte, volgen dit tijdstapinterval.

Na het implementeren van uw model moeten de toepassingsgegevens waarvoor u voorspellingen wilt maken, dezelfde tijdstap volgen als gedefinieerd in de trainingsgegevensset.

Kwaliteit

Wanneer u een trainingsgegevensset selecteert, leidt het systeem de gebruikte tijdstap af. Als er enkele ontbrekende waarden of hiaten in de datumindex zijn, kunnen kolommen zoals doel, groepen en covariaten vaak automatisch door het systeem worden geïnterpoleerd. Terugkerende hiaatpatronen veroorzaakt door ontbrekende waarden worden automatisch afgehandeld en introduceren op zichzelf geen nieuwe tijdstap. Als uw gegevens echter echt gemengde registratie-intervallen bevatten tot het punt waarop verschillende oorspronkelijke tijdstappen worden gedetecteerd, moeten de gegevens eerst worden gecorrigeerd. Als u bijvoorbeeld meerdere maanden aan gegevens hebt die eenmaal per dag zijn geregistreerd, maar er is een sectie waarin gegevens consequent wekelijks worden geregistreerd, kan de gegevensset niet worden gebruikt omdat er meerdere tijdstappen worden gedetecteerd.

Toepassingsvenster

Het toepassingsvenster, of de terugkijkperiode, is het gedeelte van de trainingsgegevens dat het algoritme kan gebruiken om de voorspellingen te leveren voor uw opgegeven voorspellingsvenster.

Het toepassingsvenster wordt berekend en ingesteld door het systeem. Het wordt gemeten in tijdstappen. Het toepassingsvenster wordt gedefinieerd door wat u instelt als het voorspellingsvenster en de kloof (voorspellingshorizon). Uw toepassingsvenstergrootte wordt weergegeven in het experimentconfiguratiepaneel en de Samenvatting modeltraining, na het uitvoeren van ten minste één experimentversie. Het wordt ook weergegeven in een ML-implementatie Modelschema bij het maken of bewerken van een batchvoorspellingsconfiguratie.

Het toepassingsvenster wordt automatisch geïdentificeerd op basis van uw trainingsconfiguratie. Om voorspellingen te genereren voor een bepaald voorspellingsvenster, moet u de historische gegevens verstrekken die ten minste uw toepassingsvenster beslaan. Dit wordt verstrekt in uw toepassingsgegevensset. Zie Een toepassingsgegevensset voorbereiden.

Maximaal voorspellingsvenster

Het maximale voorspellingsvenster wordt geschat terwijl u uw tijdreeksexperiment configureert. Nadat u een versie van de training hebt uitgevoerd, wordt het maximale voorspellingsvenster met zekerheid bevestigd. Het maximale voorspellingsvenster wordt aan u weergegeven als de Geschatte maximale voorspelling of Maximale voorspelling onder Op basis van uw gegevens, wanneer u Doel en experimenttype opent in het experimentconfiguratiepaneel. Het maximale voorspellingsvenster is het maximale aantal tijdstappen waarvoor u voorspellingen kunt genereren, gezien uw gekozen voorspellingsvenster, hoeveel historische gegevens u hebt verstrekt en de minimale steekproefomvang die door het systeem wordt verwacht. Hoe meer historische gegevens u verstrekt, hoe verder in de tijd u kunt voorspellen. Om betrouwbare voorspellingen te genereren, is het echter belangrijk om een redelijk voorspellingsvenster te selecteren.

Het maximale prognosevenster kan maximaal 180 tijdstappen bedragen.

Voorspellingsafsluitingstijd

De voorspellingsafsluitingstijd is vooral belangrijk bij het definiëren van uw toepassingsgegevensset tijdens voorspellingen. De voorspellingsafsluitingstijd is de laatste datum in uw steekproef waarvoor u een doelwaarde hebt. In wezen zijn datums na deze afsluitingstijd de datums waarvoor u voorspellingen wilt genereren.

Wat is een tijdreeks?

Bij het voorspellen van tijdreeksen in Qlik Predict wordt elke groep — inclusief alleen het doel — beschouwd als afzonderlijke tijdreeksen binnen de trainingsgegevensset. Stel bijvoorbeeld dat uw trainingsgegevensset verkoopstatistieken bevat. Deze verkoopstatistieken zijn gedefinieerd voor elke winkel en elk producttype. Met de kolommen Winkel en Producttype gedefinieerd als groepen, zijn er drie tijdreeksen in de trainingsgegevensset.

Een trainingsgegevensset voorbereiden

Voor voorspellingen van multivariate tijdreeksen moet uw trainingsgegevensset de volgende kolommen bevatten:

Datumindex
Doelkolom
Groepskolommen (optioneel)
Functiekolommen (optioneel—zonder functies traint u een univariaat voorspellingsmodel)

Datumindexkolom

U hebt een datumindex nodig die volledige datums of tijdstempels bevat. Deze kolom is de chronologische index waarlangs de doel- en covariaatstatistieken worden bijgehouden. De datumindexkolom ordent de op tijd gebaseerde metingen opeenvolgend langs een consistent tijdsinterval (de tijdstap).

De datumindexkolom is als volgt georganiseerd, afhankelijk van of u wel of geen groepen gebruikt:

Geen groepen: Een enkele record voor elke tijdstap. Bij een dagelijkse voorspelling vertegenwoordigt elke rij bijvoorbeeld één dag.
Met groepen: Een of meer gedupliceerde vermeldingen voor elke tijdstap, afhankelijk van de gebruikte groepen.

Bij een multivariate trainingsgegevensset zijn er een of meer gedupliceerde vermeldingen voor elke tijdstap, afhankelijk van de gebruikte groepen. Er is flexibiliteit in de tijdstap die u gebruikt — u kunt bijvoorbeeld datums een of meer keren op dagelijkse, wekelijkse of maandelijkse basis registreren, enzovoort.

Ontbrekende of inconsistent geregistreerde waarden in deze kolom zijn soms acceptabel, als ze kunnen worden geïnterpoleerd, en terugkerende hiaatpatronen met ontbrekende waarden worden automatisch afgehandeld. Uw datumindexwaarden kunnen echter niet meerdere verschillende oorspronkelijke tijdstappen bevatten. Als het interval bijvoorbeeld is vastgesteld op eenmaal per dag, maar op een gegeven moment wordt een interval van tweemaal per dag geïdentificeerd, treedt er een fout op tijdens de training.

Doelkolom en groepskolommen

Uw gegevensset moet een doelkolom hebben met een numerieke statistiek die u wilt voorspellen. Een veelvoorkomend voorbeeld is verkoop.

Als u groepen gebruikt, verstrekt u historische doelwaarden voor elke mogelijke waarde in groepen die u toevoegt. Als uw doel bijvoorbeeld Verkoop is en u een groep Winkelnummer toevoegt die gegevens bevat voor Winkel A en Winkel B, moet uw gegevensset twee afzonderlijke records bevatten voor elke tijdstap: één met de verkoopwaarde voor Winkel A en de andere met de verkoopwaarde voor Winkel B.

Als u twee groepen hebt, zorg er dan voor dat alle primaire groepen dezelfde secundaire groepen delen. Zie Primaire en secundaire groepen.

Functiekolommen

U kunt een tijdreeksmodel trainen zonder covariaten. Als u echter covariaten opneemt, geef dan een kolom in de gegevensset op voor elke functie. Functiegegevens moeten over het algemeen historisch geregistreerde gegevens zijn, tenzij u toekomstige functies toevoegt. Toekomstige functiekolommen kunnen zowel historische als toekomstige gegevens bevatten. U moet alleen toekomstige functiegegevens in de trainingsgegevensset opnemen als u er zeker van bent dat de toekomstige waarden van deze kolom bekend zullen zijn wanneer u voorspellingen maakt.

Houd bij welke functies u als toekomstige functies gaat gebruiken, aangezien u deze als zodanig moet selecteren in de trainingsconfiguratie.

Gegevensvolume

Uw gegevensset moet voldoende records bevatten—het gegevensvolume wordt bepaald door het tijdsbereik dat door alle groepen wordt gedeeld. Alleen de gegevens uit deze overlappende periode worden gebruikt om het experiment te trainen.

Het volume van uw historische gegevens speelt een rol bij het bepalen hoe ver in de toekomst u kunt voorspellen. Uw gewenste voorspellingsvenster is ook van invloed op hoeveel historische gegevens u nodig hebt.

Over het algemeen is meer historische gegevens beter dan minder. De gegevens moeten echter van goede kwaliteit zijn en de gewenste trends vastleggen. Als de gegevens irrelevante informatie bieden of onnauwkeurigheden bevatten, is het niet nuttig om deze in het model te hebben. Overweeg een balans tussen het optimaliseren van het volume en het behouden van kwaliteit en relevantie.

Voorbeelden

De onderstaande tabel is een afgekapt voorbeeld van een trainingsgegevensset die geen groepen gebruikt.

In dit voorbeeld:

We willen twee weken aan dagelijkse verkopen voorspellen, zonder kloof. Merk op dat deze gewenste voorspellingshorizon en kloofgrootte niet rechtstreeks in de trainingsgegevens worden aangegeven, maar we bieden voldoende records zodat deze voorspellingshorizon in de configuratie kan worden gebruikt.
Date is de datumindex, met een tijdstap van 1 dag.
Sales is het doel, dat de totale dagelijkse verkoop bijhoudt.
Transactions Per Hour houdt het afgeronde gemiddelde aantal transacties bij dat per uur heeft plaatsgevonden. Dit is een eerdere covariaat, die alleen historische gegevens bevat. Deze informatie zal in de toekomst niet bekend zijn.
On Promotion houdt bij hoeveel producten op de opgegeven datum met korting worden aangeboden tegen actietarieven. Het kan worden gebruikt als een toekomstige functie, omdat in dit geval kortingen van tevoren bekend en gepland zijn. In dit geval verstrekken we alleen historische (eerdere) gegevens.

Afgekapt voorbeeld van trainingsgegevensset die geen groepskolommen bevat
ID	Date	On Promotion	Transactions per Hour	Sales
1	1/1/2024	0	301	90010.01
2	1/2/2024	100	291	19491.65
3	1/3/2024	0	163	70001.87
4	1/4/2024	14	499	50240.33
5	1/5/2024	55	211	106943.00
6	1/6/2024	2	309	131492.59
7	1/7/2024	1341	300	46349.49
8	1/8/2024	0	432	88203.08
9	1/9/2024	0	104	40254.95
10	1/10/2024	150	495	45964.44
11	1/11/2024	65	204	90185.50
12	1/12/2024	12	252	76340.25
13	1/13/2024	70	99	71311.11
14	1/14/2024	5	305	50396.70
...	...	...	...	...
610	9/1/2025	158	168	104205.33

De onderstaande tabel is een afgekapt voorbeeld van een trainingsgegevensset die twee groepskolommen gebruikt.

In dit voorbeeld:

We willen twee weken aan dagelijkse verkopen voorspellen, zonder kloof. Merk op dat deze gewenste voorspellingshorizongrootte niet rechtstreeks in de trainingsgegevens wordt aangegeven, maar we bieden voldoende records zodat deze voorspellingshorizon in de configuratie kan worden gebruikt.
Date is de datumindex, met een tijdstap van 1 dag.
Sales is het doel, dat de totale dagelijkse verkoop bijhoudt.
Store en Product zijn groepen. Voor elke unieke tijdstap in de trainingsgegevens worden afzonderlijke rijen opgenomen voor elke winkel en elk product.

In deze context is Store de primaire groep en Product de secundaire groep.
Transactions Per Hour houdt het gemiddelde aantal transacties bij dat per uur plaatsvindt, voor elke winkel en elk product. Het is een eerdere covariaat, die alleen historische gegevens bevat. Deze informatie zal in de toekomst niet bekend zijn.
On Promotion houdt bij hoeveel producten op de opgegeven datum met korting worden aangeboden tegen actietarieven, voor elke winkel en elk product. Het kan worden gebruikt als een toekomstige functie, omdat in dit geval kortingen van tevoren bekend en gepland zijn. In dit geval verstrekken we alleen historische (eerdere) gegevens.

Afgekapt voorbeeld van trainingsgegevensset die twee groepen bevat
Date	Store	Product	On Promotion	Transactions per Hour	Sales
1/1/2024	Store 1	A	0	343	90010.01
1/1/2024	Store 2	A	100	545	19491.65
1/1/2024	Store 3	A	0	1004	70001.87
1/1/2024	Store 1	B	14	305	39522.11
1/1/2024	Store 2	B	55	700	91859.30
1/1/2024	Store 3	B	2	94	19583.55
1/1/2024	Store 1	C	1341	267	194863.00
1/1/2024	Store 2	C	0	630	140244.13
1/1/2024	Store 3	C	0	1143	76666.66
1/2/2024	Store 1	A	56	576	30593.55
1/2/2024	Store 2	A	3	403	10549.33
1/2/2024	Store 3	A	14	1303	100003.33
1/2/2024	Store 1	B	29	593	105893.99
1/2/2024	Store 2	B	100	305	80195.22
1/2/2024	Store 3	B	0	305	61051.13
1/2/2024	Store 1	C	5	105	55938.38
1/2/2024	Store 2	C	33	72	104823.33
1/2/2024	Store 3	C	15	1052	99105.99
1/3/2024	Store 1	A	5	521	130533.31
1/3/2024	Store 2	A	1	205	67676.73
1/3/2024	Store 3	A	36	302	52745.45
1/3/2024	Store 1	B	111	502	99642.10
1/3/2024	Store 2	B	350	693	34660.34
1/3/2024	Store 3	B	34	200	60345.44
1/3/2024	Store 1	C	93	205	44603.33
1/3/2024	Store 2	C	60	295	105844.44
1/3/2024	Store 3	C	10	76	150385.44
...	...	...	...	...	...
9/10/2025	Store 1	A	15	1058	159383.33
9/10/2025	Store 2	A	20	402	80119.11
9/10/2025	Store 3	A	20	191	106020.00
9/10/2025	Store 1	B	39	100	39581.34
9/10/2025	Store 2	B	109	190	76939.23
9/10/2025	Store 3	B	37	99	49548.42
9/10/2025	Store 1	C	75	1555	93150.77
9/10/2025	Store 2	C	190	1603	15923.49
9/10/2025	Store 3	C	0	403	159342.05

Een toepassingsgegevensset voorbereiden

Nadat u een tijdreeksmodel hebt geïmplementeerd, moet u een toepassingsgegevensset ontwikkelen waarvoor voorspellingen worden gedaan.

Toepassingsgegevensset — Vereisten en validatie

Voor tijdreeksmodellen heeft de toepassingsgegevensset het volgende nodig:

Kolommen en kolomkoppen voor alle kolommen die zijn opgenomen in de trainingsdataset.
Dezelfde tijdstap als de trainingsdataset.
Alle groepen en groepswaarden die aanwezig waren in de trainingsdataset.

InformatieAls er nieuwe groepswaarden aanwezig zijn in de toepassingsdataset (die niet aanwezig waren in de trainingsgegevens), worden er geen voorspellingen gegenereerd voor deze rijen. Als er voorspellingen vereist zijn voor deze nieuwe groepswaarden, wordt aanbevolen om het model opnieuw te trainen met trainingsgegevens die deze bevatten.
Informatie
Tijdens de voorspelling of in de toepassingsdataset worden ontbrekende groepswaarden als volgt afgehandeld:
- De afwezigheid van primaire groep-waarden—waarop het model is getraind—is toegestaan.
- Ontbrekende secundaire groepswaarden zijn niet toegestaan. De voorspelling mislukt met een fout.
Het is het beste om indien mogelijk alle secundaire groepsgegevens te verzamelen en te verstrekken tijdens de voorspelling. Als echter wordt verwacht dat secundaire groepen voornamelijk ontbreken op het moment van voorspelling, is een mogelijke oplossing om het gebruik van secundaire groepen helemaal te vermijden.

In plaats daarvan kunt u de oorspronkelijke primaire en secundaire groepswaarden combineren in één nieuwe groeperingskolom, deze gebruiken als de nieuwe primaire groep en het model opnieuw trainen op basis van die structuur. In deze opzet is het nieuwe model alleen afhankelijk van de nieuw geïntroduceerde primaire groepen.

De afweging is dat u mogelijk een deel van de gecorreleerde informatie tussen groepen verliest, aangezien ze nu worden behandeld als volledig afzonderlijke tijdreeksen in plaats van gerelateerde subreeksen die elkaar contextuele informatie bieden.
Evenveel of meer historische gegevensrecords (per doel en groep) voorafgaand aan de afsluitingstijd van de prognose als het aantal records in het toepassingsvenster voor het model. Dit moeten volledige records zijn die de historisch waargenomen datum of tijdstempel, doel- en covariaat-waarden bevatten. Het toepassingsvenster wordt bepaald door het prognosevenster en de kloof die tijdens de training zijn geconfigureerd — hoe verder in de toekomst u moet voorspellen, hoe meer historische gegevens u nodig hebt in uw toepassingsdataset om voorspellingen uit te voeren.
Records voor alle toekomstige tijdstappen in uw prognosehorizon. Neem voor deze toekomstige records alleen de waarden voor de datumindexkolom op, evenals eventuele toekomstige functies. Laat de waarden voor de andere kolommen leeg.

De meeste vereisten voor historische gegevens voor uw toepassingsgegevensset zijn bedoeld om de minimaal acceptabele gegevensvolumes te specificeren. U kunt altijd meer opgeven dan nodig is. Wanneer het model voorspellingen genereert, worden alleen de records gebruikt die nodig zijn om het toepassingsvenster te dekken.

Voorbeelden

Stel dat u een tijdreeksmodel als volgt hebt geconfigureerd:

Doel: Sales
Geen groepen
Datumindex: Date
Tijdstap: 1 dag
Voorspellingsvenster van 7 dagen en voorspellingshiaat van 14 dagen. Daarom is de voorspellingshorizon 21 dagen.
Voorspellingsafsluitingstijd van 1 september 2025. Dit is de laatste datum waarvoor historische gegevens zijn verstrekt.
Een in het verleden liggende covariaat Transactions Per Hour die het gemiddelde aantal transacties bijhoudt dat per uur heeft plaatsgevonden.
Een toekomstige covariaat On Promotion die bijhoudt hoeveel producten tegen actietarieven zijn afgeprijsd voor de opgegeven datum.

In dit voorbeeld wordt ervan uitgegaan dat het door het systeem gedefinieerde toepassingsvenster 63 dagen is. Naast 63 dagen aan historische gegevens (1 juli 2025 tot 1 september 2025), biedt de gegevensset toekomstige covariaatgegevens voor de voorspellingshorizon van 21 dagen (2 tot 22 september 2025).

Volledig voorbeeld van toepassingsgegevensset voor model getraind zonder groepen
ID	Date	On Promotion	Transactions per Hour	Sales
548	7/1/2025	0	343	90010.01
549	7/2/2025	100	545	19491.65
550	7/3/2025	0	1004	70001.87
551	7/4/2025	14	305	39522.11
552	7/5/2025	55	700	91859.30
553	7/6/2025	2	94	19583.55
554	7/7/2025	1341	267	194863.00
555	7/8/2025	0	630	140244.13
556	7/9/2025	0	1143	76666.66
557	7/10/2025	56	576	30593.55
558	7/11/2025	3	403	10549.33
559	7/12/2025	14	1303	100003.33
560	7/13/2025	29	593	105893.99
561	7/14/2025	100	305	80195.22
562	7/15/2025	0	305	61051.13
563	7/16/2025	5	105	55938.38
564	7/17/2025	33	72	104823.33
565	7/18/2025	15	1052	99105.99
566	7/19/2025	5	521	130533.31
567	7/20/2025	1	205	67676.73
568	7/21/2025	36	302	52745.45
569	7/22/2025	111	502	99642.10
570	7/23/2025	350	693	34660.34
571	7/24/2025	34	200	60345.44
572	7/25/2025	93	205	44603.33
573	7/26/2025	60	295	105844.44
574	7/27/2025	10	76	150385.44
575	7/28/2025	402	473	40963.10
576	7/29/2025	15	1058	159383.33
577	7/30/2025	20	402	80119.11
578	7/31/2025	20	191	106020.00
579	8/1/2025	39	100	39581.34
580	8/2/2025	109	190	76939.23
581	8/3/2025	37	99	49548.42
582	8/4/2025	75	1555	93150.77
583	8/5/2025	190	1603	15923.49
584	8/6/2025	0	403	159342.05
585	8/7/2025	32	430	20451.33
586	8/8/2025	436	1000	150314.44
587	8/9/2025	1	1532	15923.91
588	8/10/2025	40	99	15944.10
589	8/11/2025	42	1058	60000.01
590	8/12/2025	25	734	39583.55
591	8/13/2025	1	569	150333.65
592	8/14/2025	305	692	124594.13
593	8/15/2025	11	164	59303.13
594	8/16/2025	60	205	150333.31
595	8/17/2025	70	186	103483.53
596	8/18/2025	25	1483	105038.13
597	8/19/2025	30	999	201857.11
598	8/20/2025	30	1533	35439.33
599	8/21/2025	30	1583	51956.24
600	8/22/2025	0	350	55334.30
601	8/23/2025	33	1509	11111.12
602	8/24/2025	145	74	15493.33
603	8/25/2025	33	140	159334.14
604	8/26/2025	59	884	45603.39
605	8/27/2025	65	239	46593.34
606	8/28/2025	16	502	74747.74
607	8/29/2025	17	158	45491.34
608	8/30/2025	15	1693	34503.11
609	8/31/2025	36	1544	159334.13
610	9/1/2025	62	1999	193803.15
611	9/2/2025	45	-	-
612	9/3/2025	32	-	-
613	9/4/2025	52	-	-
614	9/5/2025	10	-	-
615	9/6/2025	0	-	-
616	9/7/2025	13	-	-
617	9/8/2025	99	-	-
618	9/9/2025	14	-	-
619	9/10/2025	56	-	-
620	9/11/2025	32	-	-
621	9/12/2025	13	-	-
622	9/13/2025	15	-	-
623	9/14/2025	70	-	-
624	9/15/2025	71	-	-
625	9/16/2025	17	-	-
626	9/17/2025	3	-	-
627	9/18/2025	0	-	-
628	9/19/2025	32	-	-
629	9/20/2025	4	-	-
630	9/21/2025	15	-	-
631	9/22/2025	0	-	-

Stel dat u een tijdreeksmodel als volgt hebt geconfigureerd:

Doel: Sales
Datumindex: Date
Tijdstap: 1 dag
Store en Product zijn groepen. In deze context is Store de primaire groep en Product de secundaire groep.
Voorspellingsvenster van 3 dagen en voorspellingshiaat van 1 dag. Daarom is de voorspellingshorizon 4 dagen.
Voorspellingsafsluitingstijd van 1 september 2025. Dit is de laatste datum waarvoor historische gegevens zijn verstrekt.
Een in het verleden liggende covariaat Transactions Per Hour die het gemiddelde aantal transacties bijhoudt dat per uur plaatsvindt, voor elke winkel en elk product.
Een toekomstige covariaat On Promotion die bijhoudt hoeveel producten tegen actietarieven zijn afgeprijsd voor de opgegeven datum, voor elke winkel en elk product.

In dit voorbeeld wordt ervan uitgegaan dat het door het systeem gedefinieerde toepassingsvenster 12 dagen is. Naast 12 dagen aan historische gegevens (21 augustus tot 1 september 2025), biedt de gegevensset toekomstige covariaatgegevens voor de voorspellingshorizon van 4 dagen (2 tot 5 september 2025).

Volledig voorbeeld van toepassingsgegevensset voor model getraind met twee groepen
Date	Store	Product	On Promotion	Transactions per Hour	Sales
8/21/2025	Store 1	A	0	343	90010.01
8/21/2025	Store 2	A	100	545	19491.65
8/21/2025	Store 3	A	0	1004	70001.87
8/21/2025	Store 1	B	14	305	39522.11
8/21/2025	Store 2	B	55	700	91859.30
8/21/2025	Store 3	B	2	94	19583.55
8/21/2025	Store 1	C	1341	267	194863.00
8/21/2025	Store 2	C	0	630	140244.13
8/21/2025	Store 3	C	0	1143	76666.66
8/22/2025	Store 1	A	56	576	30593.55
8/22/2025	Store 2	A	3	403	10549.33
8/22/2025	Store 3	A	14	1303	100003.33
8/22/2025	Store 1	B	29	593	105893.99
8/22/2025	Store 2	B	100	305	80195.22
8/22/2025	Store 3	B	0	305	61051.13
8/22/2025	Store 1	C	5	105	55938.38
8/22/2025	Store 2	C	33	72	104823.33
8/22/2025	Store 3	C	15	1052	99105.99
8/23/2025	Store 1	A	5	521	130533.31
8/23/2025	Store 2	A	1	205	67676.73
8/23/2025	Store 3	A	36	302	52745.45
8/23/2025	Store 1	B	111	502	99642.10
8/23/2025	Store 2	B	350	693	34660.34
8/23/2025	Store 3	B	34	200	60345.44
8/23/2025	Store 1	C	93	205	44603.33
8/23/2025	Store 2	C	60	295	105844.44
8/23/2025	Store 3	C	10	76	150385.44
8/24/2025	Store 1	A	402	473	80195.22
8/24/2025	Store 2	A	15	1058	61051.13
8/24/2025	Store 3	A	20	402	55938.38
8/24/2025	Store 1	B	20	191	104823.33
8/24/2025	Store 2	B	39	100	11111.12
8/24/2025	Store 3	B	109	190	15493.33
8/24/2025	Store 1	C	37	99	159334.14
8/24/2025	Store 2	C	75	1555	45603.39
8/24/2025	Store 3	C	190	1603	19491.65
8/25/2025	Store 1	A	0	403	70001.87
8/25/2025	Store 2	A	32	430	45642.25
8/25/2025	Store 3	A	436	1000	25633.19
8/25/2025	Store 1	B	1	1532	19191.31
8/25/2025	Store 2	B	40	99	90010.01
8/25/2025	Store 3	B	42	1058	19491.65
8/25/2025	Store 1	C	25	734	70001.87
8/25/2025	Store 2	C	1	569	39522.11
8/25/2025	Store 3	C	305	692	91859.30
8/26/2025	Store 1	A	11	164	19583.55
8/26/2025	Store 2	A	60	205	194863.00
8/26/2025	Store 3	A	70	186	140244.13
8/26/2025	Store 1	B	25	1483	76666.66
8/26/2025	Store 2	B	30	999	30593.55
8/26/2025	Store 3	B	30	1533	10549.33
8/26/2025	Store 1	C	30	1583	100003.33
8/26/2025	Store 2	C	0	350	105893.99
8/26/2025	Store 3	C	33	1509	80195.22
8/27/2025	Store 1	A	145	74	61051.13
8/27/2025	Store 2	A	33	140	55938.38
8/27/2025	Store 3	A	59	884	104823.33
8/27/2025	Store 1	B	65	239	99105.99
8/27/2025	Store 2	B	16	502	130533.31
8/27/2025	Store 3	B	17	158	67676.73
8/27/2025	Store 1	C	15	1693	52745.45
8/27/2025	Store 2	C	36	1544	99642.10
8/27/2025	Store 3	C	62	1999	34660.34
8/28/2025	Store 1	A	45	343	60345.44
8/28/2025	Store 2	A	32	545	44603.33
8/28/2025	Store 3	A	52	1004	105844.44
8/28/2025	Store 1	B	10	305	150385.44
8/28/2025	Store 2	B	0	700	40963.10
8/28/2025	Store 3	B	13	94	159383.33
8/28/2025	Store 1	C	99	267	80119.11
8/28/2025	Store 2	C	14	630	106020.00
8/28/2025	Store 3	C	56	1143	39581.34
8/29/2025	Store 1	A	32	576	76939.23
8/29/2025	Store 2	A	13	403	49548.42
8/29/2025	Store 3	A	15	1303	93150.77
8/29/2025	Store 1	B	70	593	15923.49
8/29/2025	Store 2	B	71	305	159342.05
8/29/2025	Store 3	B	17	305	20451.33
8/29/2025	Store 1	C	3	105	150314.44
8/29/2025	Store 2	C	0	72	15923.91
8/29/2025	Store 3	C	32	1052	15944.10
8/30/2025	Store 1	A	4	521	60000.01
8/30/2025	Store 2	A	15	205	39583.55
8/30/2025	Store 3	A	0	302	150333.65
8/30/2025	Store 1	B	15	502	124594.13
8/30/2025	Store 2	B	20	693	59303.13
8/30/2025	Store 3	B	20	200	150333.31
8/30/2025	Store 1	C	39	205	103483.53
8/30/2025	Store 2	C	109	295	105038.13
8/30/2025	Store 3	C	37	76	201857.11
8/31/2025	Store 1	A	75	1058	35439.33
8/31/2025	Store 2	A	190	402	51956.24
8/31/2025	Store 3	A	0	191	55334.30
8/31/2025	Store 1	B	0	100	11111.12
8/31/2025	Store 2	B	100	190	15493.33
8/31/2025	Store 3	B	0	99	159334.14
8/31/2025	Store 1	C	14	1555	45603.39
8/31/2025	Store 2	C	55	1603	46593.34
8/31/2025	Store 3	C	2	403	74747.74
9/1/2025	Store 1	A	1341	158	45491.34
9/1/2025	Store 2	A	0	1693	34503.11
9/1/2025	Store 3	A	0	1544	159334.13
9/1/2025	Store 1	B	56	1999	193803.15
9/1/2025	Store 2	B	3	343	76666.66
9/1/2025	Store 3	B	14	545	30593.55
9/1/2025	Store 1	C	29	303	10549.33
9/1/2025	Store 2	C	100	154	100003.33
9/1/2025	Store 3	C	0	531	34351.42
9/2/2025	Store 1	A	5	-	-
9/2/2025	Store 2	A	33	-	-
9/2/2025	Store 3	A	15	-	-
9/2/2025	Store 1	B	5	-	-
9/2/2025	Store 2	B	1	-	-
9/2/2025	Store 3	B	36	-	-
9/2/2025	Store 1	C	111	-	-
9/2/2025	Store 2	C	350	-	-
9/2/2025	Store 3	C	34	-	-
9/3/2025	Store 1	A	93	-	-
9/3/2025	Store 2	A	60	-	-
9/3/2025	Store 3	A	10	-	-
9/3/2025	Store 1	B	465	-	-
9/3/2025	Store 2	B	22	-	-
9/3/2025	Store 3	B	249	-	-
9/3/2025	Store 1	C	50	-	-
9/3/2025	Store 2	C	15	-	-
9/3/2025	Store 3	C	25	-	-
9/4/2025	Store 1	A	1	-	-
9/4/2025	Store 2	A	0	-	-
9/4/2025	Store 3	A	112	-	-
9/4/2025	Store 1	B	50	-	-
9/4/2025	Store 2	B	75	-	-
9/4/2025	Store 3	B	130	-	-
9/4/2025	Store 1	C	139	-	-
9/4/2025	Store 2	C	136	-	-
9/4/2025	Store 3	C	168	-	-
9/5/2025	Store 1	A	155	-	-
9/5/2025	Store 2	A	73	-	-
9/5/2025	Store 3	A	19	-	-
9/5/2025	Store 1	B	103	-	-
9/5/2025	Store 2	B	54	-	-
9/5/2025	Store 3	B	23	-	-
9/5/2025	Store 1	C	24	-	-
9/5/2025	Store 2	C	134	-	-
9/5/2025	Store 3	C	193	-	-

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een tikfout, een ontbrekende stap of een technische fout – laat het ons weten!

Geef hier uw feedback