Tijdbewuste modellen maken
Met tijdbewuste training, kunt u modellen bouwen die gegevens voorspellen langs een op tijd gebaseerde kolom die in uw trainingsgegevens voorkomt. Activeer tijdbewuste training als je voorspellingen moet doen op basis van een doel waarvan bekend is dat deze wordt beïnvloed door deze op tijd gebaseerde kolom.
Tijdbewuste training helpt bij het verkleinen van gegevenslekken door gespecialiseerde gegevensverwerking toe te passen op de trainingsgegevens. Door deze verwerking kunnen machine learning-algoritmen de gegevens en de voorspellende context beter interpreteren die afhankelijk zijn van een specifieke datum- of tijddimensie.
Om tijdbewuste modellen te trainen, hebt u een kolom nodig in uw trainingsgegevensverzameling die datum- of tijdstempelgegevens bevat. Deze kolom is de datumindex die wordt gebruikt om de gegevensverzameling te sorteren vóór de training. Zie Vereisten voor datumindex voor meer informatie over de datumindex.
Wanneer gebruiken
Tijdbewuste modeltraining is ideaal voor modellen die wijzigingen voorspellen binnen een tijdeenheid die al aanwezig is in de training. Bijvoorbeeld:
-
U wilt uw omzet voor de volgende maand voorspellen en u hebt een kolom Transactiedatum in uw Gegevensverzameling.
-
U wilt metrische gegevens voorspellen over te late leveringen en u hebt een kolom Leverdatum in uw gegevensverzameling.
Overwegingen
Afhankelijk van uw gebruikersscenario kan tijdbewuste modeltraining u helpen om betere modellen te bouwen. In andere gevallen ziet u misschien betere resultaten door het standaard trainingsproces van AutoML. Over het algemeen, als uw gegevens op een significante manier afhankelijk zijn van een specifieke tijdskolom, wordt aanbevolen om tijdbewuste modeltraining te gebruiken.
In Qlik AutoML voert tijdbewuste training geen geautomatiseerde functie-ontwikkeling uit om achterblijvende functies voor tijdreeksproblemen te genereren. Voor tijdgebaseerde gebruiksscenario's die functie-ontwikkeling vereisen, wordt aanbevolen om de vereiste functie-ontwikkeling uit te voeren tijdens de voorbereidingsfase van de gegevensverzameling.
Hoe werkt tijdbewuste training?
Een veel voorkomend probleem bij machine learning is het vinden van een manier om ervoor te zorgen dat modellen alleen worden getraind op basis van informatie die beschikbaar is op het moment van de training. Als uw trainingsgegevens prominente datum- en tijdsinformatie bevatten, kan deze informatie worden gebruikt om gegevenslekken te helpen voorkomen.
Vereisten voor datumindex
Om tijdbewuste training te activeren, moet u een kolom in uw gegevensverzameling hebben die de datum en tijd bevat waarvan de modeltraining afhangt. U selecteert de kolom bij het configureren van de modeloptimalisatie voor de training.
Om een kolom te gebruiken als datumindex in uw training, moet de kolom al over het volgende beschikken:
-
Volledige datums. Kolommen die bestaan uit maand- of dagwaarden kunnen bijvoorbeeld niet worden gebruikt.
-
Het gegevenstype voor datum of tijdstempel.
-
Het functietype datum.
Evaluatie en kruisvalidatie
Bij het kiezen van de manier waarop de gegevens worden gescheiden voor het evaluatie- en kruisvalidatieproces, kunnen methoden voor willekeurige selectie toekomstige gegevens in de modeltraining introduceren. Wanneer u tijdbewuste training activeert, gebruikt AutoML in plaats daarvan het volgende proces:
-
De trainingsgegevensverzameling wordt gesorteerd langs de door u geselecteerde indexkolom voordat deze wordt gescheiden in trainings- en evaluatiegegevens.
-
Elke iteratie van de training gebruikt een vaste testgrootte en een geleidelijk toenemende trainingsgrootte. Door elke iteratie worden de gegevens meer en meer recent.
Ga voor meer informatie naar Tijdgebaseerde kruisvalidatie.
Overige verwerking
Tijdbewuste modeltraining gebruikt ook andere processen die afwijken van de standaard trainingsprocessen. Tijdbewuste training gebruikt bijvoorbeeld een aangepast proces voor null-imputatie. Ga voor meer informatie naar Imputatie van null-waarden.
Tijdbewuste training inschakelen
Tijdbewuste modeltraining kan worden in- of uitgeschakeld, of opnieuw geconfigureerd, voor elke versie die u uitvoert in een experiment.
Doe het volgende:
-
Klik in een experiment op Configuratie weergeven.
-
Klik op Nieuwe versie als u al ten minste één versie van het experiment hebt uitgevoerd.
-
In het venster vouwt u Modeloptimalisatie uit.
-
Selecteer onder Tijdgebaseerde splitsing test-training de Datumindexatie die u wilt gebruiken voor het sorteren van de gegevens.
U kunt de tijdbewuste training wijzigen tijdens het verfijnen van het model. U kunt de instelling bijvoorbeeld uitschakelen of een nieuwe kolom selecteren als datumindex. Ga voor meer informatie naar Modellen verfijnen.