Dates-processor
Voert datumgerelateerde bewerkingen uit.
Met de Dates-processor kunt u verschillende functies toepassen op velden met betrekking tot datums, tijden en tijdstempels. De beschikbare functies kunnen worden gebruikt om datums te berekenen, op te schonen, te wijzigen of om te zetten.
Gebruik
De Dates-processor heeft één invoerstroom nodig en kan slechts één uitvoerstroom genereren.
Eigenschappen
Eigenschappen om te configureren voor werking op datums.
Eigenschap | Configuratie |
---|---|
Functienaam |
|
Velden om te verwerken |
Selecteer het veld of de velden waarop u een functie in de lijst wilt toepassen. TipAls u dezelfde functie op meerdere velden tegelijk wilt toepassen, klikt u op
![]() |
Nieuw veld maken | Schakel deze optie in om een nieuw veld te maken na het toepassen van de functie. Als u deze optie niet inschakelt, wordt het bestaande veld behouden en aangepast. |
Naam nieuw veld wijzigen | Geef een aangepaste naam aan het nieuw gemaakte veld. |
Om de naam van de processor te wijzigen of de beschrijving ervan te bewerken, klikt u op het pictogram Bewerken naast de processornaam in het venster Eigenschappen.
Extra informatie over het werken met datums
Er zijn drie verschillende formaten voor datums waarnaar gewoonlijk verwezen wordt:
-
Tijd, die een tijd van de dag markeert
-
Datum, die een bepaalde dag aangeeft
-
Tijdstempel, gemaakt van een datum en een tijd
Datums worden in de meeste gevallen automatisch geïdentificeerd in een gegevensstroom. In de volgende gevallen moet u echter een van de Converteren naar functies gebruiken om de datums op de juiste manier in het systeem in te voeren:
-
Uw datums zijn geformatteerd op een manier die niet automatisch geïdentificeerd kan worden.
-
U wilt ze in dezelfde datumnotatie zetten als de gegevensstroom, gebaseerd op de lokalisatie van de gebruiker die de gegevensstroom heeft aangemaakt.
-
U wilt ervoor zorgen dat ze in een bepaald formaat worden ingesteld. Anders worden datumnotaties die niet herkend worden, ingesteld op Null.
Beperkingen
-
In sommige gevallen werkt het formatteren van datums niet vanwege enginebeperkingen. Dit geldt voor de functies Formatteren en Converteren naar. Dit gebeurt alleen bij het bijwerken van het oorspronkelijke invoerveld en niet wanneer er een nieuw veld wordt gemaakt.
-
Door een beperking van de engine is het niet altijd mogelijk om het formaat van een datum in te stellen wanneer deze wordt geladen vanuit een indeling die van nature datums ondersteunt, zoals Excel.
Vooraf gedefinieerde datumnotaties
In deze tabel staan de verschillende formaten die vooraf gedefinieerd zijn in Gegevensstroom, maar andere formaten worden ook ondersteund als ze handmatig worden ingevoerd. Zie Beschrijvingen voor getal- en tijdnotaties voor meer informatie over hoe handmatig gedefinieerde notaties eruit moeten zien.
Opmaak | Type | Voorbeeld |
---|---|---|
JJJJ-MM-DD | Datum | 1999-03-22 |
JJJJMMDD | Datum | 19990322 |
M/D/JJJJ | Datum | 3/22/1999 |
M/D/JJ | Datum | 3/22/99 |
MM/DD/JJ | Datum | 03/22/99 |
MMM D, JJJJ | Datum | Mrt 22, 1999 |
MMMM D, JJJJ | Datum | Maart 22, 1999 |
JJJJ-MM-DD uu:mm | Tijdstempel | 1999-03-22 05:06 |
JJJJ-MM-DD uu:mm:ss | Tijdstempel | 1999-03-22 05:06:07 |
JJJJ-MM-DDTuu:mm | Tijdstempel | 1999-03-22T05:06 |
JJJJ-MM-DDTuu:mm:ss | Tijdstempel | 1999-03-22T05:06:07 |
M/D/JJJJ uu:mm tt | Tijdstempel | 3/22/1999 05:06 AM |
M/D/JJ uu:mm tt | Tijdstempel | 3/22/99 05:06 AM |
MM/DD/JJ uu:mm tt | Tijdstempel | 03/22/99 05:06 AM |
M/D/JJJJ uu:mm:ss tt | Tijdstempel | 3/22/1999 05:06:07 AM |
M/D/JJ uu:mm:ss tt | Tijdstempel | 3/22/99 05:06:07 AM |
MM/DD/JJ UU:mm:ss tt | Tijdstempel | 03/22/99 05:06:07 AM |
MMM D, JJJJ u:mm:ss tt | Tijdstempel | Mrt 22, 1999 5:06:07 AM |
WWWW, MMMM D, JJJJ u:mm:ss tt | Tijdstempel | Maandag, maart 22, 1999 5:06:07 AM |
uu:mm | Tijd | 05:06 |
uu:mm:ss | Tijd | 05:06:07 |
uu:mm tt | Tijd | 05:06 AM |
uu:mm:ss tt | Tijd | 05:06:07 AM |
Voorbeeld: datums converteren en ermee werken
Dit scenario laat zien hoe u een gegevensverzameling met informatie over mogelijke gegadigden voorbereidt om een ML-experiment te trainen met als doel te identificeren welke mogelijke gegadigden klanten zouden kunnen worden. Onder de beschikbare informatie hebben we een paar velden die datums bevatten, zoals FirstContactDate en TrialDate.
De eerste stap is om ervoor te zorgen dat de twee datumvelden een gemeenschappelijke notatie gebruiken. Gebruik een eerste Dates-processor met de functie Converteren naar datum op de velden FirstContactDate en TrialDate. De twee velden gebruiken nu dezelfde D/MM/JJJJ-notatie.
Met een tweede Dates-processor gebruikt u de optie Datumverschil berekenen om het aantal dagen tussen een eerste contact en het begin van een proefversie weer te geven.
Daarna wordt een Fork-processor gebruikt om een eerste uitvoer uit de resulterende gegevens te genereren, terwijl de tweede vertakking een derde Dates-processor gebruikt. Met de functie Datumdelen extraheren kunt u alleen de informatie over het jaar en de maand van het veld FirstContactDate behouden, waardoor het gemakkelijker te lezen en te gebruiken is in uw toekomstige ML-experiment.
Na een aggregatiebewerking kan de gegevensstroom worden uitgevoerd om uw model te trainen, en de uiteindelijke gegevensstroom ziet er als volgt uit:
Voorbeeld: een datumverschil berekenen
De gegevensbron in dit voorbeeld bevat een referentie van bestellingen, inclusief de besteldatum en verzenddatum.
Om enig inzicht te krijgen in de vertraging die nodig is om bestellingen te verzenden, kunt u de Dates-processor gebruiken om de tijd tussen het plaatsen van de bestelling en het verzenden van de bestelling te berekenen.
Selecteer in de eigenschappen van de processor Datumverschil berekenen als functie en Dag als tijdseenheid. Selecteer Orderdatum als veld om te verwerken en kies Verzenddatum als ander veld om het tijdsverschil te berekenen. Voer een naam in voor het nieuwe veld dat u wilt maken, stel een doel in en voer de gegevensstroom uit.
Het doel van deze gegevensstroom bevat een nieuwe kolom met het aantal dagen dat het duurde om bestellingen te verzenden, die u kunt gebruiken in uw analyses.