Informations supplémentaires concernant la durée, la période et les sessions des fenêtres
Le processeur Window vous permet de partitionner des données de streaming en différents types de fenêtres temporelles : fenêtre temporelle fixe, fenêtre glissante et fenêtre de session.
Le processeur Window démarre une nouvelle fenêtre toutes les périodes period.
La fenêtre stocke en mémoire les enregistrements au cours d'une certaine durée (duration) et envoie les micro-batchs de données en sortie.
Fenêtres temporelles fixes
-
toutes les fenêtres ont la même durée et ne se chevauchent pas
-
seule une fenêtre est stockée dans la mémoire à un moment précis
-
une seule donnée est capturée par fenêtre
Ces fenêtres sont utiles si vous souhaitez capturer toutes les données tout le temps.

Ici, toutes les données ayant un horodatage compris entre 00:00:00 et 01:00:00 appartiennent à la fenêtre 1, les données ayant un horodatage compris entre 01:00:00 et 02:00:00 appartiennent à la fenêtre 2, etc.
Fenêtres glissantes
-
plusieurs fenêtres peuvent se chevaucher
-
plusieurs fenêtres sont stockées en mémoire à un moment précis
-
les éléments d'un jeu de données peuvent être capturés dans plusieurs fenêtres
Ces fenêtres sont utiles à des fins d'échantillonnage et pour calculer plusieurs moyennes mobiles sur les données.

Toutes les données ayant un horodatage compris entre 00:00:00 et 01:00:00 appartiennent à la fenêtre 1, les données ayant un horodatage compris entre 00:30:00 et 01:30:00 appartiennent à la fenêtre 2, etc. Dans cet exemple, vous pouvez calculer une moyenne mobile des données de la dernière heure, en mettant le calcul à jour toutes les 30 minutes.

Toutes les données ayant un horodatage compris entre 00:00:00 et 01:00:00 appartiennent à la fenêtre 1, les données ayant un horodatage compris entre 01:30:00 et 02:30:00 appartiennent à la fenêtre 2, etc. Les fenêtres ne se chevauchent pas et les différentes données sont stockées dans différentes fenêtres.
Fenêtres de session
-
de hautes concentrations de données sont regroupées dans des fenêtres séparées
-
des sections inactives du flux de données sont filtrées
-
les données peuvent être capturées dans des fenêtres disjointes de différentes tailles
Ces fenêtres sont utiles pour les données irrégulièrement distribuées dans le temps. Par exemple, un flux de données représentant l'activité de la souris d'un utilisateur ou d'une utilisatrice peut contenir de longues périodes d'inactivité et des grandes concentrations de clics.

Ici, les données représentant une certaine activité sont stockées dans une fenêtre qui se ferme lorsqu'elle ne reçoit aucune donnée pendant au moins cinq minutes (écart de durée). Les fenêtres ne se chevauchent pas et n'ont pas d'heure de début ou de fin fixe.