tAggregateRow |
Ce composant reçoit un flux de données et fait une agrégation basée sur une ou plusieurs colonnes. |
tAggregateSortedRow |
Ce composant agrège les données d'entrée triées pour la colonne de sortie, en se basant sur un ensemble d'opérations. Pour une meilleure agrégation des données, chaque colonne de sortie est configurée avec plusieurs lignes requises, les opérations à effectuer et la colonne d'entrée de laquelle proviennent les données. |
tCacheClear |
Ce composant efface un RDD (Resilient Distributed Dataset) précédemment persistant de la mémoire. |
tCacheIn |
Ce composant offre un accès rapide aux données persistantes. |
tCacheOut |
Ce composant fait persister les RDD des données d'entrée dans le cache selon le niveau de stockage spécifique défini, afin d'offrir un accès ultérieur rapide à ces jeux de données. |
tConvertType |
Ce composant convertit automatiquement un type Java Talend en un autre type, ce qui permet d'éviter les erreurs de compilation. |
tDenormalize |
Ce composant dénormalise un flux entrant en fonction d'une colonne. |
tDenormalizeSortedRow |
Ce composant permet de synthétiser les lignes d'entrée triées afin de faire des économies de mémoire. |
tExternalSortOutput |
Ce composant trie les données d'entrée en se basant sur une ou plusieurs colonne·s, par type (numérique ou alphabétique) et ordre de tri (croissant ou décroissant), à l'aide d'une application externe de tri et passe les données triées au composant suivant. |
tExternalSortRow |
Ce composant trie les données d'entrée en se basant sur une ou plusieurs colonne·s, par type (numérique ou alphabétique) et ordre de tri (croissant ou décroissant). |
tExtractDelimitedFields |
Ce composant génère des colonnes multiples à partir d'une colonne String délimitée |
tExtractDynamicFields |
Ce composant parse une colonne de type Dynamic afin de créer des colonnes standards en sortie. |
tExtractEDIField |
Ce composant lit les données structurées EDI d'un fichier de message EDIFACT, génère un fichier XML selon la famille et le type EDIFACT et extrait des données en analysant le XML généré via des requêtes XPath définies manuellement ou provenant de l'assistant du Repository, puis envoie les données au composant suivant via une connexion Row. |
tExtractJSONFields |
Ce composant extrait les données souhaitées des champs JSON en se basant sur la requête JSONPath ou XPath. |
tExtractPositionalFields |
Ce composant extrait des données et génère de multiples colonnes à partir d'une chaîne de caractères formatée, à l'aide de champs positionnels. |
tExtractRegexFields |
Ce composant extrait des données et génère des colonnes multiples à partir d'une chaîne de caractères formatée, à l'aide de correspondances regex. |
tExtractXMLField |
Ce composant lit les données XML structurées contenues dans un champ XML et envoie les données comme défini dans le schéma au composant suivant. |
tFilterColumns |
Ce composant homogénéise des schémas, en organisant les colonnes ou en supprimant ou en ajoutant des colonnes. |
tFilterRow |
Ce composant filtre des lignes d'entrée en définissant une ou plusieurs condition(s) sur les colonnes sélectionnées. |
tJoin |
Ce composant effectue des jointures Inner Join et Outer Join entre le flux de données principal et le flux de référence (Lookup). |
tManagePartitions |
Ce composant vous permet de définir visuellement comment partitionner un jeu de données d'entrée. |
tNormalize |
Ce composant normalise un flux entrant en fonction du standard SQL pour améliorer la qualité des données et faciliter leur mise à jour. |
tPartition |
Ce composant vous permet de définir visuellement comment partitionner un jeu de données d'entrée. |
tReplace |
Ce composant nettoie tous les fichiers avant traitement. |
tReplicate |
Ce composant duplique le schéma entrant en deux flux identiques. |
tSample |
Ce composant retourne un sous-ensemble d'exemple des données traitées. |
tSampleRow |
Ce composant sélectionne des lignes en fonction d'une liste de lignes simples et/ou de groupes de lignes. |
tSortRow |
Ce composant établit des métriques et des tables de classification. |
tSplitRow |
Ce composant divise une ligne d'entrée en plusieurs lignes de sortie. |
tSqlRow |
Ce composant effectue des requêtes SQL sur des jeux de données d'entrée. |
tTop |
Ce composant trie des données et écrit en sortie plusieurs des premières lignes de ces données. |
tTopBy |
Ce composant regroupe et trie les données, puis écrit en sortie plusieurs lignes de données à partir de la première dans chaque groupe. |
tUniqRow |
Ce composant assure une qualité de données des flux d'entrée et de sortie du Job. |
tUnite |
Ce composant centralise des données provenant de sources diverses et hétérogènes. |
tWindow |
Ce composant applique une fenêtre Spark sur les RDD entrants et envoie les nouveaux RDD construits sur les fenêtres au composant suivant. |
tWriteAvroFields |
Ce composant transforme les données entrantes en fichiers Avro. |
tWriteDelimitedFields |
Ce composant convertit des enregistrements en tableaux d'octets. |
tWriteDynamicFields |
Ce composant crée un schéma dynamique à partir des colonnes d'entrée du composant. |
tWriteJSONField |
Ce composant transforme les données entrantes en champs JSON et les transfère dans un fichier, une table de base de données. |
tWritePositionalFields |
Ce composant convertit des enregistrements en tableaux d'octets. |
tWriteXMLFields |
Ce composant convertit des enregistrements en tableaux d'octets. |