Architecture fonctionnelle de Talend Data Integration et de Data Quality
L'architecture fonctionnelle des produits Talend est un modèle architectural qui identifie les fonctions, les interactions et les besoins informatiques correspondants du Studio Talend. L'architecture d'ensemble a été décrite en isolant les fonctionnalités spécifiques en blocs fonctionnels.
Le graphique ci-dessous illustre les principaux blocs fonctionnels architecturaux explorés dans le Studio Talend.
Plusieurs blocs fonctionnels différents sont définis :
- Le bloc Clients inclut un ou plusieurs Studio Talend et navigateur(s) Web pouvant être sur la même machine ou sur des machines différentes.
Depuis le Studio Talend, vous pouvez effectuer :
- des processus d'intégration de données, dans la perspective Integration,
- des analyses de qualité de données, dans la perspective Profiling.
Depuis le navigateur Web, vous pouvez vous connecter au serveur Talend Administration Center distant de Talend, via un protocole HTTP sécurisé.
- Le bloc Servers comprend Talend Administration Center basé Web, connecté à :
- deux référentiels partagés : un basé sur un serveur Git et un basé sur un référentiel d'artefacts,
- à des bases de données : une pour les métadonnées d'administration, une autre pour les informations d'audit et une dernière pour le monitoring des activités.
- un ou des serveur(s) d'exécution Talend.
Talend Administration Center permet la gestion et l'administration de tous les projets. Les métadonnées d'administration (comptes d'utilisateur·trices, droits d'accès et autorisations des projets, par exemple) sont stockées dans la base de données d'Administration. Les métadonnées de projet (Jobs et Routines par exemple) sont stockées sur le serveur Git. Pour plus d'informations, consultez Gestion des projets.
- Le bloc Repositories inclut le serveur Git et le référentiel d'artefacts. Le serveur Git est utilisé pour centraliser toutes les métadonnées des projets telles que les Jobs partagés entre les différent·es utilisateur·trices et accessibles depuis le Studio Talend afin de les développer et à partir de Talend Administration Center pour les publier, déployer et monitorer.
Le référentiel d'artefacts est utilisé pour stocker :
- les mises à jour (Software Updates) disponibles en téléchargement,
- les Jobs publiés depuis le Studio Talend prêts à être déployés et exécutés.
- Le bloc Talend Execution Servers comprend un ou plusieurs serveurs d'exécution, déployé·s dans votre système d'information. Les Jobs Talend sont déployés sur les serveurs de Jobs à travers le Job Conductor de Talend Administration Center, afin d'être exécutés à l'heure, la date ou moment programmé·e.
Pour plus d'informations concernant les serveurs d'exécution, consultez Configuration des serveurs d'exécution.
- Le bloc Databases comprend les bases de données suivantes :
- La base de données d'Administration est utilisée pour gérer les comptes d'utilisateur·trices, droits d'accès et autorisations des projets notamment. La base de données d'Audit est utilisée pour évaluer les différents aspects des Jobs implémentés dans un Projet réalisé via le Studio Talend. Cette opération permet de fournir de solides facteurs quantitatifs et qualitatifs au support décisionnel orienté processus. Les bases de données Monitoring incluent les bases de données Talend Activity Monitoring Console et Service Activity Monitoring.
- Talend Activity Monitoring Console vous permet de monitorer l'exécution des processus techniques. Elle fournit des fonctionnalités de monitoring détaillé pouvant être utilisées afin de consolider les informations de log collectées, comprendre les interactions sous-jacentes des flux de données, empêcher les erreurs générées de manière inattendue et aider à prendre des décisions concernant la gestion du système.
- Service Activity Monitoring vous permet de monitorer les appels de services. Il fournit des fonctionnalités de monitoring et des informations consolidées concernant les événements dont l'utilisateur·trice final·e peut comprendre les requêtes et les réponses sous-jacentes, monitorer les erreurs générées de manière inattendue et aider à prendre des décisions concernant la gestion du système.
- Le datamart stocke toutes les données générées par les différents rapports de qualité de données dans le Studio Talend.