Talend Data Catalog en mode cluster actif-passif
Avec une édition Talend Data Catalog Advanced ou Advanced Plus, vous pouvez installer une configuration à deux serveurs, actif-passif reposant sur une base de données distribuée et de bénéficier d'une haute disponibilité de votre produit.
Le clustering est le processus de regroupement d'un ensemble de systèmes physiques similaires afin d'assurer un certain niveau de continuité opérationnelle et de minimiser les risques d'arrêt non planifié, notamment en tirant parti des fonctionnalités de failover.
Le failover vous permet de basculer automatiquement vers un second serveur si le serveur principal est en panne ou inaccessible de façon temporaire.
Architecture de Talend Data Catalog en mode cluster actif-passif
Le diagramme suivant illustre l'architecture derrière Talend Data Catalog lors d'une configuration en mode cluster.
Cette architecture se compose de plusieurs blocs fonctionnels :
- Deux serveurs d'application Talend Data Catalog ont été installés sur différentes machines. Chaque instance de serveur héberge une installation du serveur d'Apache Tomcat identique et se trouve sur un serveur de fichiers partagés. Seul un serveur à la fois est en cours d'exécution, c'est le serveur actif. L'autre serveur est passif et n'accède pas au serveur de fichiers partagés.
Vous pouvez obtenir une licence fonctionnant pour les deux serveurs en fournissant deux fichiers HostInfo.xml, un pour chaque serveur, dans votre requête de licence.
- Toutes les instances du serveur d'application sont connectées à la base de données distribuée.
Pour plus d'informations, référez-vous à la documentation correspondante de votre fournisseur de base de données.
- Un logiciel de haute disponibilité est installé sur chaque instance. Le logiciel de gestion de haute disponibilité détecte lorsque le serveur principal est arrêté et démarre le second serveur. Avant de le démarrer, le système de haute disponibilité doit déverrouiller tous les fichiers dans le répertoire data.
Cette fonction n'est pas fournie par Talend et doit être implémentée séparément.
- Un serveur de fichiers partagé est implémenté pour stocker et partager toutes les données d'application, y compris le répertoire data et les fichiers de log entre les instances. Vous pouvez définir le répertoire data via le paramètre M_DATA_DIRECTORY dans le fichier <TDC_HOME>/conf/conf.properties ou via le champ Data Directory dans l'utilitaire de configuration Setup.
Le serveur de Talend Data Catalog verrouille les fichiers dans le répertoire data lorsqu'il y accède et les déverrouille lorsqu'il a terminé. S le serveur primaire verrouille encore des fichiers lorsqu'il est arrêté, le démarrage du serveur secondaire échoue car il doit accéder à ces fichiers. Vous pouvez implémenter un script pour déverrouiller les fichiers dans le répertoire data avant de démarrer le serveur secondaire.
Cette fonction n'est pas fournie par Talend et doit être implémentée séparément.