Résolution des problèmes des tâches de données
Cette section décrit les problèmes pouvant survenir lorsque vous utilisez des tâches de données et explique comment les résoudre.
Résolution des erreurs environnementales
Lorsqu'une tâche de données rencontre une erreur environnementale, par exemple, des délais d'attente, des erreurs réseau ou des erreurs de connexion, la tâche de données retente automatiquement l'opération. Si l'erreur n'est pas résolue après la nouvelle tentative, la tâche de données s'arrête de fonctionner et indique l'état Erreur avec un message d'erreur.
-
Tâches de dépôt temporaire avec des sources de données accessibles uniquement via Passerelle de déplacement des données :
L'opération est retentée un nombre infini de fois, à un intervalle de 5 secondes.
Si l'interruption dure longtemps, l'intervalle est doublé jusqu'à compter 1 800 secondes.
-
Tâches de dépôt temporaire avec des sources de données accessibles sans Passerelle de déplacement des données, tâches Stockage, tâches Transformation et tâches datamart :
L'opération est retentée à trois reprises, à un intervalle de 1 seconde.
Vous pouvez :
-
Résolvez l'erreur en vous servant du message d'erreur.
-
Chargez de nouveau ou rétablissez le fonctionnement de la tâche de données.
Résolution des problèmes rencontrés avec une table spécifique
Lorsqu'une tâche de données rencontre une erreur lors de l'écriture dans une table spécifique, elle continue de fonctionner. La table en erreur indique l'état Erreur avec un message d'erreur.
-
Résolvez l'erreur en vous servant du message d'erreur.
-
Chargez de nouveau la table qui était en état d'erreur.
Résolutions des problèmes liés à CDC
Les tâches de données de dépôt temporaire en mode de mise à jour Chargement complet et CDC peuvent rencontrer des problèmes liés à CDC qui affectent la tâche toute entière et qui ne peuvent pas être résolus en actualisant des tables spécifiques. Exemples de problèmes rencontrés : événements manquants, problèmes causés par la réorganisation de la base de données source ou échec de lecture des événements de la base de données source.
Pour résoudre ce type de problèmes, vous pouvez actualiser l'ensemble des tables dans la cible.
- Arrêtez la tâche de données et l'ensemble des tâches qui la consomment.
-
Ouvrez la tâche de données et sélectionnez l'onglet Surveiller.
-
Cliquez sur ..., puis sur Actualiser la cible.
Cette opération actualise l'ensemble des tables de la cible via une action Abandonner-Créer et redémarre la totalité de la capture des données de modification à partir de ce point.
-
Les tâches de stockage qui consomment la tâche de données de dépôt temporaire sont actualisées via une opération Comparer et appliquer lors de leur prochaine exécution afin d'être synchronisées. L'historique existant est conservé. L'historique de type 2 sera mis à jour pour refléter les modifications après l'exécution du processus Charger et comparer.
L'horodatage de la date de début de l'historique de type 2 reflétera la date de chargement et pas forcément la date à laquelle la modification a eu lieu dans la source.
-
Les vues de stockage en direct ne seront pas fiables, lors de l'opération d'actualisation de la cible et tant que le stockage n'aura pas été synchronisé. Le stockage est entièrement synchronisé lorsque :
-
toutes les tables sont actualisées via Comparer et appliquer ;
-
un cycle de modifications est réalisé pour chaque table.
-
Pour plus d'informations, consultez Actualisation de l'ensemble des tables dans la cible.
Valeurs NULL dans des colonnes de clés primaires
Il se peut que vous receviez un message d'erreur lors de l'exécution d'une tâche de données : Unknown execution error - NULL result in a non-nullable column.
Les colonnes utilisées comme clé primaire ne doivent pas contenir de valeurs NULL et ne doivent pas accepter la valeur Null.
Dans la tâche de données source, ajoutez une expression qui convertit toutes les valeurs NULL en une valeur, par exemple, 0.
Vous pouvez également sélectionner une autre colonne à utiliser comme clé primaire.
Erreur de diffusion lors de l'utilisation de Redshift comme plateforme de données
Il se peut que vous obteniez l'erreur suivante ou une erreur similaire si vous utilisez Redshift comme plateforme de données : Échec de recherche de la fonction de conversion de “inconnu” à la variation de caractère
Absence de diffusion d'une expression constante. Cela peut se produire plus souvent dans les datamart en raison de la plus grande complexité de la requête finale.
Diffusez l'expression constante sous forme de texte.
Noms de colonne ambigus
Lorsque vous enregistrez des données basées sur une vue créée dans un pipeline Qlik Talend Data Integration, la vue peut contenir des colonnes générées par Qlik Talend Data Integration. Les noms de ces colonnes, commençant par hdr__, sont réservés. Lorsqu'une colonne portant un nom réservé est consommée dans une tâche de stockage, la tâche de stockage crée des colonnes portant le même nom réservé, ce qui entraîne un conflit de noms. Par exemple, vous pouvez avoir deux colonnes nommées hdr__key_hash.
Pour plus d'informations sur les noms de colonne réservés dans les vues, consultez Vues.
Renommez la colonne provenant de la tâche de données enregistrées dans la tâche de données de stockage. Par exemple, remplacez le nom hdr__key_hash par my__key_hash.
Les transformations ne sont pas appliquées aux données existantes
Vous avez ajouté ou modifié des transformations dans une tâche contenant des données existantes, mais, lorsque vous préparez et exécutez de nouveau la tâche, les nouvelles transformations ou les transformations modifiées ne sont appliquées qu'aux nouvelles données.
Actualisez toutes les tables concernées si vous souhaitez appliquer les nouvelles transformations ou les transformations modifiées à l'ensemble des données existantes.