Accéder au contenu principal Passer au contenu complémentaire

Réplication de données

Vous pouvez répliquer des données depuis des sources de données prises en charge vers n'importe quelle cible prise en charge.

Le processus de réplication de données se compose des opérations suivantes :

  • Récupération des données auprès de la source de données
  • Transformation des données (facultatif)
  • Chargement des données dans la cible
  • Maintien à jour des données via la capture des modifications en temps réel

Pour savoir comment configurer une connexion à votre source de données, voir Connexion aux sources de données.

Pour savoir comment configurer une connexion à votre base de données cible, voir Connexion à des cibles.

Pour configurer une tâche Replicate :

  1. Cliquez sur le bouton Ajouter nouveau dans le coin supérieur droit, puis sélectionnez Créer un projet de données dans le menu déroulant.

  2. Dans la boîte de dialogue Nouveau projet de données, procédez comme suit :

    1. Donnez un Nom à votre projet.
    2. Sélectionnez l'Espace dans lequel vous souhaitez créer le projet.
    3. Vous pouvez éventuellement saisir une Description.
    4. Sélectionnez Replicate comme Cas d'utilisation.
    5. Vous pouvez décocher la case Ouvrir si vous souhaitez créer un projet vide sans configurer aucun paramètre.
    6. Cliquez sur Créer.

      Il se produit une des choses suivantes :

      • Si la case Ouvrir de la boîte de dialogue Nouveau projet de données était cochée (par défaut), le projet s'ouvre.
      • Si vous avez décochez la case Ouvrir de la boîte de dialogue Nouveau projet de données, le projet est ajouté à votre liste de projets. Vous pourrez ouvrir le projet ultérieurement en sélectionnant Ouvrir dans le menu du projet.
  3. Une fois le projet ouvert, cliquez sur Appliquer l'opération Replicate aux données.

    L'assistant Appliquer l'opération Replicate aux données s'ouvre.

  4. Dans l'onglet Général, spécifiez un nom et une description pour la tâche Replicate. Cliquez ensuite sur Suivant.

  5. Dans l'onglet Sélectionner une connexion source, sélectionnez une connexion aux données sources. Vous pouvez éventuellement éditer les paramètres de connexion en sélectionnant Modifier dans le menu dans la colonne Actions.

    Si vous n'avez pas encore créé de connexion à votre source de données, vous devez en créer une en cliquant sur Créer une connexion dans le coin supérieur droit de l'onglet.

    Vous pouvez filtrer la liste de connexions via les filtres à gauche. Il est possible de filtrer les connexions en fonction du type de source, de la passerelle, de l'espace et du propriétaire. Le bouton Tous les filtres au-dessus de la liste de connexions affiche le nombre de filtres en cours. Vous pouvez utiliser ce bouton pour fermer ou ouvrir le panneau Filtres à gauche. Les filtres actuellement actifs sont également indiqués au-dessus de la liste de connexions de données disponibles.

    Vous pouvez également trier la liste en sélectionnant Dernière modification, Dernière création ou Alphabétiquedans la liste déroulante à droite. Cliquez sur la flèche à droite de la liste pour modifier l'ordre de tri.

    Une fois que vous avez sélectionnez une connexion de source de données, vous pouvez cliquer sur Tester la connexion dans le coin supérieur droit de l'onglet (recommandé), puis cliquez sur Suivant.

  6. Dans l'onglet Sélectionner des ensembles de données, sélectionnez des tables et/ou des vues à inclure dans la tâche Replicate. Vous pouvez également utiliser des caractères génériques et créer des règles de sélection, comme décrit à la section Sélection de données à partir d'une base de données.

  7. Dans l'onglet Sélectionner une connexion cible, sélectionnez la cible dans la liste de connexions disponibles, puis cliquez sur Suivant. En termes de fonctionnalités, l'onglet est identique à l'onglet Sélectionner une connexion source décrit précédemment.

  8. Dans l'onglet Paramètres, vous pouvez modifier les paramètres suivants, puis cliquez sur Suivant.

    Note InformationsLors de la réplication à partir de sources d'applications SaaS, le mode de réplication Chargement complet est activé par défaut et ne peut pas être désactivé.
    • Chargement complet : Charge les données des tables sources sélectionnées dans la plate-forme cible et crée les tables cibles, si nécessaire. Le chargement complet s'effectue automatiquement lorsque la tâche démarre, mais il peut également être effectué manuellement, si nécessaire.
    • Appliquer les modifications : Maintient les tables cibles à jour en permanence en y ajoutant toutes les modifications apportées aux tables sources.
    • Stocker les modifications : Stocke les modifications apportées aux tables sources dans les tables de modifications (une par table source).

      Pour plus d'informations, voir Stocker les modifications.

    Note InformationsLes opérations ALTER TABLE DDL ne sont actuellement pas prises en charge. Les autres opérations DDL telles que DROP TABLE et TRUNCATE TABLE sont prises en charge.

    Les modifications sont appliquées aux tables cibles via l'une des méthodes suivantes :

    • Lot optimisé : Il s'agit de la valeur par défaut. Lorsque cette option est sélectionnée, les modifications sont appliquées par lots. Une action de prétraitement s'effectue pour regrouper les transactions par lots de la manière la plus efficace.
    • Transactionnel : Sélectionnez cette option pour appliquer chaque transaction individuellement, dans leur ordre de validation. Dans ce cas, une stricte intégrité référentielle est garantie pour toutes les tables.
  9. L'onglet Récapitulatif affiche visuellement le pipeline de données. Décidez si vous souhaitez Ouvrir la tâche <nom> ou Ne rien faire, puis cliquez sur Créer.

    Suivant votre sélection, la tâche s'ouvre ou une liste de projets apparaît.

  10. Si vous avez décidé d'ouvrir la tâche, l'onglet Ensembles de données indique la structure et les métadonnées des tables d'ensembles de données sélectionnées. Sont concernées toutes les tables répertoriées de manière explicite ainsi que les tables correspondant aux règles de sélection.

    Si vous souhaitez ajouter d'autres tables provenant de la source de données, cliquez sur Sélectionner des données sources.

  11. Vous pouvez éventuellement modifier les paramètres de tâche comme décrit à la section Paramètres de réplication des données.

  12. Vous pouvez effectuer des transformations sur les ensembles de données, filtrer des données ou ajouter des colonnes.

    Pour plus d'informations, voir Gestion des ensembles de données.

  13. Lorsque vous avez ajouté les transformations souhaitées, vous pouvez valider les ensembles de données en cliquant sur Valider les ensembles de données. Si la validation échoue, corrigez les erreurs avant de poursuivre.

    Pour plus d'informations, voir Validation et ajustement des ensembles de données.

  14. Lorsque vous êtes prêt, cliquez sur Préparer pour cataloguer la tâche de données et la préparer pour l'exécution.

  15. Lorsque la tâche de données a été préparée, cliquez sur Exécuter.

    Pour des informations sur la récupération des tâches et d'autres méthodes d'exécution des tâches, voir Options d'exécution avancées.

  16. La tâche Replicate doit maintenant démarrer. Vous pouvez voir sa progression dans Surveiller. Pour plus d'informations, voir Surveillance d'une tâche de données individuelle

Définition de la priorité de chargement des ensembles de données

Vous pouvez contrôler l'ordre de chargement des ensembles de données de votre tâche de données en attribuant une priorité de chargement à chaque ensemble de données. Cela peut être utile, par exemple, si vous souhaitez charger les ensembles de données plus petits avant les grands.

  1. Cliquez sur Priorité de chargement.

  2. Sélectionnez une priorité de chargement pour chaque ensemble de données.

    La priorité de chargement par défaut est Normale. Les ensembles de données seront chargés dans l'ordre de priorité suivant :

    • La plus élevée

    • Plus élevée

    • Élevée

    • Normale

    • Faible

    • Plus faible

    • La plus faible

    Les ensembles de données ayant la même priorité ne sont pas chargés dans un ordre particulier.

  3. Cliquez sur OK.

Note InformationsLes ensembles de données provenant d'applications SaaS sources peuvent contenir des dépendances relatives à l'ordre de chargement. Prenez ces dépendances en considération lors de la configuration de la priorité de chargement.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !