Accéder au contenu principal Passer au contenu complémentaire

Convertir une table Hive en une table Iceberg

La première étape de ce scénario consiste à convertir les données de la table Hive customers_hive vers une table Iceberg nommée customers_iceberg. Les mêmes actions sont ensuite répétées pour les tables "marketing" avec marketing_hive et marketing_iceberg.

Pourquoi et quand exécuter cette tâche

Pour cette tâche, utilisez le sous-Job de conversion.

Procédure

  1. Facultatif : Dans la vue Basic settings du tIcebergTable nommé Drop table, configurez les paramètres comme suit :
    Paramètres du composant tIcebergTable.
    1. Dans la liste déroulante Connection, sélectionnez le composant de connexion à utiliser. Dans cet exemple, c'est le tIcebergConnection_1.
    2. Dans le champ Table Name, saisissez le nom de la table à supprimer. Dans cet exemple, son nom est customers_iceberg.
    3. Dans la liste déroulante Action on table, sélectionnez Drop if it exists afin de supprimer la table uniquement si une table du même nom existe déjà.
      Note InformationsRemarque : Cette étape est nécessaire uniquement si une table du même nom existe déjà et que vous souhaitez la supprimer pour en créer une nouvelle.
  2. Dans la vue Basic settings du tIcebergTable nommé Create customers_iceberg, configurez les paramètres comme suit, afin de créer la table Iceberg à partir d'une table Hive existante :
    Paramètres du composant tIcebergTable.
    1. Dans la liste déroulante Connection, sélectionnez le composant de connexion à utiliser. Dans cet exemple, c'est le tIcebergConnection_1.
    2. Dans le champ Table Name, saisissez le nom de la table à créer. Dans cet exemple, son nom est "customers_iceberg".
    3. Dans la liste déroulante Action on table, sélectionnez Create if it does not exist afin de créer la table Iceberg.
    4. Cochez la case Create as select, puis, dans le champ As select query, saisissez la requête SELECT à effectuer. Dans cet exemple, la requête est "SELECT * FROM customers-hive", ce qui vous permet de sélectionner toutes les données de la table customers-hive.
    5. Sélectionnez dans la liste déroulante le format de vos données. Ici, le format est AVRO.
    6. Laissez les autres paramètres tels qu'ils sont.
  3. Facultatif : Dans la vue Basic settings du tIcebergRow nommé v2 format, configurez les paramètres comme suit, afin de mettre à jour la version de la table Iceberg à utiliser :
    Paramètres du composant tIcebergRow.
    1. Dans la liste déroulante Connection, sélectionnez le composant de connexion à utiliser. Dans cet exemple, c'est le tIcebergConnection_1.
    2. Dans le champ Sql query, saisissez la requête SQL à effectuer. Dans cet exemple, la requête est "ALTER TABLE marketing_iceberg SET TBLPROPERTIES ('format-version' = '2')", ce qui vous permet de modifier la table en ajoutant une propriété pour configurer la version d'Iceberg.
  4. Exécutez le sous-Job en cliquant sur le bouton Run, dans l'onglet Run.

Résultats

La table customers_iceberg a été créée.
Dans votre base de données, vous pouvez vérifier la création de la table Iceberg. Dans cet exemple, vous utilisez Hue :
Propriétés de la table Iceberg sur Hue.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.