Accéder au contenu principal Passer au contenu complémentaire

Format de métadonnées Excel - Export

Availability-note AWS

Prérequis du pont

Ce pont :
  • nécessite un accès à Internet vers https://repo.maven.apache.org/maven2/ et/ou d'autres sites d'outils permettant de télécharger des pilotes dans <TDC_HOME>/data/download/MIMB/.

  • nécessite une installation de l'outil pour accéder à son SDK.

Spécifications du pont

Fournisseur Meta Integration Technology, Inc.
Nom de l'outil Format de métadonnées Excel
Version de l'outil Excel 2003 à 2010
Site Web de l'outil http://metaintegration.com/Products/MIMB/ (uniquement en anglais)
Méthodologie supportée [Gestion des métadonnées] Multimodèle, ETL (Data stores sources et cibles, Lignage de transformation, Parsage d'expressions, Conversion d'expression) via un fichier Excel 2007 (XLSX)

SPÉCIFICATIONS
Outil : Meta Integration Technology, Inc./Format de métadonnées Excel version Excel 2003 à 2010 via un fichier Excel 2007 (XLSX)
Consultez http://metaintegration.com/Products/MIMB/
Métadonnées : [Gestion des métadonnées] Multimodèle, ETL (Data stores sources et cibles, Lignage de transformation, Parsage d'expressions, Conversion d'expression)
Composant : MicrosoftExcel version 11.2.0

AVERTISSEMENT
Ce pont d'import requiert un accès à Internet pour télécharger les bibliothèques tierces :
- par exemple https://repo.maven.apache.org/maven2/ pour télécharger les bibliothèques tierces open source,
- et plus de sites pour d'autres logiciels tiers, comme les pilotes JDBC spécifiques pour les bases de données.

Les bibliothèques tierces téléchargées sont stockées dans $HOME/data/download/MIMB/
- Si le protocole HTTPS échoue, le pont d'import essaye ensuite avec HTTP.
- Si un proxy est utilisé pour accéder à Internet, vous devez configurer ce proxy dans l'environnement JRE (voir l'option -j dans le paramètre Divers).
- Si le pont d'import n'a pas d'accès à Internet, le répertoire $HOME/data/download/MIMB/ peut être copié depuis un autre serveur qui a accès à Internet, où la commande $HOME/bin/MIMB.sh (ou .bat) -d peut être utilisée pour télécharger en une fois toutes les bibliothèques tierces utilisées par tous les ponts.

En exécutant ce pont d'import, vous reconnaissez être responsable des conditions d'utilisation et de toute autre faille de sécurité potentielle liées au téléchargement de ces bibliothèques logicielles tierces.

VUE D'ENSEMBLE
L'objectif de ce pont d'import est d'importer des métadonnées depuis des technologies/outils pour lesquels aucun pont d'import existant n'est disponible : par exemple un data store hérité, des outils ETL ou des Jobs ETL écrits manuellement dans un langage non supporté.

Les outils de productivité, comme les outils d'édition de feuilles de calcul, sont généralement utilisés dans tout le secteur pour capturer, documenter ou publier des métadonnées physiques, logiques ou métier. Un outil tel que Microsoft Office Excel est le choix le plus courant et est presque toujours disponible. Il est compris par les utilisateurs professionnels qui le connaissent bien, permet d'effectuer des copier-coller compatibles avec d'autres applications Office et propose des options pratiques comme le correcteur d'orthographe. Des fonctions d'import et d'export de Microsoft Excel sont fournies afin de tirer parti de ces avantages.

Ce pont d'import importe les métadonnées représentant des data stores physiques, des modèles de données logiques et/ou des mappings de données exprimés dans des feuilles de calcul Microsoft Office Excel basés sur des métadonnées au format Excel standard qui utilisent plusieurs feuilles pour représenter divers aspects du métamodèle :
- Onglets Data Modeling (Modélisation de données) : Modèles, Packages, Relations, Domaines, Contraintes, Énumérations.
- Onglets Data Mappings (Mappings de données) : Mappings, Jointures, Filtres, Lookups, Règles.

Ce pont d'import importe des métadonnées en tant que :
- modèle d'intégration de données/de mapping de données si elles contiennent des mappings,
- modèle de données logique/physique si elles contiennent des packages,
- data store physique (p. ex. Oracle) dans tous les autres cas.

Un plug-in de Métadonnées au format Excel crée un menu "Métadonnées" dans le ruban Excel pour parcourir et gérer plus facilement les feuilles de calcul conçues à l'aide du format standard. Ces fonctions comprennent :
- l'insertion de nouvelles feuilles de travail au format "Standard" ;
- l'affichage ou le masquage des fonctions pour contrôler l'affichage des colonnes ;
- l'annotation, le formatage et la validation des entrées dans une feuille de travail.

Le meilleur moyen d'apprendre comment utiliser les métadonnées au format Excel standard est de s'appuyer sur des exemples précédemment exportés depuis des bases de données, modèles de données ou Jobs d'intégration de données importés.
Cependant, notez que le format de Métadonnées Excel n'a pas été conçu pour (et donc ne supporte pas) les allers-retours d'exports, de modifications et d'imports. En d'autres termes, ce pont d'import importe des métadonnées comme une technologie d'intégration, alors que le pont d'import correspondant exporte des métadonnées en tant que rapport (p. ex. en synthétisant un lignage de Jobs complexes d'intégration de données/ETL).

AVERTISSEMENT CONCERNANT LA DÉPRÉCIATION ET LA FIN DE VIE
Comme expliqué ci-dessus, le pont d'import "Metadata Excel Format (Format de métadonnées Excel)" est conçu pour émuler les outils non supportés (pour lesquels un pont d'import natif n'est pas disponible) dans deux situations indépendantes :
1- Modélisation de données émulant un data store (base de données, application métier, etc.)
2- Mapping de données émulant une intégration de données (DI, ETL, ELT, CDC)

Cet ancien pont d'import "Metadata Excel Format (Format de métadonnées Excel)" utilisé pour l'émulation de mapping de données (situation numéro 2) a été déprécié en 2022 et atteindra sa fin de vie sans support en 2024, car il a été remplacé par le pont d'import "Data Mapping Script (Script de mapping de données)", plus efficace.
Notez que le nouveau format de script de mapping de données fournit un nombre d'avantages par rapport à l'ancien format de métadonnées Excel (déprécié), notamment :
- Le format de script de mapping de données supporte les allers-retours (export/import) depuis/vers un mapping de données, alors que ce n'est pas le cas de l'ancien format de métadonnées Excel avec lequel l'export concernait les rapports et l'import l'amorçage (bootstrapping).
- Les fichiers du format de script de mapping de données sont généralement plus compacts que les fichiers très verbeux de métadonnées Excel basés sur les maps de classifieur/table et maps de fonctionnalités/colonnes.
- Le format de script de mapping de données est plus simple à générer à partir d'outils SQL basés DI/ETL/ELT/CDC.
- Le format de script de mapping de données supporte les mappings de masse et les mappings de requêtes, alors que le format de métadonnées Excel est limité dans sa gestion des mappings de masse.
- Le format de script de mapping de données supporte plus de technologies de data stores sources et cibles (SGBDR, NoSQL, systèmes de fichiers) que le format de métadonnées Excel.

PRÉREQUIS
n/a

FOIRE AUX QUESTIONS
Q : Comment puis-je lire un fichier XLSX avec une version d'Excel antérieure à 2007 ?

R : Depuis un centre de téléchargement Microsoft, installez le "Module de compatibilité Microsoft Office pour les formats de fichiers Word, Excel et PowerPoint". Il supporte Office XP et 2003.

Q : Comment résoudre le message d'erreur "Mémoire insuffisante" dans le log ?

R : Par défaut, le pont d'export alloue 512 Mo de mémoire. Pour les modèles volumineux, vous pouvez augmenter ce nombre, ainsi que passer à une machine virtuelle Java de 64 bits si vous avez besoin de plus de 2 Go. Mettez à jour le fichier de configuration $MetaIntegration/conf/conf.properties grâce au paramètre -Xmx pour une JVM de 64 bits, par exemple :
M_JAVA_HOME=..\jre
M_JAVA_OPTIONS=-Xmx2G

LIMITATIONS
Consultez les limitations générales connues à l'adresse MIMB Known Limitations ou dans Documentation/ReadMe/MIMBKnownLimitations.html où elles sont regroupées
Les outils de productivité, comme les outils d'édition de feuilles de calcul, sont généralement utilisés dans tout le secteur pour capturer, documenter ou publier des métadonnées physiques, logiques ou métier. Un outil tel que Microsoft Office Excel est le choix le plus courant et est presque toujours disponible. Il est compris par les utilisateurs professionnels qui le connaissent bien, permet d'effectuer des copier-coller compatibles avec d'autres applications Office et propose des options pratiques comme le correcteur d'orthographe. Des fonctions d'import et d'export de Microsoft Excel sont fournies afin de tirer parti de ces avantages.

1. Toutes les feuilles de calcul de sortie de métadonnées sont générées au format Standard, ce dernier étant le seul format supporté directement. Pour accommoder l'export vers une disposition de feuille de calcul définie, le format généré par le pont n'est pas codé en dur mais défini par les feuilles de calcul vides, spécifiant comment chaque cellule de feuille de calcul est liée au métamodèle de référentiel neutre. Cette flexibilité n'est disponible qu'avec un pont d'export personnalisé spécifique et qui doit être fourni par des services d'assistance.

2. Bien que les deux fonctions d'import (lecture à partir d'une feuille de calcul) et d'export (écriture dans une feuille de calcul) sont disponibles, elles ne sont pas faites pour supporter des allers-retours de re-traitement. Par exemple, les prérequis de mapping peuvent subir un traitement préalable dans un outil d'intégration de données/ETL mais le but de réexporter depuis cet outil d'intégration de données/ETL dans Excel est de fournir un résumé de lignage de mapping indépendant des diverses transformations internes complexes et de ne pas re-traiter la conception ni de la réimporter.

3. Les modèles d'outil de conception et d'architecture de données supportent des éditions de type aller-retour dans Excel afin d'exploiter les fonctions de correcteur d'orthographe, de copier-coller basé sur les colonnes et lignes et d'autres aspects pratiques inhérents à un environnement de feuille de calcul. Dans ce cas, la feuille de calcul doit être exportée, modifiée, puis réimportée dans l'outil de conception d'origine, tirant ainsi profit des fonctions de comparaison et de fusion fournies par l'outil de "réception".

4. Les nouveaux data stores sources ou cibles peuvent être exportés vers une feuille de calcul existante, mais sans bénéficier des fonctions de fusion ou de mise à jour cette fois. De plus, lors de l'import d'une feuille de calcul Excel dans un outil d'intégration de données/ETL, l'outil "récepteur" est responsable de l'intégration/la fusion des modèles ainsi que des mappings dans ses versions existantes.

5. Des suppositions et limitations sont fournies pour chaque format pré-défini dans le fichier ${MODEL_BRIDGE_HOME}\conf\MIRModelBridgeTemplate\MIRMicrosoftExcel\*-Blank.xlsx approprié.

6.Dans certains cas, l'utilisation d'une feuille de calcul pour gérer des métadonnées peut connaître des limitations. Il n'existe pas de limite réelle pour les informations représentées comme des lignes dans la feuille de calcul. Par exemple, il n'existe pas de limite du nombre d'entités/tables par modèle ou du nombre d'attributs/colonnes par entité/table. Toutefois, il existe des limitations pour toute information représentée comme colonnes pour des raisons de facilité d'utilisation. Par exemple, l'imbrication de packages dans un modèle, le nombre de clés PK/FK/AK dans lesquelles un attribut/une colonne donné(e) est impliqué(e) et, plus important encore, le nombre de propriétés définies par l'utilisateur (UDP) personnalisées associées à une entité/table, un attribut/une colonne ou un type de données.

SUPPORT
Fournissez un package de dépannage avec :
- le log de débogage (peut être défini dans l'UI ou dans conf/conf.properties avec MIR_LOG_LEVEL=6)
- la sauvegarde des métadonnées si disponible (peut être configurée dans le paramètre Divers avec l'option -backup, même si cette option commune n'est pas implémentée pour tous les ponts pour des raisons techniques).

Ce pont d'export permet de générer des métadonnées exprimées dans des feuilles de calcul Microsoft Excel, qui peuvent contenir n'importe quoi, de simples modèles de données à des mappings complexes (où plusieurs feuilles Excel sont utilisées pour définir les modèles de données sources, le modèle de données cible et le mapping entre eux). La feuille de calcul générée est fournie au format XLSX. Le paramètre "Fichier" doit contenir le nom de cette feuille de calcul, qualifiée de "feuille de calcul de sortie des métadonnées".

Les feuilles de calcul générées sont des fichiers XLSX Office 2007. Pour lire ces fichiers dans Office 2003 ou Office XP, téléchargez et installez le "Module de compatibilité" de Microsoft.

Cette feuille de calcul de sortie des métadonnées est fournie dans un format spécifique qualifié de "Standard". Afin de vous fournir un exemple de ce format et de la façon de remplir ce type de fichier, il existe un fichier nommé Standard-Blank.xlsx. Il contient un ensemble complet de feuilles de travail et d'en-têtes de colonne possibles, ainsi que la définition du contenu et sa signification. Par défaut, ce fichier se trouve dans le répertoire dont le chemin d'accès est : ${MODEL_BRIDGE_HOME}\conf\MIRModelBridgeTemplate\MIRMicrosoftExcel\.

Est également fourni un "ruban" ou un menu basé sur un "plug-in" Excel pour vous aider à parcourir et à gérer les feuilles de calcul créées à l'aide du format standard. Ces fonctions permettent notamment :

- d'insérer de nouvelles feuilles de travail au format "Standard" ;
- d'afficher ou de masquer des fonctions pour contrôler l'affichage des colonnes ;
- d'annoter, de formater et de valider des entrées dans une feuille de travail.
Afin d'activer ces options dans Microsoft Office Excel, vous devez installer le plug-in fourni avec le logiciel. Ces types de plug-ins sont fournis pour Microsoft Office Excel 2007 et 2003. Des instructions d'installation sont fournies dans la feuille de calcul exportée dans la section de commentaire Utiliser une cellule dans toutes les feuilles de travail de type "Modèles".


Paramètres du pont

Nom du paramètre Description Type Valeurs Défaut Périmètre
Fichier Exporte un modèle dans une feuille de calcul Excel sous forme de texte. Le paramètre "Fichier" est le nom de fichier de cette feuille de calcul. Son extension doit être XLSX. Fichier *.xlsx   Éléments obligatoires
Inclure le nom et la description métier Inclure le nom et la description métier des objets lors de l'export vers une feuille de calcul. Ils deviennent le Nom et la Description.

"True (Vrai)"
Ils sont exportés vers la feuille de calcul.

"False (Faux)"
Ils ne sont pas exportés vers la feuille de calcul.
BOOLEAN
false
true
true  
Miscellaneous INTRODUCTION
Spécifiez les options Divers, commençant par un tiret et suivies éventuellement par des paramètres, par exemple :
-connection.cast MyDatabase1="MICROSOFT SQL SERVER"
Certaines options peuvent être utilisées plusieurs fois, si applicable, par exemple :
-connection.rename NewConnection1=OldConnection1 -connection.rename NewConnection2=OldConnection2;
La liste d'options pouvant être une longue chaîne, il est possible de la charger à partir d'un fichier qui doit être situé dans ${MODEL_BRIDGE_HOME}\data\MIMB\parameters et avoir l'extension .txt. Dans ce cas, toutes les options doivent être définies au sein de ce fichier comme seule valeur de ce paramètre, par exemple
ETL/Miscellaneous.txt

OPTIONS DE L'ENVIRONNEMENT JAVA
-java.memory <taille maximale de la mémoire Java> (anciennement -m)

1 Go par défaut sur un JRE de 64 bits ou tel que défini dans conf/conf.properties, par exemple
-java.memory 8G
-java.memory 8000M

-java.parameters <options de ligne de commande de Java Runtime Environment> (anciennement -j)

Cette option doit être la dernière dans le paramètre Divers car tout le texte après -java.parameters est passé tel quel à la JRE. Par ex.
-java.parameters -Dname=value -Xms1G
L'option suivante doit être définie lorsqu'un proxy est utilisé pour accéder à Internet (cela est essentiel pour accéder à https://repo.maven.apache.org/maven2/ et exceptionnellement à quelques autres sites d'outils) afin de télécharger les bibliothèques logicielles tierces nécessaires.
Note : La majorité des proxys sont relatifs au chiffrement (HTTPS) du trafic extérieur (à l'entreprise) et à la confiance en le trafic intérieur pouvant accéder au proxy via HTTP. Dans ce cas, une requête HTTPS atteint le proxy via HTTP où le proxy la chiffre en HTTPS.
-java.parameters -java.parameters -Dhttp.proxyHost=127.0.0.1 -Dhttp.proxyPort=3128 -Dhttp.proxyUser=user -Dhttp.proxyPassword=pass
Chaîne de caractères      

 

Mapping du pont

Meta Integration Repository (MIR)
Métamodèle
(se base sur le standard OMG CWM)
"Format de métadonnées Excel"
Métamodèle
MicrosoftExcel
Mapping des commentaires
     
Attribut Attributs, SourceAttributes ou TargetAttributes  
Comment Commentaire de l'attribut  
Description Description de l'attribut  
InitialValue Valeur initiale de l'attribut  
Name (Nom) Nom d'attribut Talend Administration Center  
Facultatif Attribut facultatif Attribut requis
PhysicalName Nom physique de l'attribut  
Position Position de l'attribut  
Classe Classes, SourceClasses (Classes sources) ou TargetClasses (Classes cibles)  
Comment Commentaire de la classe  
Description Description de la classe  
Name (Nom) Class Name (Nom de la classe)  
PhysicalName Nom physique de la classe  
ClassifierMap   Calculé en se basant sur les FeatureMaps
DataAttribute   Calculé en se basant sur les FeatureMaps
DataSet   Créé en se basant sur la Transformation
DatabaseSchema Schémas, SourceSchemas ou TargetSchemas Créé en se basant sur le "Type système"
Commentaire Commentaire du schéma  
Description Description du schéma  
Name (Nom) Nom du schéma  
PhysicalName Nom physique du schéma  
DerivedType   Créé en utilisant le "Type de données hérité de" ou calculé en se basant sur les données du modèle.
Comment Commentaire du type de données  
Description Description du type de données  
InitialValue Valeur initiale du type de données  
Length (Longueur) Longueur du type de données  
LowerBound Valeur min du type de données  
Name (Nom) Nom du type de données  
PhysicalName Nom physique du type de données  
Échelle Échelle du type de données  
UpperBound Valeur max du type de données  
UserDefined   Calculé en se basant sur l'utilisation du type de données
DesignPackage DataPackages, SourceDataPackages ou TargetDataPackages  
Comment Commentaire du package  
Description Description du package  
Name (Nom) Nom du package  
PhysicalName Nom physique du package  
FeatureMap FeatureMaps Calculé en se basant sur les références des attributs sources et cibles.
Description Description de la FeatureMap  
Name (Nom) Nom de la FeatureMap  
Operation (Opération) Opération de la FeatureMap  
FileDirectory Schémas, SourceSchemas ou TargetSchemas Créé en se basant sur le "Type système"
Commentaire Commentaire du schéma  
Description Description du schéma  
Name (Nom) Nom du schéma  
PhysicalName Nom physique du schéma  
PropertyType   Défini dans le modèle
DataType (TypeDeDonnées)   Défini dans le modèle
InitialValue   Défini dans le modèle
Name (Nom)   Défini dans le modèle
Name (Nom)   Défini dans le modèle
Valeur   Défini dans le modèle
StoreModel Modèles  
Author Heure de création du modèle  
Comment Commentaire du modèle  
CreationTime Heure de création du modèle  
Description Description du modèle  
ModificationTime Heure de création du modèle  
Modificateur Heure de création du modèle  
Name (Nom) Nom du modèle  
PhysicalName Nom du modèle physique  
SystemType Type du système  
SystemTypeOld Type du système  
TypeValue DataTypes, SourceDataTypes ou TargetDataTypes  
Description Data Type Enumerated Value Description  
Name (Nom) Data Type Enumerated Value  

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.