Format de métadonnées Excel - Export
Prérequis du pont
Ce pont :nécessite un accès à Internet vers https://repo.maven.apache.org/maven2/ et/ou d'autres sites d'outils permettant de télécharger des pilotes dans <TDC_HOME>/data/download/MIMB/.
nécessite une installation de l'outil pour accéder à son SDK.
Spécifications du pont
Fournisseur | Meta Integration Technology, Inc. |
Nom de l'outil | Format de métadonnées Excel |
Version de l'outil | Excel 2003 à 2010 |
Site Web de l'outil | http://metaintegration.com/Products/MIMB/ (uniquement en anglais) |
Méthodologie supportée | [Gestion des métadonnées] Multimodèle, ETL (Data stores sources et cibles, Lignage de transformation, Parsage d'expressions, Conversion d'expression) via un fichier Excel 2007 (XLSX) |
SPÉCIFICATIONS
Outil : Meta Integration Technology, Inc./Format de métadonnées Excel version Excel 2003 à 2010 via un fichier Excel 2007 (XLSX)
Consultez http://metaintegration.com/Products/MIMB/
Métadonnées : [Gestion des métadonnées] Multimodèle, ETL (Data stores sources et cibles, Lignage de transformation, Parsage d'expressions, Conversion d'expression)
Composant : MicrosoftExcel version 11.2.0
AVERTISSEMENT
Ce pont d'import requiert un accès à Internet pour télécharger les bibliothèques tierces :
- par exemple https://repo.maven.apache.org/maven2/ pour télécharger les bibliothèques tierces open source,
- et plus de sites pour d'autres logiciels tiers, comme les pilotes JDBC spécifiques pour les bases de données.
Les bibliothèques tierces téléchargées sont stockées dans $HOME/data/download/MIMB/
- Si le protocole HTTPS échoue, le pont d'import essaye ensuite avec HTTP.
- Si un proxy est utilisé pour accéder à Internet, vous devez configurer ce proxy dans l'environnement JRE (voir l'option -j dans le paramètre Divers).
- Si le pont d'import n'a pas d'accès à Internet, le répertoire $HOME/data/download/MIMB/ peut être copié depuis un autre serveur qui a accès à Internet, où la commande $HOME/bin/MIMB.sh (ou .bat) -d peut être utilisée pour télécharger en une fois toutes les bibliothèques tierces utilisées par tous les ponts.
En exécutant ce pont d'import, vous reconnaissez être responsable des conditions d'utilisation et de toute autre faille de sécurité potentielle liées au téléchargement de ces bibliothèques logicielles tierces.
VUE D'ENSEMBLE
L'objectif de ce pont d'import est d'importer des métadonnées depuis des technologies/outils pour lesquels aucun pont d'import existant n'est disponible : par exemple un data store hérité, des outils ETL ou des Jobs ETL écrits manuellement dans un langage non supporté.
Les outils de productivité, comme les outils d'édition de feuilles de calcul, sont généralement utilisés dans tout le secteur pour capturer, documenter ou publier des métadonnées physiques, logiques ou métier. Un outil tel que Microsoft Office Excel est le choix le plus courant et est presque toujours disponible. Il est compris par les utilisateurs professionnels qui le connaissent bien, permet d'effectuer des copier-coller compatibles avec d'autres applications Office et propose des options pratiques comme le correcteur d'orthographe. Des fonctions d'import et d'export de Microsoft Excel sont fournies afin de tirer parti de ces avantages.
Ce pont d'import importe les métadonnées représentant des data stores physiques, des modèles de données logiques et/ou des mappings de données exprimés dans des feuilles de calcul Microsoft Office Excel basés sur des métadonnées au format Excel standard qui utilisent plusieurs feuilles pour représenter divers aspects du métamodèle :
- Onglets Data Modeling (Modélisation de données) : Modèles, Packages, Relations, Domaines, Contraintes, Énumérations.
- Onglets Data Mappings (Mappings de données) : Mappings, Jointures, Filtres, Lookups, Règles.
Ce pont d'import importe des métadonnées en tant que :
- modèle d'intégration de données/de mapping de données si elles contiennent des mappings,
- modèle de données logique/physique si elles contiennent des packages,
- data store physique (p. ex. Oracle) dans tous les autres cas.
Un plug-in de Métadonnées au format Excel crée un menu "Métadonnées" dans le ruban Excel pour parcourir et gérer plus facilement les feuilles de calcul conçues à l'aide du format standard. Ces fonctions comprennent :
- l'insertion de nouvelles feuilles de travail au format "Standard" ;
- l'affichage ou le masquage des fonctions pour contrôler l'affichage des colonnes ;
- l'annotation, le formatage et la validation des entrées dans une feuille de travail.
Le meilleur moyen d'apprendre comment utiliser les métadonnées au format Excel standard est de s'appuyer sur des exemples précédemment exportés depuis des bases de données, modèles de données ou Jobs d'intégration de données importés.
Cependant, notez que le format de Métadonnées Excel n'a pas été conçu pour (et donc ne supporte pas) les allers-retours d'exports, de modifications et d'imports. En d'autres termes, ce pont d'import importe des métadonnées comme une technologie d'intégration, alors que le pont d'import correspondant exporte des métadonnées en tant que rapport (p. ex. en synthétisant un lignage de Jobs complexes d'intégration de données/ETL).
AVERTISSEMENT CONCERNANT LA DÉPRÉCIATION ET LA FIN DE VIE
Comme expliqué ci-dessus, le pont d'import "Metadata Excel Format (Format de métadonnées Excel)" est conçu pour émuler les outils non supportés (pour lesquels un pont d'import natif n'est pas disponible) dans deux situations indépendantes :
1- Modélisation de données émulant un data store (base de données, application métier, etc.)
2- Mapping de données émulant une intégration de données (DI, ETL, ELT, CDC)
Cet ancien pont d'import "Metadata Excel Format (Format de métadonnées Excel)" utilisé pour l'émulation de mapping de données (situation numéro 2) a été déprécié en 2022 et atteindra sa fin de vie sans support en 2024, car il a été remplacé par le pont d'import "Data Mapping Script (Script de mapping de données)", plus efficace.
Notez que le nouveau format de script de mapping de données fournit un nombre d'avantages par rapport à l'ancien format de métadonnées Excel (déprécié), notamment :
- Le format de script de mapping de données supporte les allers-retours (export/import) depuis/vers un mapping de données, alors que ce n'est pas le cas de l'ancien format de métadonnées Excel avec lequel l'export concernait les rapports et l'import l'amorçage (bootstrapping).
- Les fichiers du format de script de mapping de données sont généralement plus compacts que les fichiers très verbeux de métadonnées Excel basés sur les maps de classifieur/table et maps de fonctionnalités/colonnes.
- Le format de script de mapping de données est plus simple à générer à partir d'outils SQL basés DI/ETL/ELT/CDC.
- Le format de script de mapping de données supporte les mappings de masse et les mappings de requêtes, alors que le format de métadonnées Excel est limité dans sa gestion des mappings de masse.
- Le format de script de mapping de données supporte plus de technologies de data stores sources et cibles (SGBDR, NoSQL, systèmes de fichiers) que le format de métadonnées Excel.
PRÉREQUIS
n/a
FOIRE AUX QUESTIONS
Q : Comment puis-je lire un fichier XLSX avec une version d'Excel antérieure à 2007 ?
R : Depuis un centre de téléchargement Microsoft, installez le "Module de compatibilité Microsoft Office pour les formats de fichiers Word, Excel et PowerPoint". Il supporte Office XP et 2003.
Q : Comment résoudre le message d'erreur "Mémoire insuffisante" dans le log ?
R : Par défaut, le pont d'export alloue 512 Mo de mémoire. Pour les modèles volumineux, vous pouvez augmenter ce nombre, ainsi que passer à une machine virtuelle Java de 64 bits si vous avez besoin de plus de 2 Go. Mettez à jour le fichier de configuration $MetaIntegration/conf/conf.properties grâce au paramètre -Xmx pour une JVM de 64 bits, par exemple :
M_JAVA_HOME=..\jre
M_JAVA_OPTIONS=-Xmx2G
LIMITATIONS
Consultez les limitations générales connues à l'adresse MIMB Known Limitations ou dans Documentation/ReadMe/MIMBKnownLimitations.html où elles sont regroupées
Les outils de productivité, comme les outils d'édition de feuilles de calcul, sont généralement utilisés dans tout le secteur pour capturer, documenter ou publier des métadonnées physiques, logiques ou métier. Un outil tel que Microsoft Office Excel est le choix le plus courant et est presque toujours disponible. Il est compris par les utilisateurs professionnels qui le connaissent bien, permet d'effectuer des copier-coller compatibles avec d'autres applications Office et propose des options pratiques comme le correcteur d'orthographe. Des fonctions d'import et d'export de Microsoft Excel sont fournies afin de tirer parti de ces avantages.
1. Toutes les feuilles de calcul de sortie de métadonnées sont générées au format Standard, ce dernier étant le seul format supporté directement. Pour accommoder l'export vers une disposition de feuille de calcul définie, le format généré par le pont n'est pas codé en dur mais défini par les feuilles de calcul vides, spécifiant comment chaque cellule de feuille de calcul est liée au métamodèle de référentiel neutre. Cette flexibilité n'est disponible qu'avec un pont d'export personnalisé spécifique et qui doit être fourni par des services d'assistance.
2. Bien que les deux fonctions d'import (lecture à partir d'une feuille de calcul) et d'export (écriture dans une feuille de calcul) sont disponibles, elles ne sont pas faites pour supporter des allers-retours de re-traitement. Par exemple, les prérequis de mapping peuvent subir un traitement préalable dans un outil d'intégration de données/ETL mais le but de réexporter depuis cet outil d'intégration de données/ETL dans Excel est de fournir un résumé de lignage de mapping indépendant des diverses transformations internes complexes et de ne pas re-traiter la conception ni de la réimporter.
3. Les modèles d'outil de conception et d'architecture de données supportent des éditions de type aller-retour dans Excel afin d'exploiter les fonctions de correcteur d'orthographe, de copier-coller basé sur les colonnes et lignes et d'autres aspects pratiques inhérents à un environnement de feuille de calcul. Dans ce cas, la feuille de calcul doit être exportée, modifiée, puis réimportée dans l'outil de conception d'origine, tirant ainsi profit des fonctions de comparaison et de fusion fournies par l'outil de "réception".
4. Les nouveaux data stores sources ou cibles peuvent être exportés vers une feuille de calcul existante, mais sans bénéficier des fonctions de fusion ou de mise à jour cette fois. De plus, lors de l'import d'une feuille de calcul Excel dans un outil d'intégration de données/ETL, l'outil "récepteur" est responsable de l'intégration/la fusion des modèles ainsi que des mappings dans ses versions existantes.
5. Des suppositions et limitations sont fournies pour chaque format pré-défini dans le fichier ${MODEL_BRIDGE_HOME}\conf\MIRModelBridgeTemplate\MIRMicrosoftExcel\*-Blank.xlsx approprié.
6.Dans certains cas, l'utilisation d'une feuille de calcul pour gérer des métadonnées peut connaître des limitations. Il n'existe pas de limite réelle pour les informations représentées comme des lignes dans la feuille de calcul. Par exemple, il n'existe pas de limite du nombre d'entités/tables par modèle ou du nombre d'attributs/colonnes par entité/table. Toutefois, il existe des limitations pour toute information représentée comme colonnes pour des raisons de facilité d'utilisation. Par exemple, l'imbrication de packages dans un modèle, le nombre de clés PK/FK/AK dans lesquelles un attribut/une colonne donné(e) est impliqué(e) et, plus important encore, le nombre de propriétés définies par l'utilisateur (UDP) personnalisées associées à une entité/table, un attribut/une colonne ou un type de données.
SUPPORT
Fournissez un package de dépannage avec :
- le log de débogage (peut être défini dans l'UI ou dans conf/conf.properties avec MIR_LOG_LEVEL=6)
- la sauvegarde des métadonnées si disponible (peut être configurée dans le paramètre Divers avec l'option -backup, même si cette option commune n'est pas implémentée pour tous les ponts pour des raisons techniques).
Ce pont d'export permet de générer des métadonnées exprimées dans des feuilles de calcul Microsoft Excel, qui peuvent contenir n'importe quoi, de simples modèles de données à des mappings complexes (où plusieurs feuilles Excel sont utilisées pour définir les modèles de données sources, le modèle de données cible et le mapping entre eux). La feuille de calcul générée est fournie au format XLSX. Le paramètre "Fichier" doit contenir le nom de cette feuille de calcul, qualifiée de "feuille de calcul de sortie des métadonnées".
Les feuilles de calcul générées sont des fichiers XLSX Office 2007. Pour lire ces fichiers dans Office 2003 ou Office XP, téléchargez et installez le "Module de compatibilité" de Microsoft.
Cette feuille de calcul de sortie des métadonnées est fournie dans un format spécifique qualifié de "Standard". Afin de vous fournir un exemple de ce format et de la façon de remplir ce type de fichier, il existe un fichier nommé Standard-Blank.xlsx. Il contient un ensemble complet de feuilles de travail et d'en-têtes de colonne possibles, ainsi que la définition du contenu et sa signification. Par défaut, ce fichier se trouve dans le répertoire dont le chemin d'accès est : ${MODEL_BRIDGE_HOME}\conf\MIRModelBridgeTemplate\MIRMicrosoftExcel\.
Est également fourni un "ruban" ou un menu basé sur un "plug-in" Excel pour vous aider à parcourir et à gérer les feuilles de calcul créées à l'aide du format standard. Ces fonctions permettent notamment :
- d'insérer de nouvelles feuilles de travail au format "Standard" ;
- d'afficher ou de masquer des fonctions pour contrôler l'affichage des colonnes ;
- d'annoter, de formater et de valider des entrées dans une feuille de travail.
Afin d'activer ces options dans Microsoft Office Excel, vous devez installer le plug-in fourni avec le logiciel. Ces types de plug-ins sont fournis pour Microsoft Office Excel 2007 et 2003. Des instructions d'installation sont fournies dans la feuille de calcul exportée dans la section de commentaire Utiliser une cellule dans toutes les feuilles de travail de type "Modèles".
Paramètres du pont
Nom du paramètre | Description | Type | Valeurs | Défaut | Périmètre | ||
Fichier | Exporte un modèle dans une feuille de calcul Excel sous forme de texte. Le paramètre "Fichier" est le nom de fichier de cette feuille de calcul. Son extension doit être XLSX. | Fichier | *.xlsx | Éléments obligatoires | |||
Inclure le nom et la description métier | Inclure le nom et la description métier des objets lors de l'export vers une feuille de calcul. Ils deviennent le Nom et la Description. "True (Vrai)" Ils sont exportés vers la feuille de calcul. "False (Faux)" Ils ne sont pas exportés vers la feuille de calcul. |
BOOLEAN |
|
true | |||
Miscellaneous | INTRODUCTION Spécifiez les options Divers, commençant par un tiret et suivies éventuellement par des paramètres, par exemple : -connection.cast MyDatabase1="MICROSOFT SQL SERVER" Certaines options peuvent être utilisées plusieurs fois, si applicable, par exemple : -connection.rename NewConnection1=OldConnection1 -connection.rename NewConnection2=OldConnection2; La liste d'options pouvant être une longue chaîne, il est possible de la charger à partir d'un fichier qui doit être situé dans ${MODEL_BRIDGE_HOME}\data\MIMB\parameters et avoir l'extension .txt. Dans ce cas, toutes les options doivent être définies au sein de ce fichier comme seule valeur de ce paramètre, par exemple ETL/Miscellaneous.txt OPTIONS DE L'ENVIRONNEMENT JAVA -java.memory <taille maximale de la mémoire Java> (anciennement -m) 1 Go par défaut sur un JRE de 64 bits ou tel que défini dans conf/conf.properties, par exemple -java.memory 8G -java.memory 8000M -java.parameters <options de ligne de commande de Java Runtime Environment> (anciennement -j) Cette option doit être la dernière dans le paramètre Divers car tout le texte après -java.parameters est passé tel quel à la JRE. Par ex. -java.parameters -Dname=value -Xms1G L'option suivante doit être définie lorsqu'un proxy est utilisé pour accéder à Internet (cela est essentiel pour accéder à https://repo.maven.apache.org/maven2/ et exceptionnellement à quelques autres sites d'outils) afin de télécharger les bibliothèques logicielles tierces nécessaires. Note : La majorité des proxys sont relatifs au chiffrement (HTTPS) du trafic extérieur (à l'entreprise) et à la confiance en le trafic intérieur pouvant accéder au proxy via HTTP. Dans ce cas, une requête HTTPS atteint le proxy via HTTP où le proxy la chiffre en HTTPS. -java.parameters -java.parameters -Dhttp.proxyHost=127.0.0.1 -Dhttp.proxyPort=3128 -Dhttp.proxyUser=user -Dhttp.proxyPassword=pass |
Chaîne de caractères |
Mapping du pont
Meta Integration Repository (MIR) Métamodèle (se base sur le standard OMG CWM) |
"Format de métadonnées Excel" Métamodèle MicrosoftExcel |
Mapping des commentaires |
Attribut | Attributs, SourceAttributes ou TargetAttributes | |
Comment | Commentaire de l'attribut | |
Description | Description de l'attribut | |
InitialValue | Valeur initiale de l'attribut | |
Name (Nom) | Nom d'attribut Talend Administration Center | |
Facultatif | Attribut facultatif | Attribut requis |
PhysicalName | Nom physique de l'attribut | |
Position | Position de l'attribut | |
Classe | Classes, SourceClasses (Classes sources) ou TargetClasses (Classes cibles) | |
Comment | Commentaire de la classe | |
Description | Description de la classe | |
Name (Nom) | Class Name (Nom de la classe) | |
PhysicalName | Nom physique de la classe | |
ClassifierMap | Calculé en se basant sur les FeatureMaps | |
DataAttribute | Calculé en se basant sur les FeatureMaps | |
DataSet | Créé en se basant sur la Transformation | |
DatabaseSchema | Schémas, SourceSchemas ou TargetSchemas | Créé en se basant sur le "Type système" |
Commentaire | Commentaire du schéma | |
Description | Description du schéma | |
Name (Nom) | Nom du schéma | |
PhysicalName | Nom physique du schéma | |
DerivedType | Créé en utilisant le "Type de données hérité de" ou calculé en se basant sur les données du modèle. | |
Comment | Commentaire du type de données | |
Description | Description du type de données | |
InitialValue | Valeur initiale du type de données | |
Length (Longueur) | Longueur du type de données | |
LowerBound | Valeur min du type de données | |
Name (Nom) | Nom du type de données | |
PhysicalName | Nom physique du type de données | |
Échelle | Échelle du type de données | |
UpperBound | Valeur max du type de données | |
UserDefined | Calculé en se basant sur l'utilisation du type de données | |
DesignPackage | DataPackages, SourceDataPackages ou TargetDataPackages | |
Comment | Commentaire du package | |
Description | Description du package | |
Name (Nom) | Nom du package | |
PhysicalName | Nom physique du package | |
FeatureMap | FeatureMaps | Calculé en se basant sur les références des attributs sources et cibles. |
Description | Description de la FeatureMap | |
Name (Nom) | Nom de la FeatureMap | |
Operation (Opération) | Opération de la FeatureMap | |
FileDirectory | Schémas, SourceSchemas ou TargetSchemas | Créé en se basant sur le "Type système" |
Commentaire | Commentaire du schéma | |
Description | Description du schéma | |
Name (Nom) | Nom du schéma | |
PhysicalName | Nom physique du schéma | |
PropertyType | Défini dans le modèle | |
DataType (TypeDeDonnées) | Défini dans le modèle | |
InitialValue | Défini dans le modèle | |
Name (Nom) | Défini dans le modèle | |
Name (Nom) | Défini dans le modèle | |
Valeur | Défini dans le modèle | |
StoreModel | Modèles | |
Author | Heure de création du modèle | |
Comment | Commentaire du modèle | |
CreationTime | Heure de création du modèle | |
Description | Description du modèle | |
ModificationTime | Heure de création du modèle | |
Modificateur | Heure de création du modèle | |
Name (Nom) | Nom du modèle | |
PhysicalName | Nom du modèle physique | |
SystemType | Type du système | |
SystemTypeOld | Type du système | |
TypeValue | DataTypes, SourceDataTypes ou TargetDataTypes | |
Description | Data Type Enumerated Value Description | |
Name (Nom) | Data Type Enumerated Value |