Visualiser le lignage du flux de données
La fonctionnalité de lignage de flux de données vous permet de vous focaliser sur des objets spécifiques et d'afficher comment ces objets sont liés les uns aux autres, au sein d'un modèle, d'un référentiel externe de métadonnées ou d'une configuration.
Le lignage de flux de données se base sur des définitions de connexions aux magasins de données et sur des règles de transformations physiques transformant et déplaçant les données.
Il y a trois types d'analyses de flux de données :
- Le lignage de données s'applique en amont du flux de données. Il fait référence à une question de lignage inversée, demandant d'où viennent les informations.
- L'impact de données s'applique en aval du flux de données. Il fait référence à une question de lignage vers l'avant, demandant quels seront les impacts d'une modification.
- Le lignage complet de données s'applique en amont et en aval du flux de données. Il fait simultanément référence aux deux types.
Vous pouvez utiliser l'onglet Data Flow (Flux de données) pour différentes raisons et différentes perspectives :
- Vous pouvez invoquer un suivi de lignage ou d'impact en allant dans l'onglet Data Flow (Flux de données) ou dans le menu contextuel d'un classifieur (table, fichier, entité, etc.) ou d'une fonctionnalité (colonne, champ, attribut, etc.), ce qui présente un suivi de bout en bout à travers tous les modèles et les mappings dans votre configuration courante.
- Vous pouvez invoquer une vue d'ensemble du lignage dans l'onglet Data Flow (Flux de données) depuis la page des détails d'un modèle, d'un schéma, d'un Job ETL, d'une conception BI etc., ce qui présente le lignage au sein du modèle, même sans le connecter aux autres modèles.
La trace d'un lignage de flux de données présente un lignage résumé, à l'inverse du lignage de vue d'ensemble du flux de données, qui présente le lignage de transformation détaillé. Lorsque vous effectuez le suivi d'impact ou le lignage d'une table ou d'une colonne, vous ne voyez pas toutes les transformations. À la place, vous voyez un résumé du processus complet.
Les constantes ne sont pas affichées dans le diagramme du lignage. Si une constante s'affiche comme source pour un lignage et que le processus n'a que cette constante comme source pour la trace de lignage, vous ne voyez pas ce processus dans la trace de lignage.