Gestion des métadonnées des jeux de données
Le catalogue fournit plusieurs couches de métadonnées descriptives et techniques essentielles sur les jeux de données. Ces informations facilitent l'organisation et l'attribution des ressources et de l'accès.
Les développeurs d'applications utilisent les statistiques de profil et l'échantillonnage des données pour se donner des idées et définir une orientation lors de la création d'applications et de la planification de visualisations. Le profilage des champs peut aider les analystes de données et les utilisateurs métier à obtenir des informations analytiques plus rapidement sans devoir commencer par créer une application. Que vous soyez administrateur de données ou consommateur de données, le fait de connaître la provenance de vos jeux de données et de savoir que les métadonnées sont fiables augmente votre confiance lors de l'analyse des ressources de données.
Autorisations d'affichage des jeux de données et des métadonnées
Des autorisations sont nécessaires, dans un espace, pour afficher des jeux de données et des métadonnées de jeux de données. Les deux actions effectuent un mappage vers Répertorier et utiliser une source de données. Pour plus d'informations, consultez Gestion des autorisations dans les espaces partagés ou Gestion des autorisations dans les espaces gérés.
- Afficher des jeux de données > Répertorier et utiliser une source de données
- Afficher des métadonnées > Répertorier et utiliser une source de données
Vue d'ensemble d'un jeu de données
L'onglet Vue d'ensemble des jeux de données fournit une synthèse des métadonnées descriptives et techniques de vos jeux de données.
L'onglet Vue d'ensemble capture les informations suivantes :
- Les métadonnées techniques telles que la taille, le propriétaire, le type de fichier et les horodatages de création, de dernière modification et d'actualisation des métadonnées. Les métabalises qui ont été appliquées au jeu de données apparaissent au-dessus de ces informations.
- Des Classifications sont appliquées aux jeux de données pour les associer à des domaines logiques définis par l'utilisateur.
Procédez comme suit :
-
Dans l'onglet Accueil de Qlik Cloud Analytics, sélectionnez l'icône Cataloguer dans la barre de navigation gauche ; ou, dans l'onglet Cataloguer, filtrez sur Types : Données.
Lorsque vous survolez une mosaïque Jeu de données, l'icône d'extension de fichier de données (par exemple : .XLSX) se transforme en un bouton Ouvrir le jeu de données. Le nom du fichier source apparaît dessous. Les jeux de données héritent leur nom du fichier de données d'origine et il est possible de le modifier.
-
Sélectionnez Ouvrir le jeu de données pour afficher une Vue d'ensemble de cet jeu de données.
Détails | Description |
---|---|
Balises | Métabalises appliquées (exemple : tag1, tier3, upgrade, etc.) |
Type | Extension du type de fichier (exemple : .TXT) |
Taille du fichier | Taille du fichier ou du contenu (exemple : 559 KB) |
Source | Nom de la ressource de données d'origine (exemple : MyVolumes.txt) |
Espace | Nom associé à l'espace de destination. Suivant les autorisations, il peut s'agir d'un espace personnel, partagé, géré ou de données. |
Propriétaire | Propriétaire du contenu (exemple : JS Jan Smith) |
Auteur | Auteur du contenu (exemple : JS Jan Smith) |
Date de création | Horodatage de création de l'objet jeu de données (exemple : Feb 18, 2022 7:21 PM) |
Date de modification | Horodatage de la dernière modification apportée à (exemple : Feb 18, 2022 7:21 PM). Cette valeur change lorsque les événements suivants se produisent : Charger, Renommer, Modifier la description, Modifier le propriétaire, Modifier le script. |
Champs | Nombre de colonnes du jeu de données. |
Nombre de lignes | Nombre d'enregistrements du jeu de données. |
Visité par | Nombre de visiteurs uniques au cours des 28 derniers jours. |
Utilisé dans | Nombre d'applications qui utilisent un jeu de données spécifique. |
Date d'actualisation des métadonnées | Horodatage de la dernière actualisation des métadonnées dérivées de la source du jeu de données comme le profil, le nombre d'enregistrements et le nombre de colonnes. |
Balisage de jeux de données
Les balises (également appelées métabalises) sont appliquées par les utilisateurs pour faciliter la localisation et l'organisation des données. Les contributeurs de données saisissent et appliquent des balises de forme libre aux jeux de données pour améliorer la recherche et la catégorisation. Il s'agit d'un outil utile pour les administrateurs de données qui ont besoin de filtrer certains types de ressources de données pour de nombreuses raisons, notamment pour l'allocation de ressources de centres de coûts, la segmentation des services commerciaux et marketing et la stratégie de gouvernance et des autorisations. Les développeurs d'applications et les consommateurs de données utilisent des balises pour identifier les jeux de données afin d'améliorer l'efficacité et l'organisation.
Les métabalises qui ont été appliquées à un jeu de données apparaissent directement au-dessus des métadonnées détaillées dans l'onglet Vue d'ensemble.
Application de métabalises à des jeux de données
Procédez comme suit :
Sélectionnez Ouvrir le jeu de données, puis le menu , et sélectionnez Modifier le jeu de données, ou, dans le menu de la mosaïque, sélectionnez Modifier. Une boîte apparaît, permettant de modifier le Nom, la Description et les Balises du jeu de données. Les balises déjà appliquées au jeu de données apparaissent dans la liste.
Dans la boîte Balises, saisissez des balises composées d'une chaîne de caractères (les espaces et les caractères spéciaux sont autorisés dans une limite de 31 caractères sur plusieurs balises). Saisissez chaque balise séparément, puis sélectionnez Enregistrer pour enregistrer les nouvelles balises. Il est possible de supprimer des balises individuelles en sélectionnant x sur les balises.
Filtrage des métabalises
Procédez comme suit :
Ouvrez l'onglet Catalogue, s'il n'est pas ouvert. Sous la liste déroulante Types, sélectionnez Données.
Sélectionnez Tous les filtres pour ouvrir le panneau latéral gauche Filtres ; faites défiler vers le bas et saisissez les Balises en fonction desquelles filtrer les jeux de données.
Actualisation des métadonnées
Les métadonnées d'un jeu de données du catalogue adhèrent au modèle de gestion des métadonnées au dernier état connu. Ce modèle fournit des informations et des actions qui vous garantissent de toujours savoir à quel point les métadonnées dérivées sont à jour. Les métadonnées dérivées reflètent l'état de vos données et sont différentes des métadonnées contrôlées par l'utilisateur et le système.
Pour actualiser les métadonnées dérivées, sélectionnez l'icône d'actualisation verte . Si aucune modification n'est détectée et si les métadonnées sont à jour, l'icône d'actualisation sera grisée. Le champ Date d'actualisation des métadonnées indique l'heure de la dernière actualisation des métadonnées dérivées.
Les métadonnées sont actualisées en cas de détection de changements dans le schéma. En cas de modification des données—par exemple, en cas d'ajout ou de déduction de données—l'icône d'actualisation devient verte. Si vous sélectionnez l'icône, la valeur Date de modification changera, mais pas la valeur Date d'actualisation des métadonnées, car les métadonnées dérivées n'ont pas changé.
Les métadonnées dérivées sont actualisées à des moments différents suivant que le jeu de données est chargé dans Qlik Cloud ou qu'il s'agit d'un jeu de données externe, qu'il s'agisse d'un jeu de données récemment enregistré ou d'un jeu de données qui existe déjà dans le système :
Lors de leur import, les données récemment enregistrées dans le catalogue sont automatiquement profilées.
- Il se peut que les métadonnées de profil des données figurant déjà dans le système sans métadonnées dérivées n'aient jamais été calculées. L'ouverture d'un jeu de données existant sans profil calculé déclenchera son profilage. En cas de mises à jour du fichier après ce calcul, l'icône d'actualisation apparaîtra de nouveau en vert, indiquant qu'il est possible d'actualiser le jeu de données en sélectionnant l'icône.
- Lorsque le système détecte un changement dans le schéma d'une table d'un jeu de données, l'icône d'actualisation des métadonnées est verte, indiquant qu'il est possible d'actualiser les métadonnées dérivées pour refléter l'état existant des données.
- L'icône d'actualisation des ressources externes sera toujours verte. Sélectionnez l'icône d'actualisation des métadonnées pour vous assurer que les métadonnées dérivées reflètent l'état existant des données.
Configuration des classifications des jeux de données
Des classifications peuvent être appliquées aux jeux de données pour les associer à des domaines définis par l'utilisateur spécifiques. Les classifications peuvent s'avérer utiles pour identifier des informations sensibles ou simplement des domaines distincts.
Procédez comme suit :
Dans l'onglet Vue d'ensemble du jeu de données, recherchez la section Classifications et sélectionnez Ajouter une classification. Saisissez un texte de forme libre décrivant un Domaine auquel appartient ce jeu de données. Si vous souhaitez appliquer une classification définie par l'utilisateur spécifique à une industrie ou à un cas d'utilisation, saisissez une description qui identifiera le jeu de données à l'aide de cette stratégie ou de ce regroupement.
Autorisations d'appliquer des classifications et des balises
Des autorisations sont nécessaires pour modifier et appliquer des classifications et des métabalises. Recherchez l'autorisation Modifier et appliquer des propriétés à la source de données de l'espace pour obtenir des détails sur ces sujets : voir Gestion des autorisations dans les espaces partagés ou Gestion des autorisations dans les espaces gérés.
Métriques relatives aux visiteurs et à l'utilisation des éléments
Les métriques relatives aux visiteurs et à l'utilisation vous permettent de quantifier la valeur de votre contenu en un clin d'œil en affichant le nombre et la tendance de visiteurs uniques au cours des 28 derniers jours (Visité par) et le nombre d'applications utilisant actuellement un élément donné (Utilisé dans).
Les métriques d'utilisation sont activées par défaut dans un client et peuvent être désactivées par un administrateur de clients. Voir Gestion des métriques d'utilisation. Si vous ne voyez pas ces statistiques dans votre client, cela signifie probablement qu'elles ont été désactivées.
Métriques relatives aux visiteurs
Le nombre de vues d'un élément au cours des 28 derniers jours constitue une bonne indication de sa popularité. Le fait de savoir le nombre de fois qu'un élément a été visité récemment permet également aux propriétaires de contenu d'obtenir de précieuses informations sur leur travail. Par exemple, un élément qui a été visité par un assez petit nombre d'utilisateurs peut indiquer que l'élément n'est plus utile ou qu'il doit être amélioré pour que sa popularité augmente.
Métriques relatives à l'utilisation des éléments
Vous pouvez voir à tout moment le nombre d'applications qui utilisent un élément donné en descendant facilement davantage dans la hiérarchie (en cliquant sur le nombre) pour afficher l'analyse de l'impact. Étant donné que les éléments ayant un nombre supérieur de dépendances sont généralement de meilleure qualité, le fait de connaître lesdites dépendances offre un moyen utile de quantifier la qualité des éléments. Les producteurs de données et d'analyses peuvent ensuite s'appuyer sur des éléments de meilleure qualité pour créer du contenu supplémentaire, tandis que les propriétaires de contenu peuvent déterminer l'impact de toute modification apportée au contenu.
Comprendre les icônes des métriques
Le tableau ci-dessous décrit les icônes utilisées pour afficher les métriques relatives aux visiteurs et à l'utilisation des éléments en mode grille. Survolez une icône à l'aide de la souris pour afficher une infobulle contenant davantage d'informations. Notez que l'icône en forme de tête de flèche utilisée pour indiquer les tendances des visiteurs est également affichée en mode liste.
Détails | Description |
---|---|
Nombre de visiteurs uniques au cours des 28 derniers jours. L'icône en forme de tête de flèche indique la tendance au cours des 28 derniers jours. Par exemple, une tête de flèche pointant vers le haut (comme illustrée sur l'image) indique qu'il y a eu davantage de visiteurs uniques au cours de la deuxième période de 14 jours des 28 jours qu'au cours de la première période de 14 jours. Une tête de flèche pointant vers la droite () indique qu'il n'y a pas eu de changement au cours des 28 derniers jours. Une tête de flèche pointant vers le bas indique une tendance négative au cours des 28 derniers jours (). | |
Nombre d'applications qui utilisent un élément donné. Vous pouvez cliquer sur l'icône pour afficher l'analyse de l'impact. |
Emplacements des métriques
Les métriques relatives aux visiteurs et à l'utilisation sont disponibles aux emplacements répertoriés ci-dessous.
Sous la mosaïque de ressource de données en mode grille :
Le survol des icônes de métriques à l'aide de la souris affiche une infobulle contenant davantage d'informations.
Dans la vue Détails d'un jeu de données (vue par défaut lorsque vous ouvrez un jeu de données) :
Le survol de l'icône à l'aide de la souris affiche une infobulle contenant davantage d'informations. Cliquez sur le nombre Utilisé dans pour afficher l'analyse de l'impact.
Dans la vue Détails d'une application, qui s'ouvre si vous sélectionnez Détails dans le menu (Actions) :
Le survol de l'icône à l'aide de la souris affiche une infobulle contenant davantage d'informations. Notez que la métrique Utilisé dans n'apparaît pas pour les applications, car elle n'est pertinente que pour les ensembles de données.
En Mode liste :
Pour tout élément, le survol des nombres Visité par ou Utilisé dans à l'aide de la souris affiche une infobulle contenant davantage d'informations. Vous pouvez également cliquer sur le nombre de la colonne Utilisé dans pour afficher l'analyse de l'impact. Notez que la métrique Utilisé dans n'apparaît pas pour les applications, car elle n'est pertinente que pour les ensembles de données.
Options
Sélectionnez le menu pour accéder aux options suivantes :
- Ajouter à une collection : Les collections sont des organisations d'objets dans des centres d'activités. Sélectionnez cette option pour :
- Rechercher une collection
- Créer une collection
- Ajouter à une collection
- Renommer : sélectionnez pour modifier le Nom, la Description ou les Balises.
- Traçabilité : consultez Examen de la traçabilité pour les applications, les scripts et les jeux de données.
- Analyse de l'impact : consultez Examen de l'analyse de l'impact pour les applications, les scripts et les ensembles de données.
Paramètres de format de fichier : consultez Chargement de jeux de données et édition des paramètres de format de fichier.