Vai al contenuto principale Passa a contenuto complementare

Gestione dei metadati a livello di campo e profilazione dei dati

Gli amministratori dati accedono a informazioni tecniche approfondite sui propri set di dati dalla profilazione. Gli sviluppatori di app utilizzano le statistiche dei profili e il campionamento dati per ottenere idee e indicazioni per la creazione di app e la pianificazione di visualizzazioni. La profilazione campi può aiutare gli analisti dati e gli utenti aziendali a ottenere più rapidamente informazioni strategiche. Possono vedere e visualizzare preziose metriche sui profili di campo rapidamente senza bisogno creare prima un'app. I metadati a livello di campo consentono agli utenti di applicare alias, descrizioni e classificazioni ai campi; queste funzioni aiutano a identificare dati specifici e campi sensibili.

Nota informaticaQlik Cloud può effettuare la profilazione per i set di dati fino a 12 milioni di righe. Se un set di dati ha più di 12 milioni di righe, la profilazione verrà effettuata solo per i primi 12 milioni. I metadati per tutti i campi vengono comunque aggiunti, indipendentemente dal numero di righe oggetto della profilazione.

Gestione dei metadati a livello di campo

È possibile accedere e modificare i metadati per ogni campo del set di dati dalla scheda Campi. Selezionare una scheda qualsiasi dalla vista Selezionare l'icona riquadro per la vista riquadri Tile, qualsiasi riga dalla vista Selezionare l'icona elenco per la vista elenco List o qualsiasi colonna dalla vista Dati per aprire il pannello Dettagli di quel campo a destra della griglia. I campi di metadati a livello di campo – Alias di campo, Descrizione, Tag e Classificazione – sono opzionali e possono essere definiti e modificati da questo pannello.

Campi metadati campi
Dettaglio Descrizione
Alias campo Inserire un nome alternativo opzionale per rendere i nomi dei campi più significativi nell'analisi del profilo. I nomi dei campi alias vengono visualizzati solo nell'analisi del profilo e non influiscono sui nomi delle colonne tecniche.
Descrizione

Inserire qualsiasi informazione che possa essere utile agli utenti che visualizzano i metadati del campo e la profilazione del campo.

Tag Inserire frammenti di testo per definire e categorizzare questo campo e i suoi dati.
Classificazione Selezionare la casella di controllo per Informazioni personali o Informazioni sensibili.
Nota informaticaLe classificazioni selezionate a livello di campo Informazioni personali e Informazioni sensibili appaiono nella scheda Panoramica del set di dati elencate per campo sotto i metadati tecnici del set di dati.
Nota informaticaLe classificazioni applicate ai campi in file Excel con più fogli saranno elencate con il nome del foglio e il nome del campo (esempio: Informazioni personali: Sheet1/EmpID).

Metadati a livello di campo per un file XLSX con più fogli

Selezionare una scheda di campo nella vista riquadri per aprire il pannello Dettagli

Profilazione dei dati

Le statistiche dei profili forniscono analisi in colonne che misurano incidenza, intervalli e valori presenti nei set di dati. Tali metriche descrivono le relazioni tra valori di campo come:

  • conteggio dei valori distinti (cardinalità)
  • valori campione, valori più comuni e frequenza valore
  • ridondanze utili per identificare i valori predefiniti o duplicati potenziali
  • conteggi di valori null, stringa e numerici
  • informazioni sugli intervalli di valori, con inclusi valori min, max, media, somma e deviazione standard

Il catalogo fornisce tre viste dei dati dei profili di campo: Tile view, List view e Data view.

Tile view è una rappresentazione visiva basata su carte dei campi disposti come una griglia.

List view è un riepilogo tabellare delle statistiche del profilo configurabile.

Table view elenca i nomi delle colonne dei campi e fino ai primi venti record del set di dati.

Selezionare l'icona TileSelezionare l'icona riquadro per la vista riquadri, ListSelezionare l'icona elenco per la vista elenco o Dati per scorrere tra le visualizzazioni dei profili.

Vista Riquadro profilo

La vista Riquadro profilo è un profilo di campo visivo progettato per visualizzare il contenuto più informativo per tale tipo di campo. Il tipo di scheda vista predefinita mostrato è determinato dal fatto che il numero di valori numerici o testuali sia superiore per tale campo. Ad esempio, per i campi con valori sia testuali sia numerici, il tipo di scheda Most Common Values (Valori più comuni) viene visualizzato per impostazione predefinita se sono presenti più valori testuali, mentre il tipo di scheda di distribuzione numerica Binned Frequency (Frequenza partizionata) viene visualizzato in presenza di più valori numerici nel campo. Viene fornito un elenco selettore a discesa in modo che sia possibile passare al tipo di scheda Most Common Values (Valori più comuni) per qualsiasi campo che presenti valori non univoci quando viene selezionato Icona Valori più comuni ; oppure è possibile ritornare alla scheda di distribuzione numerica in caso di selezione di Binned Frequency (Frequenza partizionata) Icona Frequenza partizionata. Tenere presente che tutti i tipi di scheda includono il numero di valori null, se il campo presenta valori null.

Vista riquadri: i campi vengono profilati per metriche significative per il tipo di dati contenuti in tale campo (ad esempio: valori testuali vs numerici)

Vista riquadri profilo del set di dati

Scheda Valori campione

La scheda Valori campione viene mostrata quando tutti i valori sono unici e solo testuali. Vengono elencati (fino a) i primi tre valori e il numero totale di valori unici aggiuntivi.

Scheda vista riquadri: Valori campione
Riquadro valori campione

Criteri di profilo Valori campione: I valori dei campi sono profilati con questa scheda quando la cardinalità è alta (tutti i valori distinti). In un caso in cui ogni valore è basato sul testo e univoco, alcuni valori campione forniscono la migliore visione iniziale dei dati di questo tipo di campo.

Ciascuna scheda profilo Valori campione fornisce: 

  • Nome campo
  • Cardinalità (valori distinti)
  • Fino a tre valori campione (i campi possono avere meno di tre valori)

Scheda Most Common Values Frequency (Frequenza valori più comuni)

La scheda Most Common Values Frequency (Frequenza valori più comuni) mostra i cinque valori più comuni e la loro frequenza. Se ci sono più valori di cinque valori distinti, questi vengono combinati e visualizzati come Altro. Se in qualche campo mancano dei valori, il totale viene visualizzato come Nullo. Questa scheda profilo può essere applicata a valori testuali, numerici o con dati misti.

Scheda vista riquadri: Frequenza valori più comuni
Frequenza valori più comuni riquadri

Criteri Most Common Values Frequency (Frequenza valori più comuni): I campi che presentano pochi valori o una distribuzione asimmetrica di valori vengono profilati rispetto alla scheda Most Common Values Frequency (Frequenza valori più comuni). Questa profilazione si applica solo quando sono presenti più istanze degli stessi valori. Gli utenti possono ottenere rapidamente informazioni strategiche sulla distribuzione di valori di campo. Se i dati di campo includono valori sia testuali sia numerici, e sono presenti più valori testuali che numerici, allora viene mostrata la scheda Most Common Values Frequency (Frequenza valori più comuni). Il selettore Binned Frequency (Frequenza partizionata) viene fornito in presenza di più di tre valori numerici nel campo.

Ciascuna scheda profilo Most Common Values Frequency (Frequenza valori più comuni) fornisce: 

  • Nome campo
  • Cardinalità (valori distinti)
  • Valori più comuni e relativa frequenza
  • Frequenza combinata Other (Altro) di valori rimanenti

Scheda Binned Frequency (Frequenza partizionata)

La scheda Binned Frequency (Frequenza partizionata) mostra le informazioni di distribuzione e profilazione rilevanti per i campi numerici; inclusi i valori dati minimi, medi e massimi. Se i dati di campo includono sia valori testuali sia numerici, e sono presenti più valori numerici che valori testuali, allora viene mostrata la scheda Binned Frequency (Frequenza partizionata). Il tipo di scheda Most Common Values Frequency (Frequenza valori più comuni) è disponibile per tutti i campi che presentano valori non univoci.

Scheda vista riquadri:Distribuzione numerica Binned Frequency (Frequenza partizionata)

Riquadro frequenza partizionata

Ciascuna scheda profilo Binned Frequency (Frequenza partizionata) fornisce: 

  • Nome campo
  • Cardinalità (valori distinti)
  • Istogramma che mostra la distribuzione di dati numerici
  • Valore minimo
  • Valore medio (la somma dei numeri divisi per il numero totale di valori nel set di dati)
  • Valore massimo

Profile List view (Vista elenco profilo)

Profile List view (Vista elenco profilo) fornisce una tabella con opzioni statistiche del profilo. Gli utenti controllano le metriche di interesse che sono più significative per il set di dati sotto ColumnPicker icona Colonne, individuabile scorrendo al bordo all'estrema destra della tabella. Le prime nove statistiche sono pre-selezionate per impostazione predefinita.

Vista elenco: Selezionare le statistiche del profilo di interesse dall'elenco a discesa Selettore colonne trovato scorrendo a destra sulla tabella

Vista elenco profilo del set di dati

Vista Dati profilo

La vista dati profilo mostra il set di dati dell'utente come una tabella dati lineare con i nomi delle colonne di campo e (fino a) i primi venti valori.

Visualizzazione dati: Vengono mostrati i nomi delle colonne del set di dati e i primi venti record

Vista dati profilo del set di dati

Autorizzazioni

Le autorizzazioni sono richieste per profilare e campionare i dati. È necessario disporre di un ruolo nello spazio del set di dati che consenta la profilatura di sorgente dati. Per ulteriori informazioni, vedere Gestione delle autorizzazioni negli spazi condivisi o Gestione delle autorizzazioni negli spazi gestiti.Managing permissions in shared spacesManaging permissions in managed spaces

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!