Analisi della derivazione in Analisi
La derivazione traccia i dati e le trasformazioni dati a ritroso fino alla sorgente originale. Qlik Cloud fornisce una rappresentazione visiva dettagliata della cronologia di questo flusso, in cui è possibile esaminare in modo interattivo la derivazione a monte dei contenuti analitici. La derivazione è disponibile per contenuti quali applicazioni, script, flussi di dati, configurazioni tabella, esperimenti ML, distribuzioni ML e set di dati.
Gli utenti aziendali che esaminano un determinato campo hanno una vista della derivazione per il campo che ne riassume le dipendenze più importanti:
- Campi utilizzati per derivarlo
- Associazioni e dipendenze dirette, inclusi proprietario e spazio
- Sorgente originale (la prima sorgente nota)
Per visualizzare le dipendenze a valle o future, è possibile esaminare quali elementi sarebbero interessati da una modifica all'oggetto visualizzando l'Analisi dell'impatto. Vedere Analizzare l'analisi dell'impatto in Analisi.
Per una demo visiva su come utilizzare la derivazione, vedere:
Per utilizzare la derivazione, è inoltre necessario che Visualizza derivazione sia impostato su Consentito tramite User Default o un ruolo di sicurezza personalizzato.
Il grafico della derivazione
Il grafico della Derivazione mostra il flusso di dati attraverso i contenuti analitici in un grafico interattivo. Una risorsa, una tabella o un campo è chiamato nodo in un grafico della derivazione. Quando un nodo è il nodo di base in fase di analisi, si dice che è a fuoco e viene visualizzato come ultimo elemento nel grafico. Al livello più granulare, i grafici della derivazione a livello di campo mostrano le sorgenti dati e le trasformazioni dati da cui un nodo ha origine o da cui dipende.
I grafici della derivazione sono utili per:
-
Esperti di dati che lavorano con i dati
-
Specialisti aziendali che creano applicazioni
-
Utenti aziendali avanzati che utilizzano applicazioni
-
Utenti che lavorano con modelli di machine learning
Ogni nodo rappresenta un passaggio nella derivazione del contenuto selezionato. Queste informazioni sulla derivazione vengono compilate ogni volta che una risorsa analitica aggiorna i propri dati. Se l'applicazione, lo script, il flusso di dati o la configurazione tabella non sono stati aggiornati di recente, la derivazione potrebbe essere incompleta o imprecisa.
La derivazione è disponibile per i tipi di contenuto supportati dal riquadro o dalla riga così come appaiono nel catalogo. È possibile analizzare la derivazione per i seguenti contenuti analitici:
-
Set di dati: I set di dati sono sorgenti dati, come i dati caricati da connettori o file di dati. I set di dati possono essere tabelle in un database, dati caricati nell'archiviazione dati o dati generati da un'applicazione, come un file qvd. I set di dati di solito hanno una singola tabella ciascuno, ma alcuni, come i file Excel, possono avere più tabelle.
I set di dati pubblicati da Talend Studio sono indicati con
. È possibile passare al processo Talend Management Console utilizzato per generare il set di dati facendo clic su Apri processo TMC nel menu ... del set di dati. Per ulteriori informazioni, vedere Pubblicazione di set di dati e derivazione in Qlik Cloud. -
App: I nodi dell'applicazione rappresentano le applicazioni analitiche Qlik Sense che utilizzano le sorgenti dati nella derivazione. I nodi dell'applicazione visualizzano il nome dell'applicazione e la posizione dell'applicazione come Qlik Sense.
-
Script: I nodi dello script rappresentano gli script creati nell'interfaccia Script.
-
Flusso di dati: I flussi di dati possono essere ispezionati per una migliore comprensione delle sorgenti dati che utilizzano e trasformano.
-
Configurazione tabella: Le configurazioni tabella possono essere ispezionate per una migliore comprensione della sorgente dati che utilizzano e trasformano.
-
Esperimento ML: È possibile comprendere la derivazione di un esperimento di machine learning, che consiste nelle sorgenti dati che si sono unite per produrre i dati di addestramento per i modelli di machine learning.
-
Distribuzione ML: È possibile comprendere la derivazione di una distribuzione ML e come viene utilizzata nelle previsioni. La derivazione per le distribuzioni ML è in genere costituita da esperimenti ML, versioni di esperimenti, modelli e set di dati.
I nodi di input tipici includono sorgenti dati utilizzate dal nodo di base o applicazioni che producono set di dati. La derivazione a livello di campo consente un'indagine dettagliata su come sono stati calcolati i campi e sulla loro origine specifica attraverso trasformazioni e applicazioni.
I nodi disponibili in un grafico della derivazione sono gli input per il contenuto selezionato. Selezionare un elemento per designarlo come nodo di base. I nodi di input sono nodi a monte del nodo di base.
Grafico della derivazione a livello di campo

I nodi disponibili in un grafico della derivazione sono gli input per il nodo di base selezionato, in altre parole il nodo a fuoco. Il nodo di base è il singolo nodo per il quale si desidera recuperare la derivazione; ad esempio, potrebbe essere un'applicazione, un flusso di dati, un esperimento ML, un set di dati, un file, una tabella o un campo.
Sarà il nodo più a destra sullo schermo e delineato in blu. È il fulcro dell'indagine e verranno presentati solo gli input a quel nodo di base.
Mentre si esplora la derivazione, è possibile modificare in modo interattivo il nodo di base in un'altra tabella, applicazione, campo o altro elemento sullo schermo per concentrare l'indagine.
Nodo di base della derivazione

Le linee che collegano i nodi sono i bordi. I bordi rappresentano la relazione di un nodo con un altro nodo. Rappresentano relazioni che indicano associazioni come un set di dati utilizzato da un'applicazione. Possono anche rappresentare dati prodotti come sottoprodotto di un'applicazione. L'insieme di nodi e bordi costituisce il grafico della derivazione.
I bordi della derivazione rappresentano le relazioni

I nodi si comprimono o si espandono per rivelare i livelli di gerarchia da una granularità grossolana a una più fine, a partire dal gruppo di set di dati o dall'applicazione di livello superiore fino al livello più granulare, ovvero il livello di campo.
In questa immagine di un nodo, vengono mostrati i seguenti livelli di gerarchia, dal più alto (più grossolano) al più basso (più granulare): Risorsa dati (applicazione), risorsa (set di dati), tabella e campi.

Apertura del grafico della derivazione
Procedere come indicato di seguito:
-
Aprire il centro attività Informazioni strategiche o Analisi.
-
Selezionare Strumenti > Derivazione nel menu contestuale
su un elemento che supporta la derivazione.
È inoltre possibile accedere al grafico della derivazione di alcuni contenuti quando si ha un elemento aperto. Fare clic su e Derivazione.
Dettagli del nodo
I dettagli sono limitati dall'accesso a tale oggetto. I dettagli possono fornire le seguenti informazioni:
-
Nome
-
Descrizione
-
Tag
-
Posizione
-
Spazio
-
Proprietario
-
Creatore
-
Ultima modifica
Navigazione nel grafico della derivazione
Fare clic e trascinare il grafico per navigare e centrare il grafico della derivazione. È inoltre possibile utilizzare i pulsanti di navigazione. Selezionare Home per centrare il grafico della derivazione sul nodo di base. Fare clic su Indietro e Avanti per spostarsi tra le selezioni.
Navigazione nel grafico della derivazione
Il grafico della Derivazione mostra le dipendenze a monte per i contenuti analitici, che vengono presentati come nodo predefinito quando si apre il grafico per essi. È possibile accedere alla derivazione (a monte) o all'analisi dell'impatto (a valle) per altri nodi che appaiono nel grafico selezionando e Derivazione (nuovo nodo di base) o Analisi dell'impatto. Selezionare un nodo per designarlo come nodo di base.
Espandere o comprimere
i nodi per espandere o comprimere gruppi di oggetti allo stesso livello.
Opzione di menu per analizzare nodi diversi

Vista di riepilogo della derivazione in un'applicazione
La vista di riepilogo della derivazione in un'applicazione può fornire agli utenti aziendali una panoramica di alto livello delle dipendenze a monte nell'applicazione. Per ulteriori informazioni, vedere La vista di riepilogo in-app della derivazione.
Analisi della derivazione per i contenuti di machine learning
È possibile utilizzare il grafico della Derivazione per analizzare le origini dei contenuti di machine learning, inclusi esperimenti ML, distribuzioni ML e set di dati. Utilizzare il grafico per una vista olistica di come sono stati creati i modelli di machine learning, dei dati su cui sono stati addestrati e per cosa vengono utilizzati negli scenari di produzione.
Esperimenti, distribuzioni e set di dati appaiono anche come nodi durante l'analisi di altri contenuti nel grafico della Derivazione, come le applicazioni a valle.
Le risorse di machine learning sono mostrate anche nell'Analisi dell'impatto per un'analisi completa dei contenuti a valle. Per ulteriori informazioni, vedere Analizzare l'analisi dell'impatto in Analisi.
Apertura della Derivazione per i contenuti di machine learning
Effettuare una delle seguenti operazioni:
-
Nel centro attività, fare clic su
accanto a un esperimento ML, a una distribuzione ML o a un set di dati e selezionare Strumenti > Derivazione.
-
In un esperimento ML o in una distribuzione ML, fare clic su
nella barra di navigazione e selezionare Derivazione.
Navigazione nella Derivazione per i contenuti di machine learning
I nodi di machine learning vengono esplorati negli stessi modi degli altri contenuti. Per le panoramiche dell'interfaccia, vedere:
Riconoscimento degli elementi di machine learning nel grafico della Derivazione
La seguente tabella delinea gli elementi comuni relativi al machine learning che appaiono nel grafico della Derivazione.
| Elemento | Icona/e | Spiegazione |
|---|---|---|
| Archiviazione file |
|
Non esclusivo per i contenuti di machine learning. Mostra la posizione in cui è archiviato un set di dati (nella maggior parte dei casi, in uno spazio). Rilevante per il set di dati di addestramento, le esportazioni dall'analisi integrata in un esperimento, i set di dati di applicazione utilizzati per le previsioni e i set di dati di output delle previsioni. |
| Set di dati | Molti (ad esempio, |
Non esclusivo per i contenuti di machine learning. Utilizzato per rappresentare set di dati di addestramento, esportazioni dall'analisi integrata in un esperimento, set di dati di applicazione e set di dati di output delle previsioni. |
| Esperimento ML |
|
Un esperimento ML in cui vengono addestrati i modelli. |
| Versione dell'esperimento ML |
|
La versione all'interno dell'esperimento ML, in cui sono stati addestrati uno o più modelli. |
| Modello ML |
|
Un modello ML addestrato all'interno di una versione dell'esperimento. Utilizzato per rappresentare modelli addestrati in un esperimento ML e modelli distribuiti in una distribuzione ML. |
| Distribuzione ML |
|
Una distribuzione ML che contiene uno o più modelli distribuiti. |
| Nessuna icona | - | I nodi di output delle previsioni all'interno di una distribuzione ML non hanno icone. Anche i campi inclusi in un set di dati di output delle previsioni non hanno icone. |
Derivazione ed esperimenti ML
Gli esperimenti ML sono presentati in disposizioni raggruppate. Si espandono come segue:
-
Un esperimento ML si espande in una o più versioni dell'esperimento.
-
Una versione dell'esperimento si espande in uno o più modelli ML.
Quando un modello addestrato in un esperimento viene distribuito in una distribuzione ML, appare nel grafico della derivazione quando il contenuto a valle (ad esempio, previsioni o distribuzioni ML) è selezionato come nodo di base.
Derivazione e distribuzioni ML
Le distribuzioni ML sono presentate in disposizioni raggruppate. Si espandono come segue:
-
Una distribuzione ML si espande in uno o più modelli distribuiti.
-
Se un modello nella distribuzione è stato utilizzato in previsioni batch, il modello si espande per mostrare ogni output della previsione batch.
La derivazione a livello di campo è disponibile per i set di dati di applicazione e i set di dati di output delle previsioni relativi a una distribuzione ML.
I modelli distribuiti utilizzati per le previsioni sono ricollegati all'esperimento in cui sono stati addestrati.
Scenario di esempio
Per uno scenario di esempio, vedere Esempio: Indagine sulla derivazione dei contenuti di machine learning.
Limitazioni
Il grafico della derivazione presenta le seguenti limitazioni:
-
Le applicazioni che non sono state ricaricate dopo il rilascio della derivazione in Qlik Cloud potrebbero non avere informazioni complete sulla derivazione disponibili fino a dopo il ricaricamento. I dettagli per alcuni nodi potrebbero essere limitati se non sono stati caricati dopo l'attivazione della derivazione per il proprio tenant.
-
I dettagli del nodo per i set di dati esterni al proprio tenant, come le connessioni SQL Server o Google Drive, sono limitati al tipo di set di dati e al nome. Le connessioni REST visualizzano solo che si tratta di dati REST.
-
Se un elemento viene eliminato, potrebbe essere ancora mostrato nella Derivazione durante l'analisi di altri nodi.
Autorizzazioni
È necessario essere in grado di visualizzare un elemento per visualizzarne la derivazione dai propri centri attività. Se è possibile visualizzare il grafico della derivazione per un nodo di base, si è in grado di visualizzare i dettagli di base e i metadati per gli oggetti della derivazione a monte.
Sicurezza
-
Un utente può passare solo a un nodo di base a cui ha accesso; in caso contrario, il menu contestuale non è disponibile.
-
Se un utente ha accesso al nodo di base, avrà accesso per visualizzare tutta la derivazione a monte.
Casi d'uso di esempio per l'analisi della derivazione
Per una procedura dettagliata dell'analisi della derivazione, vedere Casi d'uso della derivazione a livello di campo.
Esempio: Esplorazione della provenienza delle informazioni con la vista di riepilogo della derivazione
In qualità di consumatore di analisi che osserva un grafico a barre in un'applicazione cars-data4-app, si desidera sapere da dove provengono le informazioni. Assicurarsi che Mostra dettagli e Mostra espressioni siano attivati per il grafico nella sezione Aspetto > Generale delle proprietà, quindi selezionare il passaggio alla modalità di analisi del foglio. Fare clic con il pulsante destro del mouse sul grafico, oppure utilizzare il menu , e selezionare Mostra dettagli per mostrare la vista del consumatore della derivazione. Fare clic su Mostra dipendenze.
Si nota che la dimensione Car_ID dipende dal campo Car_ID che si trova in tre sorgenti CSV elencate. Selezionare il menu sulla voce del campo e selezionare Derivazione - Car_ID / Cars per aprire un grafico della derivazione per il campo Car_ID nell'applicazione.
Selezionare una sorgente o un campo per visualizzare la derivazione per tale oggetto

Il grafico della derivazione viene visualizzato da destra a sinistra e mostra che il campo Car_ID si trova nella tabella Cars che è stata caricata nell'applicazione cars-data4-app. Espandere i nodi mentre si traccia la cronologia del campo a ritroso fino al file originale che è stato caricato in Qlik Cloud. Si nota che il primo passaggio a ritroso mostra che un CSV cars-data.csv contenente il campo Car_ID è stato caricato nell'applicazione cars-data4-app. Il nodo successivo a ritroso è un'applicazione cars-data3-app da cui è stato generato il cars-data.csv. Tornando indietro di un altro passaggio ed espandendo il nodo, si nota che il file sorgente originale era un file CSV cars-data3.csv e conteneva il campo ID.
Espandendo le tabelle e visualizzando i campi, è possibile identificare il file sorgente originale, la tabella e il campo della dimensione del grafico a barre Car_id-ID.
Espandere i nodi per tracciare la cronologia di un campo a ritroso fino al file sorgente

Esempio: Indagine sulle origini di un set di dati e su come è stato creato
In qualità di sviluppatore di applicazioni, si sta valutando l'utilizzo di un set di dati esistente current_customers_analytics.xlsx per la propria applicazione. Si indagano le origini di questo set di dati in modo da poter comprendere da dove provengono i dati. Dal riquadro del set di dati o dalla riga, selezionare Derivazione dal menu per aprire il grafico della derivazione. Dal grafico della derivazione, si visualizzano i metadati per il set di dati selezionando il menu
sull'XLSX current_customers_analytics.xlsx e Apri la panoramica.
Aprire la panoramica del set di dati dal grafico della derivazione

Visualizzare tag, classificazioni e altri metadati tecnici dalla scheda della panoramica del set di dati

Il profilo dati è disponibile dalla scheda Profilo

Fare clic sulla freccia indietro del browser per tornare al grafico della derivazione per esplorare il grafico della derivazione per il set di dati. Espandere il nodo current_customers_analytics.xlsx e fare clic su Seleziona tutto per visualizzare i campi disponibili. Fare lo stesso per tutti i nodi. Si noti che ogni campo offre l'opzione per renderlo il nodo di base a fuoco selezionando Derivazione (nuovo nodo di base) o selezionare Analisi dell'impatto per visualizzare la derivazione in avanti e gli oggetti dipendenti che saranno interessati dalle modifiche al set di dati.
Grafico della Derivazione espanso per il set di dati. Ogni campo all'interno di ogni nodo avrà opzioni per aprire l'applicazione o i dati, visualizzare l'analisi dell'impatto o modificare il nodo a fuoco

Seguendo la derivazione a ritroso ed espandendo i nodi, è possibile vedere che questo set di dati XLSX è l'output dell'applicazione Prep Current Customers Sales - Analytics. Tornando indietro di un altro passaggio ed espandendo il nodo Archiviazione file, si nota che all'applicazione di analisi delle vendite era stato caricato un file CSV: rgb_customers.csv. L'analisi a livello di campo rivela che il campo Tags nel file sorgente originale è stato rinominato in rgb_customers.Tags nell'applicazione di analisi delle vendite. Il file CSV originale può essere aperto nella panoramica per rivelare metadati preziosi come il proprietario, il creatore, le metriche di utilizzo, i tag, le classificazioni, il profilo del campo e l'analisi dell'impatto.
Esempio: Indagine sulla derivazione dei contenuti di machine learning
Un utente aziendale occasionale o un esperto di machine learning potrebbe utilizzare il grafico della Derivazione per ispezionare le origini di determinati valori previsti. Con il nodo di base impostato sul set di dati di previsione, questo utente può vedere:
-
I dati di addestramento, incluse le relative sorgenti e trasformazioni
-
L'esperimento, la versione dell'esperimento e il modello
-
Dove è stato distribuito il modello e come è stato utilizzato
Grafico della derivazione con tutti i nodi espansi. Il grafico mostra un flusso end-to-end dalla preparazione dei dati di addestramento a un set di dati di previsione.

L'immagine sopra mostra il seguente processo:
-
Un flusso di dati
carica e trasforma i dati da un set di dati CSV
archiviato in uno spazio personale
. L'output viene archiviato in un set di dati Parquet
nello stesso spazio.
-
Il set di dati Parquet
viene utilizzato nella versione 1
di un esperimento ML
. Questa versione dell'esperimento addestra un modello ML
.
-
Il modello ML
viene distribuito in una distribuzione ML
.
-
Utilizzando un set di dati CSV
in uno spazio personale
come set di dati di applicazione, la distribuzione ML
genera un set di dati di previsione in formato Parquet
.
Derivazione in Integrazione dati
Il grafico della Derivazione è disponibile anche in Integrazione dati. Per ulteriori informazioni, vedere Analisi della derivazione in Integrazione dati.