Analisi della derivazione in Analisi
La derivazione traccia i dati e le trasformazioni dati a ritroso fino alla sorgente originale. Qlik Cloud fornisce una rappresentazione visiva dettagliata della cronologia di questo flusso, in cui è possibile esaminare in modo interattivo la derivazione a monte dei contenuti analitici. La derivazione è disponibile per contenuti quali applicazioni, script, flussi di dati, configurazioni tabella, esperimenti ML, distribuzioni ML e dataset.
Gli utenti aziendali che esaminano un determinato campo hanno una vista della derivazione per il campo che riepiloga le sue dipendenze più importanti:
- Campi utilizzati per derivarlo
- Associazioni e dipendenze dirette, inclusi proprietario e spazio
- Sorgente originale (la prima sorgente nota)
Per visualizzare le dipendenze a valle o lungimiranti, è possibile esaminare quali elementi verrebbero influenzati da una modifica all'oggetto visualizzando Analisi di impatto. Vedere Analizzare l'analisi dell'impatto in Analisi.
Per una demo visiva su come utilizzare la derivazione, vedere:
Per utilizzare la derivazione, è inoltre necessario che Visualizza derivazione sia impostato su Consentito tramite User Default o un ruolo di sicurezza personalizzato.
Il grafico di derivazione
Il grafico Derivazione mostra il flusso di dati attraverso i contenuti analitici in un grafico interattivo. Una risorsa, una tabella o un campo viene definito nodo in un grafico di derivazione. Quando un nodo è il nodo di base oggetto dell'indagine, si dice che è in primo piano e viene visualizzato come ultimo elemento del grafico. Al livello più granulare, i grafici di derivazione a livello di campo mostrano le sorgenti dati e le trasformazioni da cui un nodo ha origine o da cui dipende.
I grafici di derivazione sono utili per:
-
Esperti di dati che lavorano con i dati
-
Specialisti aziendali che creano applicazioni
-
Utenti aziendali avanzati che utilizzano le applicazioni
-
Utenti che lavorano con modelli di machine learning
Ogni nodo rappresenta un passaggio nella derivazione del contenuto selezionato. Queste informazioni sulla derivazione vengono compilate ogni volta che una risorsa analitica aggiorna i propri dati. Se l'applicazione, lo script, il flusso di dati o la configurazione tabella non sono stati aggiornati di recente, la derivazione potrebbe essere incompleta o imprecisa.
La derivazione è disponibile per i tipi di contenuto supportati dal riquadro o dalla riga così come appaiono nel catalogo. È possibile analizzare la derivazione per i seguenti contenuti analitici:
-
Dataset: I dataset sono sorgenti dati, come i dati caricati da connettori o file di dati. I dataset possono essere tabelle in un database, dati caricati nell'archiviazione dati o dati generati da un'applicazione, come un file qvd. I dataset di solito hanno una singola tabella ciascuno, ma alcuni, come i file Excel, possono avere più tabelle.
I dataset pubblicati da Talend Studio sono indicati con
. È possibile passare al job di Talend Management Console utilizzato per generare il dataset facendo clic su Apri job TMC nel menu ... del dataset. Per ulteriori informazioni, vedere Pubblicazione di dataset e derivazione in Qlik Cloud. -
App: I nodi dell'applicazione rappresentano le applicazioni analitiche di Qlik Sense che utilizzano le sorgenti dati nella derivazione. I nodi dell'applicazione mostrano il nome dell'applicazione e la posizione dell'applicazione come Qlik Sense.
-
Script: I nodi script rappresentano gli script creati nell'interfaccia di Script.
-
Data flow: I flussi di dati possono essere esaminati per comprendere meglio le sorgenti dati che utilizzano e trasformano.
-
Table recipe: Le configurazioni tabella possono essere esaminate per comprendere meglio la sorgente dati che utilizzano e trasformano.
-
ML experiment: È possibile comprendere la derivazione di un esperimento di machine learning, costituito dalle sorgenti dati che si sono unite per produrre i dati di addestramento per i modelli di machine learning.
-
ML deployment: È possibile comprendere la derivazione di una distribuzione ML e come viene utilizzata nelle previsioni. La derivazione per le distribuzioni ML consiste in genere in esperimenti ML, versioni di esperimenti, modelli e dataset.
I tipici nodi di input includono sorgenti dati utilizzate dal nodo di base o applicazioni che producono dataset. La derivazione a livello di campo consente un'indagine dettagliata su come sono stati calcolati i campi e sulla loro origine specifica attraverso trasformazioni e applicazioni.
I nodi disponibili in un grafico di derivazione sono gli input per il contenuto selezionato. Selezionare un elemento per designarlo come nodo di base. I nodi di input sono nodi a monte del nodo di base.
Grafico di derivazione a livello di campo

I nodi disponibili in un grafico di derivazione sono gli input per il nodo di base selezionato, in altre parole il nodo in primo piano. Il nodo di base è il singolo nodo per il quale si desidera recuperare la derivazione; ad esempio, potrebbe essere un'applicazione, un flusso di dati, un esperimento ML, un dataset, un file, una tabella o un campo.
Sarà il nodo più a destra sullo schermo e con un contorno blu. È il fulcro dell'indagine e verranno presentati solo gli input per quel nodo di base.
Mentre si esplora la derivazione, è possibile modificare in modo interattivo il nodo di base in un'altra tabella, applicazione, campo o altro elemento sullo schermo per focalizzare l'indagine.
Nodo di base della derivazione

Le linee che collegano i nodi sono i collegamenti. I collegamenti rappresentano la relazione di un nodo con un altro nodo. Rappresentano relazioni che indicano associazioni, come un dataset utilizzato da un'applicazione. Possono anche rappresentare dati prodotti come sottoprodotto di un'applicazione. L'insieme di nodi e collegamenti costituisce il grafico di derivazione.
I collegamenti di derivazione rappresentano relazioni

I nodi si comprimono o si espandono per rivelare i livelli gerarchici, da una granularità grossolana a una più fine, a partire dal gruppo di dataset o dall'applicazione di livello superiore fino al livello più granulare, ovvero il livello di campo.
In questa immagine di un nodo, vengono mostrati i seguenti livelli gerarchici, dal più alto (più grossolano) al più basso (più granulare): risorsa dati (applicazione), risorsa (dataset), tabella e campi.

Apertura del grafico di derivazione
Procedere come indicato di seguito:
-
Aprire il centro attività Informazioni strategiche o Analisi.
-
Selezionare Strumenti > Derivazione nel menu contestuale
su un elemento che supporta la derivazione.
È inoltre possibile accedere al grafico di derivazione di alcuni contenuti quando un elemento è aperto. Fare clic su e Derivazione.
Dettagli del nodo
I dettagli sono limitati dall'accesso dell'utente a tale oggetto. I dettagli possono fornire le seguenti informazioni:
-
Nome
-
Descrizione
-
Tag
-
Posizione
-
Spazio
-
Proprietario
-
Creatore
-
Ultima modifica
Navigazione nel grafico di derivazione
Fare clic e trascinare il grafico per navigare e centrare il grafico di derivazione. È inoltre possibile utilizzare i pulsanti di navigazione. Selezionare Home per centrare il grafico di derivazione sul nodo di base. Fare clic su indietro e avanti per spostarsi tra le selezioni.
Navigazione nel grafico di derivazione
Il grafico Derivazione mostra le dipendenze a monte per il contenuto analitico, che viene presentato come nodo predefinito quando si apre il grafico corrispondente. È possibile accedere alla derivazione (a monte) o all'analisi di impatto (a valle) per altri nodi che appaiono nel grafico selezionando e Derivazione (nuovo nodo di base) o Analisi di impatto. Selezionare un nodo per designarlo come nodo di base.
Espandere o comprimere
i nodi per espandere o comprimere gruppi di oggetti allo stesso livello.
Opzione di menu per analizzare nodi diversi

Vista di riepilogo della derivazione in un'applicazione
La vista di riepilogo della derivazione in un'applicazione può fornire agli utenti aziendali una panoramica di alto livello delle dipendenze a monte nell'applicazione. Per ulteriori informazioni, vedere La vista di riepilogo in-app della derivazione.
Analisi della derivazione per i contenuti di machine learning
È possibile utilizzare il grafico Derivazione per analizzare le origini dei contenuti di machine learning, inclusi esperimenti ML, distribuzioni ML e dataset. Utilizzare il grafico per una vista olistica di come sono stati creati i modelli di machine learning, dei dati su cui sono stati addestrati e di come vengono utilizzati negli scenari di produzione.
Esperimenti, distribuzioni e dataset appaiono anche come nodi quando si analizzano altri contenuti nel grafico Derivazione, come le applicazioni a valle.
Le risorse di machine learning vengono mostrate anche in Analisi di impatto per un'analisi completa dei contenuti a valle. Per ulteriori informazioni, vedere Analizzare l'analisi dell'impatto in Analisi.
Apertura di Derivazione per i contenuti di machine learning
Effettuare una delle seguenti operazioni:
-
Nel proprio centro attività, fare clic su
accanto a un esperimento ML, una distribuzione ML o un dataset e selezionare Strumenti > Derivazione.
-
In un esperimento ML o in una distribuzione ML, fare clic su
nella barra di navigazione e selezionare Derivazione.
Navigazione in Derivazione per i contenuti di machine learning
I nodi di machine learning si esplorano nello stesso modo degli altri contenuti. Per le panoramiche dell'interfaccia, vedere:
Riconoscimento degli elementi di machine learning nel grafico Derivazione
La tabella seguente descrive gli elementi comuni relativi al machine learning che appaiono nel grafico Derivazione.
| Elemento | Icona/e | Spiegazione |
|---|---|---|
| Archiviazione file |
|
Non esclusivo dei contenuti di machine learning. Mostra la posizione in cui è memorizzato un dataset (nella maggior parte dei casi, in uno spazio). Rilevante per il dataset di addestramento, le esportazioni da analisi incorporate in un esperimento, i dataset di applicazione utilizzati per le previsioni e i dataset di output delle previsioni. |
| Dataset | Molti (ad esempio, |
Non esclusivo dei contenuti di machine learning. Utilizzato per rappresentare dataset di addestramento, esportazioni da analisi incorporate in un esperimento, dataset di applicazione e dataset di output delle previsioni. |
| Esperimento ML |
|
Un esperimento ML in cui vengono addestrati i modelli. |
| Versione dell'esperimento ML |
|
La versione all'interno dell'esperimento ML, in cui sono stati addestrati uno o più modelli. |
| Modello ML |
|
Un modello ML addestrato all'interno di una versione dell'esperimento. Utilizzato per rappresentare i modelli addestrati in un esperimento ML e i modelli distribuiti in una distribuzione ML. |
| Distribuzione ML |
|
Una distribuzione ML che contiene uno o più modelli distribuiti. |
| Nessuna icona | - | I nodi di output delle previsioni all'interno di una distribuzione ML non hanno icone. Anche i campi inclusi in un dataset di output delle previsioni non hanno icone. |
Derivazione ed esperimenti ML
Gli esperimenti ML sono presentati in disposizioni raggruppate. Si espandono come segue:
-
Un esperimento ML si espande in una o più versioni dell'esperimento.
-
Una versione dell'esperimento si espande in uno o più modelli ML.
Quando un modello addestrato in un esperimento viene distribuito in una distribuzione ML, appare nel grafico di derivazione quando il contenuto a valle (ad esempio, previsioni o distribuzioni ML) viene selezionato come nodo di base.
Derivazione e distribuzioni ML
Le distribuzioni ML sono presentate in disposizioni raggruppate. Si espandono come segue:
-
Una distribuzione ML si espande in uno o più modelli distribuiti.
-
Se un modello nella distribuzione è stato utilizzato nelle previsioni batch, il modello si espande per mostrare ciascun output di previsione batch.
La derivazione a livello di campo è disponibile per i dataset di applicazione e i dataset di output delle previsioni correlati a una distribuzione ML.
I modelli distribuiti utilizzati per le previsioni sono ricollegati all'esperimento in cui sono stati addestrati.
Scenario di esempio
Per uno scenario di esempio, vedere Esempio: Indagine sulla derivazione dei contenuti di machine learning.
Limitazioni
Il grafico di derivazione presenta le seguenti limitazioni:
-
Le applicazioni che non sono state ricaricate dopo il rilascio della derivazione in Qlik Cloud potrebbero non disporre di informazioni complete sulla derivazione fino a quando non vengono ricaricate. I dettagli per alcuni nodi potrebbero essere limitati se non sono stati caricati dopo l'attivazione della derivazione per il proprio tenant.
-
I dettagli dei nodi per i dataset esterni al proprio tenant, come le connessioni SQL Server o Google Drive, sono limitati al tipo di dataset e al nome. Le connessioni REST mostrano solo che si tratta di dati REST.
-
Se un elemento viene eliminato, potrebbe essere ancora mostrato in Derivazione durante l'analisi di altri nodi.
Autorizzazioni
È necessario essere in grado di visualizzare un elemento per visualizzarne la derivazione dai propri centri attività. Se si riesce a vedere il grafico di derivazione per un nodo di base, si è in grado di vedere i dettagli di base e i metadati per gli oggetti di derivazione a monte.
Sicurezza
-
Un utente può passare solo a un nodo di base a cui ha accesso; in caso contrario, il menu contestuale non è disponibile.
-
Se un utente ha accesso al nodo di base, avrà accesso per vedere tutta la derivazione a monte.
Casi d'uso di esempio per l'analisi della derivazione
Per una procedura dettagliata dell'analisi della derivazione, vedere Casi d'uso della derivazione a livello di campo.
Esempio: Esplorazione della provenienza delle informazioni con la vista di riepilogo della derivazione
Come consumatore di analisi che osserva un grafico a barre in un'applicazione cars-data4-app, si desidera sapere da dove provengono le informazioni. Assicurarsi che Mostra dettagli e Mostra espressioni siano attivati per il grafico nella sezione Aspetto > Generale delle proprietà, quindi passare alla modalità di analisi del foglio. Fare clic con il pulsante destro del mouse sul grafico o utilizzare il menu e selezionare Mostra dettagli per mostrare la vista consumatore della derivazione. Fare clic su Mostra dipendenze.
Si nota che la dimensione Car_ID dipende dal campo Car_ID che si trova in tre sorgenti CSV elencate. Selezionare il menu sulla voce del campo e selezionare Derivazione - Car_ID / Cars per aprire un grafico di derivazione per il campo Car_ID nell'applicazione.
Selezionare una sorgente o un campo per visualizzare la derivazione per tale oggetto

Il grafico di derivazione viene visualizzato da destra a sinistra e mostra che il campo Car_ID si trova nella tabella Cars caricata nell'applicazione cars-data4-app. Espandere i nodi mentre si traccia la cronologia del campo a ritroso fino al file originale caricato in Qlik Cloud. Si nota che il primo passaggio a ritroso mostra che un file CSV cars-data.csv contenente il campo Car_ID è stato caricato nell'applicazione cars-data4-app. Il nodo successivo a ritroso è un'applicazione cars-data3-app da cui è stato generato il file cars-data.csv. Tornando indietro di un altro passaggio ed espandendo il nodo, si nota che il file sorgente originale era un file CSV file cars-data3.csv e conteneva il campo ID.
Espandendo le tabelle e visualizzando i campi, è possibile identificare il file sorgente, la tabella e il campo originali della dimensione del grafico a barre Car_id-ID.
Espandere i nodi per tracciare la cronologia di un campo a ritroso fino al file sorgente

Esempio: Indagine sulle origini di un dataset e su come è stato creato
Come sviluppatore di applicazioni, si sta valutando l'utilizzo di un dataset esistente current_customers_analytics.xlsx per la propria applicazione. Si esaminano le origini di questo dataset per capire da dove provengono i dati. Dal riquadro o dalla riga del dataset, selezionare Derivazione dal menu per aprire il grafico di derivazione. Dal grafico di derivazione, è possibile visualizzare i metadati per il dataset selezionando il menu
sul file XLSX current_customers_analytics.xlsx e Apri la panoramica.
Aprire la panoramica del dataset dal grafico di derivazione

Visualizzare tag, classificazioni e altri metadati tecnici dalla scheda della panoramica del dataset

Il profilo dati è disponibile nella scheda Profilo

Fare clic sulla freccia indietro del browser per tornare al grafico di derivazione ed esplorare il grafico di derivazione per il dataset. Espandere il nodo current_customers_analytics.xlsx e fare clic su Seleziona tutto per visualizzare i campi disponibili. Fare lo stesso per tutti i nodi. Si noti che ogni campo offre l'opzione per renderlo il nodo di base in primo piano selezionando Derivazione (nuovo nodo di base) o selezionando Analisi di impatto per visualizzare la derivazione in avanti e gli oggetti dipendenti che saranno influenzati dalle modifiche al dataset.
Grafico Derivazione espanso per il dataset. Ogni campo all'interno di ciascun nodo avrà opzioni per aprire l'applicazione o i dati, visualizzare l'analisi di impatto o modificare il nodo in primo piano

Seguendo la derivazione a ritroso ed espandendo i nodi, è possibile vedere che questo dataset XLSX è l'output dell'applicazione Prep Current Customers Sales - Analytics. Tornando indietro di un altro passaggio ed espandendo il nodo Archiviazione file, si nota che all'applicazione di analisi delle vendite è stato caricato un file CSV: rgb_customers.csv. L'analisi a livello di campo rivela che il campo Tags nel file sorgente originale è stato rinominato in rgb_customers.Tags nell'applicazione di analisi delle vendite. Il file CSV originale può essere aperto nella panoramica per rivelare metadati preziosi come il proprietario, il creatore, le metriche di utilizzo, i tag, le classificazioni, il profilo del campo e l'analisi di impatto.
Esempio: Indagine sulla derivazione dei contenuti di machine learning
Un utente aziendale occasionale o un esperto di machine learning potrebbe utilizzare il grafico Derivazione per esaminare le origini di determinati valori previsti. Con il nodo di base impostato sul dataset di previsione, questo utente può vedere:
-
I dati di addestramento, incluse le relative sorgenti e trasformazioni
-
L'esperimento, la versione dell'esperimento e il modello
-
Dove è stato distribuito il modello e come è stato utilizzato
Grafico di derivazione con tutti i nodi espansi. Il grafico mostra un flusso end-to-end dalla preparazione dei dati di addestramento a un dataset di previsione.

L'immagine sopra mostra il seguente processo:
-
Un flusso di dati
carica e trasforma i dati da un dataset CSV
memorizzato in uno spazio personale
. L'output viene memorizzato in un dataset Parquet
nello stesso spazio.
-
Il dataset Parquet
viene utilizzato nella versione 1
di un esperimento ML
. Questa versione dell'esperimento addestra un modello ML
.
-
Il modello ML
viene distribuito in una distribuzione ML
.
-
Utilizzando un dataset CSV
in uno spazio personale
come dataset di applicazione, la distribuzione ML
genera un dataset di previsione in formato Parquet
.
La derivazione in Integrazione dati
Il grafico Derivazione è disponibile anche in Integrazione dati. Per ulteriori informazioni, vedere Analisi della derivazione in Integrazione dati.