Analisi della derivazione in Analisi | Guida di Qlik Cloud
Vai al contenuto principale Passa a contenuto complementare

Analisi della derivazione in Analisi

La derivazione traccia i dati e le trasformazioni dati a ritroso fino alla sorgente originale. Qlik Cloud fornisce una rappresentazione visiva dettagliata della cronologia di questo flusso, in cui è possibile esaminare in modo interattivo la derivazione a monte dei contenuti analitici. La derivazione è disponibile per contenuti quali applicazioni, script, flussi di dati, configurazioni tabella, esperimenti ML, distribuzioni ML e dataset.

Nota informaticaPer visualizzare la derivazione per i contenuti analitici, i dati sottostanti devono essere memorizzati in Qlik Cloud come sorgente catalogata.

Gli utenti aziendali che esaminano un determinato campo hanno una vista della derivazione per il campo che riepiloga le sue dipendenze più importanti:

  • Campi utilizzati per derivarlo
  • Associazioni e dipendenze dirette, inclusi proprietario e spazio
  • Sorgente originale (la prima sorgente nota)

Per visualizzare le dipendenze a valle o lungimiranti, è possibile esaminare quali elementi verrebbero influenzati da una modifica all'oggetto visualizzando Analisi di impatto. Vedere Analizzare l'analisi dell'impatto in Analisi.

Per una demo visiva su come utilizzare la derivazione, vedere:

Utilizzo della derivazione

Nota informatica

Per utilizzare la derivazione, è inoltre necessario che Visualizza derivazione sia impostato su Consentito tramite User Default o un ruolo di sicurezza personalizzato.

Il grafico di derivazione

Il grafico Derivazione mostra il flusso di dati attraverso i contenuti analitici in un grafico interattivo. Una risorsa, una tabella o un campo viene definito nodo in un grafico di derivazione. Quando un nodo è il nodo di base oggetto dell'indagine, si dice che è in primo piano e viene visualizzato come ultimo elemento del grafico. Al livello più granulare, i grafici di derivazione a livello di campo mostrano le sorgenti dati e le trasformazioni da cui un nodo ha origine o da cui dipende.

I grafici di derivazione sono utili per:

  • Esperti di dati che lavorano con i dati

  • Specialisti aziendali che creano applicazioni

  • Utenti aziendali avanzati che utilizzano le applicazioni

  • Utenti che lavorano con modelli di machine learning

Ogni nodo rappresenta un passaggio nella derivazione del contenuto selezionato. Queste informazioni sulla derivazione vengono compilate ogni volta che una risorsa analitica aggiorna i propri dati. Se l'applicazione, lo script, il flusso di dati o la configurazione tabella non sono stati aggiornati di recente, la derivazione potrebbe essere incompleta o imprecisa.

La derivazione è disponibile per i tipi di contenuto supportati dal riquadro o dalla riga così come appaiono nel catalogo. È possibile analizzare la derivazione per i seguenti contenuti analitici:

  • Dataset: I dataset sono sorgenti dati, come i dati caricati da connettori o file di dati. I dataset possono essere tabelle in un database, dati caricati nell'archiviazione dati o dati generati da un'applicazione, come un file qvd. I dataset di solito hanno una singola tabella ciascuno, ma alcuni, come i file Excel, possono avere più tabelle.

    I dataset pubblicati da Talend Studio sono indicati con . È possibile passare al job di Talend Management Console utilizzato per generare il dataset facendo clic su Apri job TMC nel menu ... del dataset. Per ulteriori informazioni, vedere Pubblicazione di dataset e derivazione in Qlik Cloud.

  • App: I nodi dell'applicazione rappresentano le applicazioni analitiche di Qlik Sense che utilizzano le sorgenti dati nella derivazione. I nodi dell'applicazione mostrano il nome dell'applicazione e la posizione dell'applicazione come Qlik Sense.

  • Script: I nodi script rappresentano gli script creati nell'interfaccia di Script.

  • Data flow: I flussi di dati possono essere esaminati per comprendere meglio le sorgenti dati che utilizzano e trasformano.

  • Table recipe: Le configurazioni tabella possono essere esaminate per comprendere meglio la sorgente dati che utilizzano e trasformano.

  • ML experiment: È possibile comprendere la derivazione di un esperimento di machine learning, costituito dalle sorgenti dati che si sono unite per produrre i dati di addestramento per i modelli di machine learning.

  • ML deployment: È possibile comprendere la derivazione di una distribuzione ML e come viene utilizzata nelle previsioni. La derivazione per le distribuzioni ML consiste in genere in esperimenti ML, versioni di esperimenti, modelli e dataset.

I tipici nodi di input includono sorgenti dati utilizzate dal nodo di base o applicazioni che producono dataset. La derivazione a livello di campo consente un'indagine dettagliata su come sono stati calcolati i campi e sulla loro origine specifica attraverso trasformazioni e applicazioni.

I nodi disponibili in un grafico di derivazione sono gli input per il contenuto selezionato. Selezionare un elemento per designarlo come nodo di base. I nodi di input sono nodi a monte del nodo di base.

Grafico di derivazione a livello di campo

Grafico di derivazione a livello di campo

I nodi disponibili in un grafico di derivazione sono gli input per il nodo di base selezionato, in altre parole il nodo in primo piano. Il nodo di base è il singolo nodo per il quale si desidera recuperare la derivazione; ad esempio, potrebbe essere un'applicazione, un flusso di dati, un esperimento ML, un dataset, un file, una tabella o un campo.

Sarà il nodo più a destra sullo schermo e con un contorno blu. È il fulcro dell'indagine e verranno presentati solo gli input per quel nodo di base.

Mentre si esplora la derivazione, è possibile modificare in modo interattivo il nodo di base in un'altra tabella, applicazione, campo o altro elemento sullo schermo per focalizzare l'indagine.

Nodo di base della derivazione

Il nodo in primo piano, chiamato anche nodo di base, si troverà a destra dello schermo

Le linee che collegano i nodi sono i collegamenti. I collegamenti rappresentano la relazione di un nodo con un altro nodo. Rappresentano relazioni che indicano associazioni, come un dataset utilizzato da un'applicazione. Possono anche rappresentare dati prodotti come sottoprodotto di un'applicazione. L'insieme di nodi e collegamenti costituisce il grafico di derivazione.

I collegamenti di derivazione rappresentano relazioni

I collegamenti rappresentano relazioni tra oggetti

I nodi si comprimono o si espandono per rivelare i livelli gerarchici, da una granularità grossolana a una più fine, a partire dal gruppo di dataset o dall'applicazione di livello superiore fino al livello più granulare, ovvero il livello di campo.

In questa immagine di un nodo, vengono mostrati i seguenti livelli gerarchici, dal più alto (più grossolano) al più basso (più granulare): risorsa dati (applicazione), risorsa (dataset), tabella e campi.

Un nodo con livelli di risorsa, risorsa, tabella e campo

Apertura del grafico di derivazione

  1. Aprire il centro attività Informazioni strategiche o Analisi.

  2. Selezionare StrumentiDerivazione nel menu contestuale Altro su un elemento che supporta la derivazione.

È inoltre possibile accedere al grafico di derivazione di alcuni contenuti quando un elemento è aperto. Fare clic su Altro e Derivazione.

Dettagli del nodo

I dettagli sono limitati dall'accesso dell'utente a tale oggetto. I dettagli possono fornire le seguenti informazioni:

  • Nome

  • Descrizione

  • Tag

  • Posizione

  • Spazio

  • Proprietario

  • Creatore

  • Ultima modifica

Navigazione nel grafico di derivazione

Fare clic e trascinare il grafico per navigare e centrare il grafico di derivazione. È inoltre possibile utilizzare i pulsanti di navigazione. Selezionare Home Home per centrare il grafico di derivazione sul nodo di base. Fare clic su indietro e avanti per spostarsi tra le selezioni.

Navigazione nel grafico di derivazione

Pulsanti di navigazione per il grafico di derivazione.

Il grafico Derivazione mostra le dipendenze a monte per il contenuto analitico, che viene presentato come nodo predefinito quando si apre il grafico corrispondente. È possibile accedere alla derivazione (a monte) o all'analisi di impatto (a valle) per altri nodi che appaiono nel grafico selezionando Altro e Derivazione (nuovo nodo di base) o Analisi di impatto. Selezionare un nodo per designarlo come nodo di base.

Espandere Freccia giù o comprimere Freccia su i nodi per espandere o comprimere gruppi di oggetti allo stesso livello.

Opzione di menu per analizzare nodi diversi

Opzione di menu per analizzare nodi diversi

Vista di riepilogo della derivazione in un'applicazione

La vista di riepilogo della derivazione in un'applicazione può fornire agli utenti aziendali una panoramica di alto livello delle dipendenze a monte nell'applicazione. Per ulteriori informazioni, vedere La vista di riepilogo in-app della derivazione.

Analisi della derivazione per i contenuti di machine learning

È possibile utilizzare il grafico Derivazione per analizzare le origini dei contenuti di machine learning, inclusi esperimenti ML, distribuzioni ML e dataset. Utilizzare il grafico per una vista olistica di come sono stati creati i modelli di machine learning, dei dati su cui sono stati addestrati e di come vengono utilizzati negli scenari di produzione.

Esperimenti, distribuzioni e dataset appaiono anche come nodi quando si analizzano altri contenuti nel grafico Derivazione, come le applicazioni a valle.

Le risorse di machine learning vengono mostrate anche in Analisi di impatto per un'analisi completa dei contenuti a valle. Per ulteriori informazioni, vedere Analizzare l'analisi dell'impatto in Analisi.

Apertura di Derivazione per i contenuti di machine learning

  • Nel proprio centro attività, fare clic su Altro accanto a un esperimento ML, una distribuzione ML o un dataset e selezionare StrumentiDerivazione.

  • In un esperimento ML o in una distribuzione ML, fare clic su Altro nella barra di navigazione e selezionare Derivazione.

Navigazione in Derivazione per i contenuti di machine learning

I nodi di machine learning si esplorano nello stesso modo degli altri contenuti. Per le panoramiche dell'interfaccia, vedere:

Riconoscimento degli elementi di machine learning nel grafico Derivazione

La tabella seguente descrive gli elementi comuni relativi al machine learning che appaiono nel grafico Derivazione.

Elementi di derivazione comuni per il machine learning
Elemento Icona/e Spiegazione
Archiviazione file Cartella

Non esclusivo dei contenuti di machine learning. Mostra la posizione in cui è memorizzato un dataset (nella maggior parte dei casi, in uno spazio). Rilevante per il dataset di addestramento, le esportazioni da analisi incorporate in un esperimento, i dataset di applicazione utilizzati per le previsioni e i dataset di output delle previsioni.

Dataset Molti (ad esempio, Tipo di file QVD per QVD) Non esclusivo dei contenuti di machine learning. Utilizzato per rappresentare dataset di addestramento, esportazioni da analisi incorporate in un esperimento, dataset di applicazione e dataset di output delle previsioni.
Esperimento ML Esperimento ML Un esperimento ML in cui vengono addestrati i modelli.
Versione dell'esperimento ML Biforcazione La versione all'interno dell'esperimento ML, in cui sono stati addestrati uno o più modelli.
Modello ML Modello ML Un modello ML addestrato all'interno di una versione dell'esperimento. Utilizzato per rappresentare i modelli addestrati in un esperimento ML e i modelli distribuiti in una distribuzione ML.
Distribuzione ML Distribuzione ML Una distribuzione ML che contiene uno o più modelli distribuiti.
Nessuna icona - I nodi di output delle previsioni all'interno di una distribuzione ML non hanno icone. Anche i campi inclusi in un dataset di output delle previsioni non hanno icone.

Derivazione ed esperimenti ML

Gli esperimenti ML sono presentati in disposizioni raggruppate. Si espandono come segue:

  • Un esperimento ML si espande in una o più versioni dell'esperimento.

  • Una versione dell'esperimento si espande in uno o più modelli ML.

Quando un modello addestrato in un esperimento viene distribuito in una distribuzione ML, appare nel grafico di derivazione quando il contenuto a valle (ad esempio, previsioni o distribuzioni ML) viene selezionato come nodo di base.

Derivazione e distribuzioni ML

Le distribuzioni ML sono presentate in disposizioni raggruppate. Si espandono come segue:

  • Una distribuzione ML si espande in uno o più modelli distribuiti.

  • Se un modello nella distribuzione è stato utilizzato nelle previsioni batch, il modello si espande per mostrare ciascun output di previsione batch.

La derivazione a livello di campo è disponibile per i dataset di applicazione e i dataset di output delle previsioni correlati a una distribuzione ML.

I modelli distribuiti utilizzati per le previsioni sono ricollegati all'esperimento in cui sono stati addestrati.

Scenario di esempio

Per uno scenario di esempio, vedere Esempio: Indagine sulla derivazione dei contenuti di machine learning.

Limitazioni

Il grafico di derivazione presenta le seguenti limitazioni:

  • Le applicazioni che non sono state ricaricate dopo il rilascio della derivazione in Qlik Cloud potrebbero non disporre di informazioni complete sulla derivazione fino a quando non vengono ricaricate. I dettagli per alcuni nodi potrebbero essere limitati se non sono stati caricati dopo l'attivazione della derivazione per il proprio tenant.

  • I dettagli dei nodi per i dataset esterni al proprio tenant, come le connessioni SQL Server o Google Drive, sono limitati al tipo di dataset e al nome. Le connessioni REST mostrano solo che si tratta di dati REST.

  • Se un elemento viene eliminato, potrebbe essere ancora mostrato in Derivazione durante l'analisi di altri nodi.

Autorizzazioni

È necessario essere in grado di visualizzare un elemento per visualizzarne la derivazione dai propri centri attività. Se si riesce a vedere il grafico di derivazione per un nodo di base, si è in grado di vedere i dettagli di base e i metadati per gli oggetti di derivazione a monte.

Sicurezza

  • Un utente può passare solo a un nodo di base a cui ha accesso; in caso contrario, il menu contestuale non è disponibile.

  • Se un utente ha accesso al nodo di base, avrà accesso per vedere tutta la derivazione a monte.

Casi d'uso di esempio per l'analisi della derivazione

Per una procedura dettagliata dell'analisi della derivazione, vedere Casi d'uso della derivazione a livello di campo.

Esempio: Esplorazione della provenienza delle informazioni con la vista di riepilogo della derivazione

Come consumatore di analisi che osserva un grafico a barre in un'applicazione cars-data4-app, si desidera sapere da dove provengono le informazioni. Assicurarsi che Mostra dettagli e Mostra espressioni siano attivati per il grafico nella sezione Aspetto > Generale delle proprietà, quindi passare alla modalità di analisi del foglio. Fare clic con il pulsante destro del mouse sul grafico o utilizzare il menu icona altre azioni e selezionare Mostra dettagli per mostrare la vista consumatore della derivazione. Fare clic su Mostra dipendenze.

Si nota che la dimensione Car_ID dipende dal campo Car_ID che si trova in tre sorgenti CSV elencate. Selezionare il menu icona altre azioni sulla voce del campo e selezionare Derivazione - Car_ID / Cars per aprire un grafico di derivazione per il campo Car_ID nell'applicazione.

Selezionare una sorgente o un campo per visualizzare la derivazione per tale oggetto

Selezionare il menu e quindi l'opzione per visualizzare la derivazione per una sorgente nella vista di riepilogo della derivazione del consumatore

Il grafico di derivazione viene visualizzato da destra a sinistra e mostra che il campo Car_ID si trova nella tabella Cars caricata nell'applicazione cars-data4-app. Espandere Freccia giù i nodi mentre si traccia la cronologia del campo a ritroso fino al file originale caricato in Qlik Cloud. Si nota che il primo passaggio a ritroso mostra che un file CSV cars-data.csv contenente il campo Car_ID è stato caricato nell'applicazione cars-data4-app. Il nodo successivo a ritroso è un'applicazione cars-data3-app da cui è stato generato il file cars-data.csv. Tornando indietro di un altro passaggio ed espandendo il nodo, si nota che il file sorgente originale era un file CSV file cars-data3.csv e conteneva il campo ID.

Espandendo le tabelle e visualizzando i campi, è possibile identificare il file sorgente, la tabella e il campo originali della dimensione del grafico a barre Car_id-ID.

Espandere i nodi per tracciare la cronologia di un campo a ritroso fino al file sorgente

Iniziare con il nodo in primo piano e tracciare la cronologia della derivazione a ritroso fino alla sorgente originale

Esempio: Indagine sulle origini di un dataset e su come è stato creato

Come sviluppatore di applicazioni, si sta valutando l'utilizzo di un dataset esistente current_customers_analytics.xlsx per la propria applicazione. Si esaminano le origini di questo dataset per capire da dove provengono i dati. Dal riquadro o dalla riga del dataset, selezionare Derivazione dal menu Altro per aprire il grafico di derivazione. Dal grafico di derivazione, è possibile visualizzare i metadati per il dataset selezionando il menu icona altre azioni sul file XLSX current_customers_analytics.xlsx e Apri la panoramica.

Aprire la panoramica del dataset dal grafico di derivazione

La panoramica del dataset può essere aperta dal grafico di derivazione

Visualizzare tag, classificazioni e altri metadati tecnici dalla scheda della panoramica del dataset

È possibile accedere alle panoramiche del dataset dal grafico di derivazione

Il profilo dati è disponibile nella scheda Profilo

La scheda del profilo dei campi è accessibile dal grafico di derivazione

Fare clic sulla freccia indietro del browser per tornare al grafico di derivazione ed esplorare il grafico di derivazione per il dataset. Espandere Freccia giù il nodo current_customers_analytics.xlsx e fare clic su Seleziona tutto per visualizzare i campi disponibili. Fare lo stesso per tutti i nodi. Si noti che ogni campo offre l'opzione per renderlo il nodo di base in primo piano selezionando Derivazione (nuovo nodo di base) o selezionando Analisi di impatto per visualizzare la derivazione in avanti e gli oggetti dipendenti che saranno influenzati dalle modifiche al dataset.

Grafico Derivazione espanso per il dataset. Ogni campo all'interno di ciascun nodo avrà opzioni per aprire l'applicazione o i dati, visualizzare l'analisi di impatto o modificare il nodo in primo piano

Visualizzazione della derivazione per un dataset

Seguendo la derivazione a ritroso ed espandendo i nodi, è possibile vedere che questo dataset XLSX è l'output dell'applicazione Prep Current Customers Sales - Analytics. Tornando indietro di un altro passaggio ed espandendo il nodo Archiviazione file, si nota che all'applicazione di analisi delle vendite è stato caricato un file CSV: rgb_customers.csv. L'analisi a livello di campo rivela che il campo Tags nel file sorgente originale è stato rinominato in rgb_customers.Tags nell'applicazione di analisi delle vendite. Il file CSV originale può essere aperto nella panoramica per rivelare metadati preziosi come il proprietario, il creatore, le metriche di utilizzo, i tag, le classificazioni, il profilo del campo e l'analisi di impatto.

Esempio: Indagine sulla derivazione dei contenuti di machine learning

Un utente aziendale occasionale o un esperto di machine learning potrebbe utilizzare il grafico Derivazione per esaminare le origini di determinati valori previsti. Con il nodo di base impostato sul dataset di previsione, questo utente può vedere:

  • I dati di addestramento, incluse le relative sorgenti e trasformazioni

  • L'esperimento, la versione dell'esperimento e il modello

  • Dove è stato distribuito il modello e come è stato utilizzato

Grafico di derivazione con tutti i nodi espansi. Il grafico mostra un flusso end-to-end dalla preparazione dei dati di addestramento a un dataset di previsione.

Grafico di derivazione che mostra un flusso end-to-end dalla preparazione dei dati di addestramento a un dataset di previsione

L'immagine sopra mostra il seguente processo:

  1. Un flusso di dati Flusso di dati carica e trasforma i dati da un dataset CSV Tipo di file CSV memorizzato in uno spazio personale Cartella. L'output viene memorizzato in un dataset Parquet Tipo di file Parquet nello stesso spazio.

  2. Il dataset Parquet Tipo di file Parquet viene utilizzato nella versione 1 Biforcazione di un esperimento ML Esperimento ML. Questa versione dell'esperimento addestra un modello ML Modello ML.

  3. Il modello ML Modello ML viene distribuito in una distribuzione ML Distribuzione ML.

  4. Utilizzando un dataset CSV Tipo di file Parquet in uno spazio personale Cartella come dataset di applicazione, la distribuzione ML Distribuzione ML genera un dataset di previsione in formato Parquet Tipo di file Parquet.

La derivazione in Integrazione dati

Il grafico Derivazione è disponibile anche in Integrazione dati. Per ulteriori informazioni, vedere Analisi della derivazione in Integrazione dati.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!