Introduzione a Qlik Talend Data Integration
È possibile fornire i dati pronti per il consumo a Qlik Cloud o nei data warehouse cloud, come Snowflake, Google Cloud BigQuery e Azure Synapse Analytics con Qlik Talend Data Integration. Le sorgenti dati possono essere in loco o nel cloud. I dati possono essere tenuti aggiornati senza intervento manuale usando la tecnologia CDC (Change Data Capture) o tecnologie batch, come i ricaricamenti pianificati. È possibile creare una pipeline di dati ed eseguire trasformazioni adatte allo scopo e creare data mart.
È possibile accedere alla pagina home di Qlik Talend Data Integration selezionando Data Integration dal menu di avvio ().
Per ulteriori informazioni sull'architettura di Qlik Talend Data Integration, vedere Architettura del set di dati in un cloud data warehouse
Opzioni di sottoscrizione
Le sottoscrizioni a Qlik Talend Cloud si basano su un modello di capacità con il volume di Spostamento dati come misuratore di valore principale.
Qlik Talend Cloud è disponibile in opzioni di sottoscrizione di quattro livelli: Starter, Standard, Premium ed Enterprise. Le versioni superiori forniscono sorgenti dati e trasformazioni più avanzate. Queste includono le funzionalità ospitate su Qlik Cloud e Talend Cloud. Tutte le sottoscrizioni includono Qlik Cloud Analytics Standard.
Per ulteriori informazioni sulle opzioni di sottoscrizione, vedere Opzioni di sottoscrizione di Qlik Talend Cloud.
Spazi dati
Gli spazi dati sono aree governate del tenant di Qlik Cloud utilizzate per creare e archiviare progetti. All'interno dello spazio è inoltre possibile creare nuove connessioni utilizzando i connettori e gestire l'accesso ai gateway di Data Movement. Tutti gli asset di dati verranno creati nello stesso spazio del progetto a cui appartengono.
Per ulteriori informazioni, vedere Uso degli spazi in Qlik Talend Data Integration
Progetti
Un progetto è dove si crea il flusso di integrazione dati, utilizzando le attività dati. Il progetto è associato a una piattaforma dati che viene utilizzata come destinazione per tutti gli output. È possibile creare un progetto con uno dei casi di utilizzo descritti di seguito:
-
Pipeline di dati
Consente di creare una pipeline lineare semplice o una pipeline complessa che consumi svariate sorgenti dati e genera molti output.
-
Replica
Consente di replicare i dati da qualsiasi sorgente dati supportata su qualsiasi destinazione supportata o trasferire i dati su un data lake.
Attività dati
Un'attività dati è l'unità principale di lavoro in un progetto. È possibile creare i seguenti tipi di attività dati in un progetto. È possibile creare una nuova attività dati facendo clic su Aggiungi nuovo nella barra superiore, quindi fare clic sull'apposita attività.
Attività dati nei progetti di pipeline di dati
-
Trasferimento
Copia i dati da una sorgente dati in loco a un'area di trasferimento. Le sorgenti dati possono essere in loco o nel cloud. L'area di destinazione può essere una destinazione cloud o un bucket di dati in Amazon S3 (solo durante la creazione di set di dati QVD).
È possibile mantenere aggiornati i dati senza intervento manuale utilizzando la CDC o eseguendo caricamenti completi programmati per ricaricarsi periodicamente.
-
Dati registrati
Registra i dati che esistono già sulla piattaforma. Ciò consente di utilizzare i dati che sono stati inseriti con strumenti diversi da Qlik Talend Data Integration, ad esempio, Qlik Replicate.
-
Archiviazione
Creare set di dati pronti per l'uso in un data warehouse cloud o in Qlik Cloud, dai dati copiati dall'attività dati di trasferimento. Le tabelle vengono mantenute aggiornate con i dati di trasferimento senza intervento manuale.
-
Trasforma
Consente di creare trasformazioni di dati riutilizzabili basate su regole e SQL personalizzato come parte della pipeline di dati. È possibile eseguire trasformazioni a livello di riga e creare set di dati che vengono materializzati come tabelle o creati come viste che eseguono trasformazioni al volo.
-
Data mart
Consente di creare data mart per sfruttare attività dati di Archiviazione o attività dati di Trasformazione. È possibile creare un numero qualsiasi di data mart a seconda delle esigenze aziendali. Idealmente, i data mart dovrebbero contenere repository di dati riepilogati raccolti per l'analisi su una sezione o unità specifica all'interno di un'organizzazione.
Attività dati nei progetti di replica
-
Replica
Consente di replicare i dati da qualsiasi sorgente dati supportata su qualsiasi destinazione supportata.
-
Trasferimento su lake
Consente di trasferire i dati su un data lake.
Trasferimento dei dati in un data lake con una sottoscrizione Standard, Premium o Enterprise
Monitoraggio di attività dati
È possibile monitorare lo stato e l'avanzamento delle attività dati utilizzando le viste di monitoraggio. Le viste di monitoraggio consentono di visualizzare lo stato di tutte le attività dati nel tenant o un sottogruppo di attività dati in base a un filtro specificato. È possibile creare diverse viste di monitoraggio per monitorare differenti aspettu delle pipeline di dati. Per ulteriori informazioni, vedere Monitoraggio e gestione di attività dati.
Prodotti di dati
I set di dati che sono stati registrati da un progetto dati o da un caricamento manuale e che sono stati aggiunti a Catalogo, possono essere raggruppati e inseriti in un pacchetto nella forma di prodotti dati. È possibile raggruppare i set di dati in base al dominio aziendale, per esempio, quindi renderli disponibili sul marketplace dati, in modo che i consumatori di analisi li possano utilizzare nelle app. Per ulteriori informazioni, vedere Utilizzo dei prodotti dati.
Connessioni
Le connessioni vengono utilizzate per consentire alle attività dati di accedere a sorgenti dati, archiviazione esterna e piattaforme dati di destinazione per la consegna dei dati e le trasformazioni push-down.
Gestione delle connessioni
Fare clic su Connessioni a sinistra per visualizzare tutte le connessioni.
È possibile modificare le connessioni di cui si è proprietari.
Nota informaticaSi possono modificare anche tutte le connessioni in uno spazio dati di cui si è proprietari o per cui si dispone del ruolo Può gestire.Fare clic su ..., quindi su Modifica.
È possibile testare le connessioni.
Fare clic su ..., quindi su Prova connessione.
È possibile eliminare le connessioni.
Fare clic su ..., quindi su Elimina.
Creazione di una connessione
Sono disponibili diversi modi per creare le connessioni:
Fare clic su Connessioni, a sinistra, quindi fare clic su Crea connessione.
Fare clic su Crea nuova nella procedura guidata per la configurazione dell'attività dati, dove è possibile selezionare una connessione dati.
Fare clic su Crea connessione nella vista Connessioni dati.
È possibile filtrare i connettori in base ai seguenti elementi:
Categoria
Data warehouse, Archiviazione cloud, Database e Applicazione.
Tipo
Sorgente o Destinazione.
È possibile anche selezionare dai connettori utilizzati di recente.
Sarà necessario selezionare il tipo di sorgente dati, quindi inserire le informazioni di indirizzo e autenticazione.
Vedere anche: