Trasferimento dati da sorgenti dati
La prima fase per il trasferimento dei dati durante l'onboarding è il loro trasferimento. Questa richiede il trasferimento dati in modo costante dalla sorgente dati in loco a un'area di trasferimento.
È possibile trasferire dati da un numero di sorgenti dati attraverso le connessioni alla sorgente.
L'area di trasferimento è definita quando si crea il progetto.
-
Qlik Cloud (tramite Amazon S3)
Quando si trasferiscono dati in Qlik Cloud (via Amazon S3), è possibile utilizzarlo per generare tabelle QVD pronte per l'analisi in Qlik Cloud.
-
Data warehouse cloud
Quando si trasferiscono dati a un data warehouse cloud, come Snowflake o Azure Synapse Analytics, è possibile archiviare tabelle nello stesso data warehouse cloud.
Creazione e configurazione di un'attività di dati di trasferimento
Di seguito viene descritto come creare un'attività di dati di trasferimento. Il modo più veloce per creare una pipeline di dati consiste nel caricare dati che creano un'attività di dati di trasferimento e un'attività di dati di archiviazione, pronte per la preparazione e l'elaborazione. Per ulteriori informazioni, vedere Inserimento dati.
-
Nel progetto, fare clic su Aggiungi nuovo e selezionare Trasferisci dati.
-
Nella finestra di dialogo Trasferisci dati, inserire un nome e una descrizione dell'attività di dati.
Selezionare Apri per aprire l'attività di dati di trasferimento quando viene creata.
Fare clic su Crea.
-
Fare clic su Seleziona sorgente dati.
-
Selezionare una connessione ai dati di origine e fare clic su Avanti.
È possibile utilizzare i filtri nel pannello di sinistra per filtrare l'elenco delle connessioni in base al tipo di sorgente, allo spazio e al proprietario.
Se non si dispone ancora di una connessione ai dati di origine, bisogna crearne prima una, facendo clic su Aggiungi connessione.
Per maggiori informazioni sulla configurazione di una connessione con le fonti supportate, vedere Configurazione di connessioni alle sorgenti dati
Nota informaticaDopo aver selezionato le tabelle nel passaggio successivo, non è possibile modificare la connessione alla sorgente da una sorgente dati locale a una sorgente dati cloud o viceversa. È possibile modificare la connessione solo con un'altra sorgente dati dello stesso tipo. -
Selezionare i set di dati da includere nell'attività dati. La finestra di dialogo di selezione è diversa a seconda del tipo di sorgente a cui ci si è connessi.
Una volta completata la selezione delle tabelle, fare clic su Salva.
Set di dati visualizzato.
-
È possibile modificare le impostazioni per il trasferimento. Questo non è obbligatorio.
-
Fare clic su Impostazioni.
Per ulteriori informazioni sulle impostazioni, vedere Impostazioni di trasferimento
-
-
È ora possibile visualizzare in anteprima la struttura e i metadati delle tabelle dell'asset di dati selezionate. Ciò include tutte le tabelle elencate in modo esplicito e quelle che corrispondono alle regole di selezione.
Se si desidera aggiungere più tabelle dalla sorgente dati, fare clic su Seleziona sorgente dati.
-
È possibile eseguire trasformazioni basiche sui set di dati, come filtrare i dati o aggiungere colonne. Questo non è obbligatorio.
Per ulteriori informazioni, vedere Gestione dei data mart.
-
Dopo aver aggiunto le trasformazioni desiderate, è possibile convalidare i set di dati facendo clic su Convalida set di dati. Se la convalida rileva errori, correggere gli errori prima di procedere.
Per ulteriori informazioni, vedere Convalida e regolazione dei set di dati.
-
Quando si è pronti, fare clic su Prepara per catalogare l'attività di dati e prepararla per l'esecuzione.
È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo.
-
Una volta preparata l'attività di dati e si è pronti per iniziare a replicare i dati, fare clic su Esegui.
Ora la replica dovrebbe iniziare ed è possibile vedere l'avanzamento in Monitoraggio. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale.
Selezione di dati da un database
È possibile selezionare tabelle o viste specifiche oppure utilizzare regole di selezione per includere o escludere gruppi di tabelle.
Utilizzare % come carattere jolly per definire un criterio di selezione per schemi e tabelle.
-
%.% definisce tutte le tabelle in tutti gli schemi.
-
Public.% definisce tutte le tabelle nello schema Pubblico.
I criteri di selezione offrono all'utente un'anteprima in base alle selezioni personali.
Ora è possibile:
-
Creare una regola per includere o escludere un gruppo di tabelle in base ai criteri di selezione.
Fare clic su Aggiungi regola dai criteri di selezioneper creare una regola e selezionare sia Includi sia Escludi.
È possibile vedere la regola in Regole di selezione.
-
Selezionare uno o più set di dati e fare clic su Aggiungi set di dati selezionati.
È possibile vedere i set di dati aggiunti in Set di dati selezionati in modo esplicito.
Le regole di selezione si applicano solo all'insieme corrente di tabelle e viste, non a tabelle e viste che verranno aggiunte in futuro.
Esecuzione di un'attività di trasferimento con Change Data Capture (CDC)
È possibile eseguire un'attività di trasferimento una volta che è stata preparata. Tale operazione avvia la replica che trasferisce i dati dalla sorgente dati in loco all'area di trasferimento.
-
Fare clic su Esegui per avviare il trasferimento dati.
La replica dovrebbe iniziare ora e l'attività di dati avrà lo stato In esecuzione. Per prima cosa, viene copiata la sorgente dati completa, dopodiché vengono tracciate le modifiche. Ciò significa che le modifiche verranno costantemente tracciate e trasferite una volta individuate. Ciò consente di mantenere aggiornati i dati di trasferimento.
Nella pagina home di Qlik Talend Data Integration è possibile visualizzare lo stato, la data e l'ora di aggiornamento dei dati di trasferimento, oltre al numero di tabelle in errore. È anche possibile aprire l'attività dati e selezionare la scheda Tabelle per visualizzare le informazioni sui metadati di base per le tabelle.
È possibile monitorare i progressi in dettaglio aprendo la tabella Monitoraggio. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale.
Una volta caricate tutte le tabelle ed elaborato il primo set di modifiche, I dati sono aggiornati a sulla scheda attività dati indica che i cambiamenti della sorgente fino a quel momento sono disponibili nell'attività dati.
Ricaricamento di tabelle
È possibile ricaricare i dati dalla sorgente.
Ricaricamento di singole tabelle
È possibile ricaricare manualmente tabelle specifiche senza interferire con l'acquisizione dei dati di modifica. Questa funzionalità è utile quando si presentano dei problemi con la funzione CDC per una o più tabelle.
-
Aprire l'attività dati di trasferimento e selezionare la scheda Monitora.
-
Selezionare le tabelle che si desidera ricaricare.
-
Fare clic su Ricarica tabelle.
Se non si risolvono i problemi ricaricando le tabelle o se questi influiscono sull'intera attività, è possibile ricaricare invece tutte le tabelle nella destinazione. In questo modo, l'acquisizione dei dati di modifica viene riavviata.
Ricaricamento di tutte le tabelle nella destinazione
Se si riscontrano problemi con la funzione CDC che non è possibile risolvere ricaricando tabelle specifiche, è possibile ricaricare tutte le tabelle sulla destinazione. Gli esempi dei problemi includono eventi mancanti, problemi causati dalla riorganizzazione del database di origine o un errore durante la lettura degli eventi del database di origine.
- Interrompere l'attività dati e tutte le attività che la utilizzano.
-
Aprire l'attività dati e selezionare la scheda Monitora.
-
Fare clic su ..., quindi su Ricarica destinazione.
Questa opzione avvia la ricarica di tutte le tabelle nella destinazione utilizzando la funzione Rilascia-Crea, quindi riavvia tutte le attività di acquisizione dati di modifica da zero.
-
Le attività di archiviazione che utilizzano l'attività dati di trasferimento verranno ricaricate mediante il confronto e applicate alla successiva esecuzione per la sincronizzazione. La cronologia esistente viene mantenuta. La cronologia di Tipo 2 verrà aggiornata per riflettere le modifiche dopo l'esecuzione del processo di ricaricamento e confronto.
Il timestamp per la data di inizio nella cronologia di Tipo 2 rifletterà la data di ricaricamento, e non necessariamente la data in cui la modifica è stata portata nella sorgente.
-
Le visualizzazioni live per l'archiviazione non sono affidabili durante l'operazione di ricaricamento della destinazione e fino a quando l'archiviazione è sincronizzata. L'archiviazione verrà completamente sincronizzata nei seguenti casi:
-
Tutte le tabelle vengono ricaricate utilizzando le funzioni di confronto e applicazione.
-
Un ciclo di modifiche viene eseguito per ogni tabella.
-
Esecuzione di un attività dati di trasferimento con Ricarica e confronta
È possibile copiare i dati utilizzando un'attività di trasferimento una volta che è stata preparata.
-
Fare clic su Esegui per avviare il caricamento completo.
I dati inizieranno a essere copiati e l'attività dati avrà lo stato Esecuzione. Una volta copiata la sorgente dati completa, lo stato passa a Completato.
Nella pagina home di Qlik Talend Data Integration è possibile visualizzare lo stato, la data e l'ora di aggiornamento dei dati di trasferimento, oltre al numero di tabelle in errore. È anche possibile aprire l'attività dati e selezionare la scheda Tabelle per visualizzare le informazioni sui metadati di base per le tabelle.
È possibile monitorare i progressi in dettaglio aprendo la tabella Monitoraggio. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale.
Una volta caricate tutte le tabelle, I dati sono aggiornati a nella scheda dell'attività di dati indica che i cambiamenti della sorgente fino a tale ora sono disponibili nell'asset di dati. Tuttavia, alcune tabelle dell'attività di dati possono essere aggiornate in un secondo momento, in base a quando hanno iniziato il caricamento. Ciò significa che la coerenza dei dati non è garantita. Ad esempio, se il caricamento è stato avviato alle 08:00 e ha richiesto 4 ore, Data is updated to mostrerà le 08:00 una volta completato il caricamento. Tuttavia, una tabella che ha iniziato il ricaricamento alle 11:30 includerà modifiche della sorgente avvenute tra le 8:00 e le 11:30.
I dati sono aggiornati a riflette solo le tabelle caricate correttamente. Non indica nulla di relativo alle tabelle oltre al fatto che i relativi ricaricamenti non sono riusciti. Nelle destinazioni cloud, il campo sarà vuoto se viene completato un ricaricamento con tutte le tabelle che presentano errori.
Ricaricamento dei dati quando si utilizza Ricarica e confronta
Quando si utilizza Ricaricamento e confronto come metodo di aggiornamento, sarà necessario ricaricare i dati per mantenerli aggiornati con la sorgente dati.
-
Fare clic su Ricarica per eseguire un ricaricamento manuale di tutte le tabelle.
-
Configurare un ricaricamento pianificato.
Ricaricamento di singole tabelle
È possibile ricaricare tabelle specifiche manualmente. Questa funzionalità è utile quando si presentano dei problemi con una o più tabelle.
-
Aprire l'attività dati di trasferimento e selezionare la scheda Monitora.
-
Selezionare le tabelle che si desidera ricaricare.
-
Fare clic su Ricarica tabelle.
- Questa opzione è disponibile solo dopo che l'attività di trasferimento viene eseguita almeno una volta e unicamente quando questa non è in esecuzione.
- Le modifiche ai metadati non sono supportate. Se sono presenti modifiche ai metadati nella sorgente, queste vengono propagate al trasferimento quando si ricaricano i dati, ma non saranno gestite in modo corretto. Questo può causare un errore dell'archiviazione di consumo.
Pianificazione di un'attività dati di trasferimento con Ricarica e confronta
È possibile pianificare ricaricamenti periodici per l'attività di dati di trasferimento se si dispone del ruolo Può operare nello spazio dell'attività di dati. Perché la pianificazione sia attiva, lo stato dell'attività dati deve essere almeno Preparato.
-
Fare clic su ... su un'attività di dati e selezionare Pianificazione.
È possibile impostare una pianificazione basata sul tempo.
Per informazioni sugli intervalli di pianificazione minimi in base al tipo di sorgente dati e i livelli di sottoscrizione, vedere Intervalli di pianificazione minimi consentiti.
Impostazione della priorità di caricamento per i set di dati
È possibile controllare l'ordine di caricamento dei set di dati nelle attività dati assegnando una priorità di caricamento per ogni set di dati. Questa opzione può essere utile, per esempio, se si desidera caricare set di dati più piccoli prima di quelli grandi.
-
Fare clic su Priorità di caricamento.
-
Selezionare una priorità di caricamento per ogni set di dati.
La priorità di caricamento predefinita è Normale. I set di dati verranno caricati nel seguente ordine di priorità:
-
Massima
-
Più alta
-
Alta
-
Normale
-
Bassa
-
Più bassa
-
Minima
I set di dati con la stessa priorità vengono caricati senza seguire un ordine particolare.
-
-
Fare clic su OK.
Operazioni sull'attività dati di trasferimento
Dal menu attività è possibile eseguire le seguenti operazioni su un'attività di dati di trasferimento.
-
Apri
Apre l'attività di dati di trasferimento. È possibile visualizzare la struttura e i dettagli della tabella relativi all'attività di dati.
-
Modifica
È possibile modificare il nome e la descrizione dell'attività.
-
Elimina
È possibile eliminare l'attività dati.
I seguenti oggetti non vengono eliminati e devono essere eliminati manualmente:
-
I dati nell'area di trasferimento.
-
-
Esegui
È possibile eseguire l'attività dati per avviare la copia dei dati.
Esecuzione di un'attività di trasferimento con Change Data Capture (CDC)
Esecuzione di un attività dati di trasferimento con Ricarica e confronta
-
Interrompi
È possibile interrompere il funzionamento di un'attività dati in esecuzione. L'area di trasferimento non viene aggiornata con i dati modificati.
Quando si arresta un'attività di dati di caricamento completa con una pianificazione di ricaricamento, viene arrestato solo il ricaricamento corrente. Se lo stato dell'attività di dati è Arrestato ed è presente una pianificazione di ricaricamento attiva, quest'ultimo verrà ricaricato nuovamente al successivo orario pianificato. È necessario disattivare la pianificazione di ricaricamento in Pianifica ricaricamento.
-
Ricarica
È possibile eseguire un ricaricamento manuale di un'attività dati nella modalità di aggiornamento Ricaricamento e confronto.
- Prepara
Questa funzione prepara un'attività per l'esecuzione. Sono incluse le seguenti tabelle:
-
Convalida della validità della progettazione.
-
Creazione o modifica delle tabelle fisiche e delle visualizzazioni in modo che corrispondano alla progettazione.
-
Generazione del codice SQL per l'attività dati.
-
Creazione o modifica delle voci del catalogo per i set di dati di output dell'attività.
È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo.
-
-
Ricrea tabelle
Questa funzione ricrea i set di dati dalla sorgente.
-
Pianificazione
È possibile configurare un ricaricamento pianificato per le attività di dati di trasferimento in modalità Caricamento completo. È possibile impostare una pianificazione basata sul tempo che può essere personalizzata.
È anche possibile attivare o disattivare i ricaricamenti pianificati.
Per pianificare i ricaricamenti, è necessario disporre del ruolo Può operare nello spazio dell'attività di dati.
-
Archivia dati
È possibile creare un'attività di dati di archiviazione che utilizzi i dati di questa attività dati di destinazione.
Aggiornamento metadati
È possibile aggiornare i metadati nell'attività per allinearli con le modifiche nei metadati nella sorgente nella vista Progettazione dell'attività. Per le applicazioni SaaS che utilizzano Metadata Manager, quest'ultimo deve essere aggiornato prima di poter aggiornare i metadati nell'attività dati.
-
È possibile eseguire le seguenti azioni:
-
Fare clic su ..., quindi su Aggiorna metadati per aggiornare i metadati per tutti i set di dati nell'attività.
-
Fare clic su ... su un set di dati in Set di dati, quindi su Aggiorna metadati per aggiornare i metadati per un singolo set di dati.
È possibile visualizzare lo stato del processo di aggiornamento dei metadati in Aggiorna metadati nella parte inferiore dello schermo. È possibile visualizzare la data dell'ultimo aggiornamento dei metadati posizionando il cursore su .
-
-
Preparare l'attività dati per applicare le modifiche.
Una volta preparata l'attività dati e applicate le modifiche, queste vengono rimosse da Aggiorna metadati.
Devi preparare attività di archiviazione che utilizzano questa attività per propagare le modifiche.
Se una colonna viene rimossa, viene aggiunta una trasformazione con valori Null per assicurare che l'archiviazione non perda i dati cronologici.
Limiti
-
Se si esegue un'operazione di ridenominazione con una colonna rimossa anteriormente, nello stesso intervallo di tempo, questa verrà tradotta nella ridenominazione della colonna rimossa se hanno lo stesso tipo e la stessa lunghezza dati.
Esempio:
Prima: a b c d
Dopo: a c1 d
In questo esempio, b è stato rimosso e c è stato rinominato c1, mentre b e c hanno lo stesso tipo di dati e la stessa lunghezza dati.
L'operazione verrà identificata come ridenominazione di b in c1 e rimozione di c.
-
La ridenominazione dell'ultima colonna non viene riconosciuta, anche se questa è stata rimossa e quella prima di essa è stata rinominata.
Esempio:
Prima: a b c d
Dopo: a b c1
In questo esempio, d è stato rimosso e c è stato rinominato c1.
Questa operazione verrà identificata come rimozione di c e d e l'aggiunta di c1.
-
Le nuove colonne dovrebbero essere aggiunte alla fine. Se le colonne vengono aggiunte a metà con lo stesso tipo di dati della colonna successiva, possono essere interpretate come una rimozione e una ridenominazione.
Rimozione di colonne
Se si elimina una colonna utilizzata da un'attività di dati di archiviazione con cronologia abilitata, è necessario seguire questi passaggi per mantenere la cronologia ed evitare possibili perdite di dati.
Interrompe l'attività di dati di trasferimento.
Esegue l'attività di dati di trasferimento per assicurare che tutti i dati di trasferimento vengano letti.
Rilasciare la colonna nel trasferimento.
Esegue l'attività di dati di trasferimento.
Nell'archiviazione, aggiungere la colonna con un'espressione predefinita (Null o il valore predefinito) o rilasciare la colonna.
Manutenzione dell'area di trasferimento
La pulizia automatica dell'area di trasferimento non è supportata. Ciò può influire sulle prestazioni.
Consigliamo di eseguire pulizie manuali dei precedenti dati di caricamento completo nell'area di trasferimento.
Qlik Cloud (tramite Amazon S3)
Se sono presenti più cartelle di dati di caricamento completo, è possibile eliminarle tutte tranne quella più recente. È anche possibile eliminare le partizioni dati delle modifiche che sono state elaborate.
Data warehouse cloud
È possibile eliminare i record di caricamento completo e delle tabelle delle modifiche che sono stati elaborati.
Suggerimenti
Se è possibile aggiornare una chiave primaria in una tabella di origine, attivare l'opzione DELETE (elimina) e INSERT (inserisci) quando si aggiorna l'opzione colonna di chiave primaria in Regolazione di elaborazione delle modifiche.
Limitazioni
La replica di dati varchar più lunghi di 8.000 byte o Nvarchar più lunghi di 4.000 byte non è supportata.
La modifica del supporto dei valori null non è supportata per le colonne che vengono spostate, sia modificandole direttamente che utilizzando una regola di trasformazione. Tuttavia, le nuove colonne create nell'attività ammettono i valori null per impostazione predefinita.
Le trasformazioni sono soggette alle seguenti limitazioni:
- Le trasformazioni non sono supportate per le colonne con lingue da destra a sinistra.
Le trasformazioni non possono essere eseguite sulle colonne che contengono caratteri speciali (ad esempio #, \, /, -) nel nome.
- L'unica trasformazione supportata per i tipi di dati LOB/CLOB è il rilascio della colonna nella destinazione.
- L'utilizzo di una trasformazione per rinominare una colonna e quindi aggiungere una nuova colonna con lo stesso nome non è supportato.