Vai al contenuto principale Passa a contenuto complementare

Trasferimento dati da sorgenti dati

La prima fase per il trasferimento dei dati durante l'onboarding è il loro trasferimento. Questa richiede il trasferimento dati in modo costante dalla sorgente dati in loco a un'area di trasferimento.

È possibile trasferire dati da un numero di sorgenti dati attraverso le connessioni alla sorgente.

L'area di trasferimento è definita quando si crea il progetto dati.

  • Qlik Cloud (tramite Amazon S3)

    Quando si trasferiscono dati in Qlik Cloud (via Amazon S3), è possibile utilizzarlo per generare tabelle QVD pronte per l'analisi in Qlik Cloud.

  • Data warehouse cloud

    Quando si trasferiscono dati a un data warehouse cloud, come Snowflake o Azure Synapse Analytics, è possibile archiviare tabelle nello stesso data warehouse cloud.

Nota informaticaLe attività dati vengono eseguite nel contesto del relativo proprietario. Per ulteriori informazioni su ruoli e autorizzazioni necessari, vedere Ruoli e autorizzazioni dello spazio dati.

Creazione e configurazione di un'attività di dati di trasferimento

Di seguito viene descritto come creare un'attività di dati di trasferimento. Il modo più veloce per creare una pipeline di dati consiste nel caricare dati che creano un'attività di dati di trasferimento e un'attività di dati di archiviazione, pronte per la preparazione e l'elaborazione. Per ulteriori informazioni, vedere Inserimento dati.

  1. Fare clic su Aggiungi nuovo nella pagina home Qlik Cloud Data Integration e selezionare Trasferisci dati.
  2. Nella finestra di dialogo Trasferisci dati, inserire un nome e una descrizione dell'attività di dati.

    Selezionare Apri per aprire l'attività di dati di trasferimento quando viene creata.

    Fare clic su Crea.

  3. Fare clic su Seleziona sorgente dati.

  4. Selezionare una connessione ai dati di origine e fare clic su Avanti.

    È possibile utilizzare i filtri nel pannello di sinistra per filtrare l'elenco delle connessioni in base al tipo di sorgente, allo spazio e al proprietario.

    Se non si dispone ancora di connessione dati con la sorgente dati, bisogna crearne prima una, facendo clic su Aggiungi connessione.

    Per maggiori informazioni sulla configurazione di una connessione con le fonti supportate, vedere Connessione alle sorgenti dati

    Nota informaticaDopo aver selezionato le tabelle nel passaggio successivo, non è possibile modificare la connessione con la sorgente dati da una sorgente dati locale a una cloud o viceversa. È possibile modificare la connessione solo con un'altra sorgente dati dello stesso tipo.
  5. Seleziona tabelle e viste da includere nell'asset di dati. La finestra di dialogo di selezione è diversa a seconda del tipo di sorgente a cui ci si è connessi.

    Una volta completata la selezione delle tabelle, fare clic su Salva.

    Set di dati visualizzato.

  6. È possibile modificare le impostazioni per il trasferimento. Questo non è obbligatorio.

    • Fare clic su Impostazioni.

    Per ulteriori informazioni sulle impostazioni, vedere Impostazioni di trasferimento

  7. È ora possibile visualizzare in anteprima la struttura e i metadati delle tabelle dell'asset di dati selezionate. Ciò include tutte le tabelle elencate in modo esplicito e quelle che corrispondono alle regole di selezione.

    Se si desidera aggiungere più tabelle dalla sorgente dati, fare clic su Seleziona sorgente dati.

  8. È possibile eseguire trasformazioni basiche sui set di dati, come filtrare i dati o aggiungere colonne. Questo non è obbligatorio.

    Per ulteriori informazioni, vedere Gestione dei data mart

  9. Dopo aver aggiunto le trasformazioni desiderate, è possibile convalidare i set di dati facendo clic su Convalida set di dati. Se la convalida rileva errori, correggere gli errori prima di procedere.

    Per ulteriori informazioni, vedere Convalida e regolazione dei set di dati.

  10. Quando si è pronti, fare clic su Prepara per catalogare l'attività di dati e prepararla per l'esecuzione.

    È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo.

  11. Una volta preparata l'attività di dati e si è pronti per iniziare a replicare i dati, fare clic su Esegui.

Ora la replica dovrebbe iniziare ed è possibile vedere l'avanzamento in Monitoraggio. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale.

Selezione di dati da un database

È possibile selezionare tabelle o viste specifiche oppure utilizzare regole di selezione per includere o escludere gruppi di tabelle.

Nota informaticaSe la selezione include viste, CDC non è supportato.

Utilizzare % come carattere jolly per definire un criterio di selezione per schemi e tabelle.

  • %.% definisce tutte le tabelle in tutti gli schemi.

  • Public.% definisce tutte le tabelle nello schema Pubblico.

I criteri di selezione offrono all'utente un'anteprima in base alle selezioni personali.

Ora è possibile:

  • Creare una regola per includere o escludere un gruppo di tabelle in base ai criteri di selezione.

    Fare clic su Aggiungi regola dai criteri di selezioneper creare una regola e selezionare sia Includi sia Escludi.

    È possibile vedere la regola in Regole di selezione.

  • Selezionare uno o più set di dati e fare clic su Aggiungi set di dati selezionati.

    È possibile vedere i set di dati aggiunti in Set di dati selezionati in modo esplicito.

Le regole di selezione si applicano solo all'insieme corrente di tabelle e viste, non a tabelle e viste che verranno aggiunte in futuro.

Esecuzione di un'attività di trasferimento con Change Data Capture (CDC)

È possibile eseguire un'attività di trasferimento una volta che è stata preparata. Tale operazione avvia la replica che trasferisce i dati dalla sorgente dati in loco all'area di trasferimento.

  • Fare clic su Esegui per avviare il trasferimento dati.

La replica dovrebbe iniziare ora e l'asset di dati avrà lo stato In esecuzione. Per prima cosa, viene copiata la sorgente dati completa, dopodiché vengono tracciate le modifiche. Ciò significa che le modifiche verranno costantemente tracciate e trasferite una volta individuate. Ciò consente di mantenere aggiornati i dati di trasferimento.

Nella pagina home di Qlik Cloud Data Integration è possibile visualizzare lo stato, la data e l'ora di aggiornamento dei dati di trasferimento, oltre al numero di tabelle in errore. È anche possibile aprire l'asset di dati e selezionare la scheda Tabelle per visualizzare le informazioni sui metadati di base per le tabelle.

È possibile monitorare i progressi in dettaglio aprendo la tabella Monitoraggio. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale.

Una volta caricate tutte le tabelle ed elaborato il primo set di cambiamenti, I dati sono aggiornati a sulla tabella asset dati indica che i cambiamenti della sorgente fino a tale ora sono disponibili nell'attività di dati.

Ricaricamento di tabelle

È possibile ricaricare i dati dalla sorgente.

Ricaricamento di singole tabelle

È possibile ricaricare manualmente tabelle specifiche senza interferire con l'acquisizione dei dati di modifica. Questa funzionalità è utile quando si presentano dei problemi con la funzione CDC per una o più tabelle.

  1. Aprire l'attività dati di trasferimento e selezionare la scheda Monitora.

  2. Selezionare le tabelle che si desidera ricaricare.

  3. Fare clic su Ricarica tabelle.

Nota informaticaQuesta opzione diventa disponibile solo dopo che l'attività di trasferimento viene eseguita almeno una volta. Se si fa clic quando l'attività di trasferimento non è in esecuzione, le tabelle verranno ricaricate all'esecuzione successiva dell'attività.

Se non si risolvono i problemi ricaricando le tabelle o se questi influiscono sull'intera attività, è possibile ricaricare invece tutte le tabelle nella destinazione. In questo modo, l'acquisizione dei dati di modifica viene riavviata.

Ricaricamento di tutte le tabelle nella destinazione

Se si riscontrano problemi con la funzione CDC che non è possibile risolvere ricaricando tabelle specifiche, è possibile ricaricare tutte le tabelle sulla destinazione. Gli esempi dei problemi includono eventi mancanti, problemi causati dalla riorganizzazione del database di origine o un errore durante la lettura degli eventi del database di origine.

Nota informaticaQuesta operazione è disponibile solo per le attività con il metodo di aggiornamento Change Data Capture (CDC) che sono state eseguite almeno una volta.

  1. Interrompere l'attività dati e tutte le attività che la utilizzano.
  2. Aprire l'attività dati e selezionare la scheda Monitora.

  3. Fare clic su ..., quindi su Ricarica destinazione.

Questa opzione avvia la ricarica di tutte le tabelle nella destinazione utilizzando la funzione Rilascia-Crea, quindi riavvia tutte le attività di acquisizione dati di modifica da zero.

  • Le attività di archiviazione che utilizzano l'attività dati di trasferimento verranno ricaricate mediante il confronto e applicate alla successiva esecuzione per la sincronizzazione. La cronologia esistente viene mantenuta. La cronologia di Tipo 2 verrà aggiornata per riflettere le modifiche dopo l'esecuzione del processo di ricaricamento e confronto.

    Il timestamp per la data di inizio nella cronologia di Tipo 2 rifletterà la data di ricaricamento, e non necessariamente la data in cui la modifica è stata portata nella sorgente.

  • Le visualizzazioni live per l'archiviazione non sono affidabili durante l'operazione di ricaricamento della destinazione e fino a quando l'archiviazione è sincronizzata. L'archiviazione verrà completamente sincronizzata nei seguenti casi:

    • Tutte le tabelle vengono ricaricate utilizzando le funzioni di confronto e applicazione.

    • Un ciclo di modifiche viene eseguito per ogni tabella.

Nota informaticaLe modifiche ai metadati non sono supportate. Se sono presenti modifiche ai metadati nella sorgente, queste vengono propagate al trasferimento quando si ricaricano i dati, ma non saranno gestite in modo corretto. Questo può causare un errore dell'archiviazione di consumo.

Esecuzione di un attività dati di trasferimento con Ricarica e confronta

È possibile copiare i dati utilizzando un'attività di trasferimento una volta che è stata preparata.

  • Fare clic su Esegui per avviare il caricamento completo.

I dati inizieranno a essere copiati e l'attività dati avrà lo stato Esecuzione. Una volta copiata la sorgente dati completa, lo stato passa a Completato.

Nella pagina home di Qlik Cloud Data Integration è possibile visualizzare lo stato, la data e l'ora di aggiornamento dei dati di trasferimento, oltre al numero di tabelle in errore. È anche possibile aprire l'asset di dati e selezionare la scheda Tabelle per visualizzare informazioni sui metadati di base per le tabelle.

È possibile monitorare i progressi in dettaglio aprendo la tabella Monitoraggio. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale.

Una volta caricate tutte le tabelle, I dati sono aggiornati a nella scheda dell'attività di dati indica che i cambiamenti della sorgente fino a tale ora sono disponibili nell'asset di dati. Tuttavia, alcune tabelle dell'attività di dati possono essere aggiornate in un secondo momento, in base a quando hanno iniziato il caricamento. Ciò significa che la coerenza dei dati non è garantita. Ad esempio, se il caricamento è stato avviato alle 08:00 e ha richiesto 4 ore, Data is updated to mostrerà le 08:00 una volta completato il caricamento. Tuttavia, una tabella che ha iniziato il ricaricamento alle 11:30 includerà modifiche della sorgente avvenute tra le 8:00 e le 11:30.

I dati sono aggiornati a riflette solo le tabelle caricate correttamente. Non indica nulla di relativo alle tabelle oltre al fatto che i relativi ricaricamenti non sono riusciti. Nelle destinazioni cloud, il campo sarà vuoto se viene completato un ricaricamento con tutte le tabelle che presentano errori.

Ricaricamento dei dati quando si utilizza Ricarica e confronta

Quando si utilizza Ricaricamento e confronto come metodo di aggiornamento, sarà necessario ricaricare i dati per mantenerli aggiornati con la sorgente dati.

  • Fare clic su Ricarica per eseguire un ricaricamento manuale di tutte le tabelle.

  • Configurare un ricaricamento pianificato.

Ricaricamento di singole tabelle

È possibile ricaricare tabelle specifiche manualmente. Questa funzionalità è utile quando si presentano dei problemi con una o più tabelle.

  1. Aprire l'attività dati di trasferimento e selezionare la scheda Monitora.

  2. Selezionare le tabelle che si desidera ricaricare.

  3. Fare clic su Ricarica tabelle.

Nota informatica
  • Questa opzione è disponibile solo dopo che l'attività di trasferimento viene eseguita almeno una volta e unicamente quando questa non è in esecuzione.
  • Le modifiche ai metadati non sono supportate. Se sono presenti modifiche ai metadati nella sorgente, queste vengono propagate al trasferimento quando si ricaricano i dati, ma non saranno gestite in modo corretto. Questo può causare un errore dell'archiviazione di consumo.

Pianificazione di un'attività dati di trasferimento con Ricarica e confronta

È possibile pianificare ricaricamenti periodici per l'attività di dati di trasferimento se si dispone del ruolo Può operare nello spazio dell'attività di dati. Perché la pianificazione sia attiva, lo stato dell'attività dati deve essere almeno Preparato.

  • Fare clic su ... su un'attività di dati e selezionare Pianificazione.

    È possibile impostare una pianificazione basata sul tempo.

Nota informaticaSe un'attività di dati si sta ancora ricaricando quando sta per iniziare un ricaricamento pianificato, il ricaricamento pianificato viene ignorato fino al successivo evento di ricaricamento pianificato.

Impostazione della priorità di caricamento per i set di dati

È possibile controllare l'ordine di caricamento dei set di dati nelle attività dati assegnando una priorità di caricamento per ogni set di dati. Questa opzione può essere utile, per esempio, se si desidera caricare set di dati più piccoli prima di quelli grandi.

  1. Fare clic su Priorità di caricamento.

  2. Selezionare una priorità di caricamento per ogni set di dati.

    La priorità di caricamento predefinita è Normale. I set di dati verranno caricati nel seguente ordine di priorità:

    • Massima

    • Più alta

    • Alta

    • Normale

    • Bassa

    • Più bassa

    • Minima

    I set di dati con la stessa priorità vengono caricati senza seguire un ordine particolare.

  3. Fare clic su OK.

Nota informaticaI set di dati dalle sorgenti delle applicazioni SaaS possono contenere dipendenze nell'ordine di caricamento. Prendere in considerazione queste informazioni quando si imposta la priorità di caricamento.

Operazioni sull'attività dati di trasferimento

Dal menu attività è possibile eseguire le seguenti operazioni su un'attività di dati di trasferimento.

  • Apri

    Apre l'attività di dati di trasferimento. È possibile visualizzare la struttura e i dettagli della tabella relativi all'attività di dati.

  • Modifica

    È possibile modificare il nome e la descrizione dell'attività.

  • Elimina

    È possibile eliminare l'attività dati.

    I seguenti oggetti non vengono eliminati e devono essere eliminati manualmente:

    • I dati nell'area di trasferimento.

  • Esegui

    È possibile eseguire l'attività dati per avviare la copia dei dati.

    Esecuzione di un'attività di trasferimento con Change Data Capture (CDC)

    Esecuzione di un attività dati di trasferimento con Ricarica e confronta

  • Interrompi

    È possibile interrompere il funzionamento di un'attività dati in esecuzione. L'area di trasferimento non viene aggiornata con i dati modificati.

    Quando si arresta un'attività di dati di caricamento completa con una pianificazione di ricaricamento, viene arrestato solo il ricaricamento corrente. Se lo stato dell'attività di dati è Arrestato ed è presente una pianificazione di ricaricamento attiva, quest'ultimo verrà ricaricato nuovamente al successivo orario pianificato. È necessario disattivare la pianificazione di ricaricamento in Pianifica ricaricamento.

  • Ricarica

    È possibile eseguire un ricaricamento manuale di un'attività dati nella modalità di aggiornamento Ricaricamento e confronto.

  • Prepara

    Questa funzione prepara un'attività per l'esecuzione. Include le seguenti operazioni:

    • Convalida della validità della progettazione.

    • Creazione o modifica delle tabelle fisiche e delle visualizzazioni in modo che corrispondano alla progettazione.

    • Generazione del codice SQL per l'attività dati.

    • Creazione o modifica delle voci del catalogo per i set di dati di output dell'attività.

    È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo.

  • Ricrea tabelle

    Questa funzione ricrea i set di dati dalla sorgente.

    È necessario anche ricreare tutte le attività di dati downstream che consumano questa attività di dati.

  • Pianificazione

    È possibile configurare un ricaricamento pianificato per le attività di dati di trasferimento in modalità Caricamento completo. È possibile impostare una pianificazione basata sul tempo che può essere personalizzata.

    È anche possibile attivare o disattivare i ricaricamenti pianificati.

    Per pianificare i ricaricamenti, è necessario disporre del ruolo Può operare nello spazio dell'attività di dati.

  • Archivia dati

    È possibile creare un'attività di dati di archiviazione che utilizzi i dati di questa attività dati di destinazione.

Rimozione di colonne

Se si elimina una colonna utilizzata da un'attività di dati di archiviazione con cronologia abilitata, è necessario seguire questi passaggi per mantenere la cronologia ed evitare possibili perdite di dati.

  1. Interrompe l'attività di dati di trasferimento.

  2. Esegue l'attività di dati di trasferimento per assicurare che tutti i dati di trasferimento vengano letti.

  3. Rilasciare la colonna nel trasferimento.

  4. Esegue l'attività di dati di trasferimento.

  5. Nell'archiviazione, aggiungere la colonna con un'espressione predefinita (Null o il valore predefinito) o rilasciare la colonna.

Manutenzione dell'area di trasferimento

La pulizia automatica dell'area di trasferimento non è supportata. Ciò può influire sulle prestazioni.
Consigliamo di eseguire pulizie manuali dei precedenti dati di caricamento completo nell'area di trasferimento.

  • Qlik Cloud (tramite Amazon S3)

    Se sono presenti più cartelle di dati di caricamento completo, è possibile eliminarle tutte tranne quella più recente. È anche possibile eliminare le partizioni dati delle modifiche che sono state elaborate.

  • Data warehouse cloud

    È possibile eliminare i record di caricamento completo e delle tabelle delle modifiche che sono stati elaborati.

Limitazioni

  • La replica di dati varchar più lunghi di 8.000 byte o Nvarchar più lunghi di 4.000 byte non è supportata.

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!