Trasferimento dei dati dalle sorgenti dati
Il primo passaggio del trasferimento dei dati durante l'onboarding è il trasferimento dei dati. Ciò comporta il trasferimento dei dati dalla sorgente dati a un'area di trasferimento.
È possibile trasferire i dati da diverse sorgenti dati tramite le connessioni di origine.
L'area di trasferimento viene definita quando si crea il progetto.
-
Qlik Cloud (tramite Amazon S3)
Quando si trasferiscono i dati su Qlik Cloud (tramite Amazon S3), è possibile utilizzarli per generare tabelle QVD pronte per l'analisi in Qlik Cloud.
-
Data warehouse cloud
Quando si trasferiscono i dati in un data warehouse cloud, come Snowflake o Azure Synapse Analytics, è possibile archiviare le tabelle nello stesso data warehouse cloud.
-
Qlik Open Lakehouse
Quando si trasferiscono i dati in un Qlik Open Lakehouse, i dati vengono archiviati nel formato di tabella aperta Iceberg e possono essere sottoposti a mirroring nel data warehouse cloud.
È inoltre possibile trasferire i dati in un lakehouse, dove i dati vengono trasferiti nell'archiviazione file cloud gestita da Snowflake. Per ulteriori informazioni, vedere Dati di trasferimento su un lakehouse.
Creare e configurare un'attività dati di trasferimento
Questa sezione descrive come creare un'attività dati di trasferimento. Il modo più rapido per creare una pipeline di dati è eseguire l'onboarding dei dati, che crea un'attività dati di trasferimento e un'attività dati di archiviazione, pronte per essere preparate ed eseguite. Per ulteriori informazioni, vedere Acquisizione di dati in un data warehouse.
-
Nel progetto, fare clic su Crea e selezionare Trasferisci dati.
-
Nella finestra di dialogo Trasferisci dati, inserire un nome e una descrizione dell'attività dati.
Selezionare Apri per aprire l'attività dati di trasferimento una volta creata.
Fare clic su Crea.
-
Fare clic su Seleziona dati di origine.
-
Selezionare una connessione ai dati di origine e fare clic su Avanti.
È possibile utilizzare i filtri nel pannello di sinistra per filtrare l'elenco delle connessioni in base al tipo di origine, allo spazio e al proprietario.
Se non si dispone ancora di una connessione ai dati di origine, è necessario crearne prima una facendo clic su Aggiungi connessione.
Per ulteriori informazioni sulla configurazione di una connessione alle origini supportate, vedere Configurazione di connessioni alle sorgenti dati.
Nota informaticaDopo aver selezionato le tabelle nel passaggio successivo, non è possibile modificare la connessione di origine da una sorgente dati locale a una sorgente dati cloud o viceversa. È possibile modificare la connessione solo verso un'altra sorgente dati dello stesso tipo. -
Selezionare i set di dati da includere nell'attività dati. La finestra di dialogo di selezione è diversa a seconda del tipo di origine a cui si è connessi.
Al termine della selezione delle tabelle, fare clic su Salva.
Viene visualizzato Set di dati.
-
È possibile modificare le impostazioni per il trasferimento. Questo passaggio non è obbligatorio.
-
Fare clic su Impostazioni.
Per ulteriori informazioni sulle impostazioni, vedere Impostazioni di trasferimento.
-
-
Ora è possibile visualizzare in anteprima la struttura e i metadati delle tabelle dell'asset di dati selezionate. Ciò include tutte le tabelle elencate esplicitamente e le tabelle che corrispondono alle regole di selezione.
Se si desidera aggiungere altre tabelle dalla sorgente dati, fare clic su Seleziona dati di origine.
-
È possibile eseguire trasformazioni di base sui set di dati, come il filtraggio dei dati o l'aggiunta di colonne. Questo passaggio non è obbligatorio.
Per ulteriori informazioni, vedere Gestione dei set di dati.
-
Dopo aver aggiunto le trasformazioni desiderate, è possibile convalidare i set di dati facendo clic su Convalida set di dati. Se la convalida rileva errori, correggerli prima di procedere.
Per ulteriori informazioni, vedere Convalida e regolazione dei set di dati.
-
Quando si è pronti, fare clic su Prepara per catalogare l'attività dati e prepararla per l'esecuzione.
È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo.
-
Quando l'attività dati è preparata e si è pronti per avviare la replica dei dati, fare clic su Esegui.
La replica dovrebbe ora avviarsi ed è possibile visualizzarne l'avanzamento in Monitora. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale.
Selezione dei dati da un database
È possibile selezionare tabelle o viste specifiche oppure utilizzare regole di selezione per includere o escludere gruppi di tabelle.
Utilizzare % come carattere jolly per definire un criterio di selezione per schemi e tabelle.
-
%.% definisce tutte le tabelle in tutti gli schemi.
-
Public.% definisce tutte le tabelle nello schema Pubblico.
I criteri di selezione offrono all'utente un'anteprima in base alle selezioni personali.
Ora è possibile:
-
Creare una regola per includere o escludere un gruppo di tabelle in base ai criteri di selezione.
Fare clic su Aggiungi regola dai criteri di selezioneper creare una regola e selezionare sia Includi sia Escludi.
È possibile vedere la regola in Regole di selezione.
-
Selezionare uno o più set di dati e fare clic su Aggiungi set di dati selezionati.
È possibile vedere i set di dati aggiunti in Set di dati selezionati in modo esplicito.
Le regole di selezione si applicano solo all'insieme corrente di tabelle e viste, non a tabelle e viste che verranno aggiunte in futuro.
Esecuzione di un'attività di trasferimento con Change Data Capture (CDC)
È possibile eseguire l'attività di trasferimento quando è preparata. Questo avvia la replica che trasferisce i dati dalla sorgente dati locale all'area di trasferimento.
-
Fare clic su Esegui per avviare il trasferimento dei dati.
La replica dovrebbe ora avviarsi e l'attività dati avrà lo stato In esecuzione. Innanzitutto, viene copiata l'intera sorgente dati, quindi vengono tracciate le modifiche. Ciò significa che le modifiche vengono continuamente tracciate e trasferite quando vengono scoperte. Questo mantiene aggiornati i dati di trasferimento nell'area di trasferimento.
Nella home di Qlik Talend Data Integration è possibile visualizzare lo stato, la data e l'ora in cui i dati di trasferimento vengono aggiornati e il numero di tabelle in errore. È inoltre possibile aprire l'attività dati e selezionare la scheda Tabelle per visualizzare le informazioni di base sui metadati per le tabelle.
È possibile monitorare l'avanzamento in dettaglio aprendo la scheda Monitora. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale.
Quando tutte le tabelle sono caricate e la prima serie di modifiche viene elaborata, Dati aggiornati al sulla scheda dell'attività dati indica che le modifiche all'origine fino a quel momento sono disponibili nell'attività dati.
Ricaricamento delle tabelle
È possibile ricaricare i dati dall'origine.
Ricaricamento di singole tabelle
È possibile ricaricare tabelle specifiche manualmente senza interferire con il Change Data Capture. Questo è utile quando ci sono problemi di CDC con una o più tabelle.
-
Aprire l'attività dati di trasferimento e selezionare la scheda Monitora.
-
Selezionare le tabelle che si desidera ricaricare.
-
Fare clic su Ricarica tabelle.
Se non è possibile risolvere i problemi ricaricando le tabelle, o se interessano l'intera attività, è possibile ricaricare tutte le tabelle nella destinazione. Questo riavvierà il Change Data Capture.
Ricaricamento di tutte le tabelle nella destinazione
È possibile ricaricare tutte le tabelle nella destinazione se si verificano problemi di CDC che non possono essere risolti ricaricando tabelle specifiche. Esempi di problemi sono eventi mancanti, problemi causati dalla riorganizzazione del database di origine o errori durante la lettura degli eventi del database di origine.
- Interrompere l'attività dati e tutte le attività che la utilizzano.
-
Aprire l'attività dati e selezionare la scheda Monitora.
-
Fare clic su ..., quindi su Ricarica destinazione.
Questa opzione avvia la ricarica di tutte le tabelle nella destinazione utilizzando la funzione Rilascia-Crea, quindi riavvia tutte le attività di acquisizione dati di modifica da zero.
-
Le attività di archiviazione che utilizzano l'attività dati di trasferimento verranno ricaricate mediante il confronto e applicate alla successiva esecuzione per la sincronizzazione. La cronologia esistente viene mantenuta. La cronologia di Tipo 2 verrà aggiornata per riflettere le modifiche dopo l'esecuzione del processo di ricaricamento e confronto.
Il timestamp per la data di inizio nella cronologia di Tipo 2 rifletterà la data di ricaricamento, e non necessariamente la data in cui la modifica è stata portata nella sorgente.
-
Le visualizzazioni live per l'archiviazione non sono affidabili durante l'operazione di ricaricamento della destinazione e fino a quando l'archiviazione è sincronizzata. L'archiviazione verrà completamente sincronizzata nei seguenti casi:
-
Tutte le tabelle vengono ricaricate utilizzando le funzioni di confronto e applicazione.
-
Un ciclo di modifiche viene eseguito per ogni tabella.
-
Esecuzione di un'attività dati di trasferimento con Ricarica e confronta
È possibile copiare i dati utilizzando l'attività dati di trasferimento quando è preparata.
-
Fare clic su Esegui per avviare il caricamento completo.
I dati inizieranno ora a essere copiati e l'attività dati avrà lo stato In esecuzione. Quando l'intera sorgente dati viene copiata, lo stato è Completato.
Nella home di Qlik Talend Data Integration è possibile visualizzare lo stato, la data e l'ora in cui i dati di trasferimento vengono aggiornati e il numero di tabelle in errore. È inoltre possibile aprire l'attività dati e selezionare la scheda Tabelle per visualizzare le informazioni di base sui metadati per le tabelle.
È possibile monitorare l'avanzamento in dettaglio aprendo la scheda Monitora. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale.
Quando tutte le tabelle sono caricate, Dati aggiornati al sulla scheda dell'attività dati indica che le modifiche all'origine fino a quel momento sono disponibili nell'asset di dati. Tuttavia, alcune tabelle dell'attività dati possono essere aggiornate a un momento successivo, a seconda di quando hanno iniziato il caricamento. Ciò significa che la coerenza dei dati non è garantita. Ad esempio, se il caricamento è iniziato alle 08:00 e ha richiesto 4 ore, Dati aggiornati al mostrerà le 08:00 al termine del caricamento. Tuttavia, una tabella che ha iniziato a ricaricarsi alle 11:30 includerà le modifiche all'origine che si sono verificate tra le 08:00 e le 11:30.
Dati aggiornati al riflette solo le tabelle caricate correttamente. Non indica nulla riguardo alle tabelle i cui ricaricamenti sono falliti. Nelle destinazioni cloud, il campo sarà vuoto se un ricaricamento è stato completato con tutte le tabelle in errore.
Ricaricamento dei dati quando si utilizza Ricarica e confronta
Quando si utilizza Ricarica e confronta come metodo di aggiornamento, è necessario ricaricare i dati per mantenerli aggiornati con la sorgente dati.
-
Fare clic su Ricarica per eseguire un ricaricamento manuale di tutte le tabelle.
-
Configurare un ricaricamento pianificato.
Ricaricamento di singole tabelle
È possibile ricaricare tabelle specifiche manualmente. Questo è utile quando ci sono problemi con una o più tabelle.
-
Aprire l'attività dati di trasferimento e selezionare la scheda Monitora.
-
Selezionare le tabelle che si desidera ricaricare.
-
Fare clic su Ricarica tabelle.
- Questa opzione sarà disponibile dopo che l'attività di trasferimento è stata eseguita almeno una volta e solo quando l'attività non è in esecuzione.
- Le modifiche ai metadati non sono supportate. Se ci sono modifiche ai metadati nell'origine, vengono propagate al trasferimento durante il ricaricamento dei dati, ma non verranno gestite correttamente. Ciò potrebbe causare il fallimento dell'archiviazione di consumo.
Pianificazione di un'attività dati di trasferimento Ricarica e confronta
È possibile pianificare ricaricamenti periodici per l'attività dati di trasferimento se si dispone dei ruoli Può operare e Può modificare nello spazio dell'attività dati. Lo stato dell'attività dati deve essere almeno Preparato affinché la pianificazione sia attiva.
-
Fare clic su ... su un'attività dati e selezionare Pianificazione.
È possibile impostare una pianificazione basata sul tempo.
Per informazioni sugli intervalli di pianificazione minimi in base al tipo di sorgente dati e i livelli di sottoscrizione, vedere Intervalli di pianificazione minimi consentiti.
Impostazione della priorità di caricamento per i set di dati
È possibile controllare l'ordine di caricamento dei set di dati nelle attività dati assegnando una priorità di caricamento per ogni set di dati. Questa opzione può essere utile, per esempio, se si desidera caricare set di dati più piccoli prima di quelli grandi.
-
Fare clic su Priorità di caricamento.
-
Selezionare una priorità di caricamento per ogni set di dati.
La priorità di caricamento predefinita è Normale. I set di dati verranno caricati nel seguente ordine di priorità:
-
Massima
-
Più alta
-
Alta
-
Normale
-
Bassa
-
Più bassa
-
Minima
I set di dati con la stessa priorità vengono caricati senza seguire un ordine particolare.
-
-
Fare clic su OK.
Operazioni sull'attività dati di trasferimento
È possibile eseguire le seguenti operazioni su un'attività dati di trasferimento dal menu dell'attività.
-
Apri
Questo apre l'attività dati di trasferimento. È possibile visualizzare la struttura della tabella e i dettagli sull'attività dati.
-
Modifica
È possibile modificare il nome e la descrizione dell'attività.
-
Elimina
È possibile eliminare l'attività dati.
I seguenti oggetti non vengono eliminati:
-
I dati nell'area di trasferimento
-
Gli schemi nella piattaforma di destinazione
-
-
Esegui
È possibile eseguire l'attività dati per avviare la copia dei dati.
Esecuzione di un'attività di trasferimento con Change Data Capture (CDC)
Esecuzione di un'attività dati di trasferimento con Ricarica e confronta
-
Interrompi
È possibile interrompere l'operazione di un'attività dati in esecuzione. L'area di trasferimento non viene aggiornata con i dati modificati.
Quando si interrompe un'attività dati di caricamento completo con una pianificazione di ricaricamento, viene interrotto solo il ricaricamento corrente. Se lo stato dell'attività dati è Interrotto ed è presente una pianificazione di ricaricamento attiva, verrà ricaricata di nuovo all'orario pianificato successivo. È necessario disattivare la pianificazione di ricaricamento in Pianifica ricaricamento.
-
Ricarica
È possibile eseguire un ricaricamento manuale di un'attività dati in modalità di aggiornamento Ricarica e confronta.
- Prepara
Questo prepara un'attività per l'esecuzione. Ciò include:
-
La convalida della validità del design.
-
La creazione o la modifica delle tabelle fisiche e delle viste per farle corrispondere al design.
-
La generazione del codice SQL per l'attività dati.
-
La creazione o la modifica delle voci di catalogo per i set di dati di output dell'attività.
È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo.
Nota informaticaPrima di preparare un'attività, interrompere tutte le attività direttamente a valle. -
-
Ricrea tabelle
Questo ricrea i set di dati dall'origine.
Nota informaticaSe si verificano problemi con tabelle individuali, si consiglia per prima cosa di ricaricare le tabelle anziché ricrearle. La ricreazione delle tabelle può causare la perdita di dati cronologici. Se vi sono modifiche importanti, è necessario anche preparare le attività dati a valle che utilizzano le attività dati ricreate in modo che ricarichino i dati. -
Pianificazione
È possibile configurare un ricaricamento pianificato per le attività dati di trasferimento in modalità Caricamento completo. È possibile impostare una pianificazione basata sul tempo che può essere personalizzata.
È inoltre possibile attivare o disattivare i ricaricamenti pianificati.
È necessario disporre del ruolo Può operare nello spazio dell'attività dati per pianificare i ricaricamenti.
-
Archivia dati
È possibile creare un'attività dati di archiviazione che utilizza i dati di questa attività dati di trasferimento.
Aggiornamento metadati
È possibile aggiornare i metadati nell'attività per allinearli con le modifiche nei metadati nella sorgente nella vista Progettazione dell'attività. Per le applicazioni SaaS che utilizzano Metadata Manager, quest'ultimo deve essere aggiornato prima di poter aggiornare i metadati nell'attività dati.
, sia nella finestra di dialogo Crea connessione che nella guida online.-
È possibile eseguire le seguenti azioni:
-
Fare clic su ..., quindi su Aggiorna metadati per aggiornare i metadati per tutti i set di dati nell'attività.
-
Fare clic su ... su un set di dati in Set di dati, quindi su Aggiorna metadati per aggiornare i metadati per un singolo set di dati.
È possibile visualizzare lo stato del processo di aggiornamento dei metadati in Aggiorna metadati nella parte inferiore dello schermo. È possibile visualizzare la data dell'ultimo aggiornamento dei metadati posizionando il cursore su
.
-
-
Preparare l'attività dati per applicare le modifiche.
Una volta preparata l'attività dati e applicate le modifiche, queste vengono rimosse da Aggiorna metadati.
Devi preparare attività di archiviazione che utilizzano questa attività per propagare le modifiche.
Se una colonna viene rimossa, viene aggiunta una trasformazione con valori Null per assicurare che l'archiviazione non perda i dati cronologici.
Limitazioni per l'aggiornamento dei metadati
-
Se si esegue un'operazione di ridenominazione con una colonna rimossa anteriormente, nello stesso intervallo di tempo, questa verrà tradotta nella ridenominazione della colonna rimossa se hanno lo stesso tipo e la stessa lunghezza dati.
Esempio:
Prima: a b c d
Dopo: a c1 d
In questo esempio, b è stato rimosso e c è stato rinominato c1, mentre b e c hanno lo stesso tipo di dati e la stessa lunghezza dati.
L'operazione verrà identificata come ridenominazione di b in c1 e rimozione di c.
-
La ridenominazione dell'ultima colonna non viene riconosciuta, anche se questa è stata rimossa e quella prima di essa è stata rinominata.
Esempio:
Prima: a b c d
Dopo: a b c1
In questo esempio, d è stato rimosso e c è stato rinominato c1.
Questa operazione verrà identificata come rimozione di c e d e l'aggiunta di c1.
-
Le nuove colonne dovrebbero essere aggiunte alla fine. Se le colonne vengono aggiunte a metà con lo stesso tipo di dati della colonna successiva, possono essere interpretate come una rimozione e una ridenominazione.
Evoluzione dello schema
L'evoluzione degli schemi consente di rilevare facilmente le modifiche strutturali di più sorgenti dati e di controllare il modo in cui tali modifiche vengono applicate alla propria attività. L'evoluzione dello schema può essere utilizzata per rilevare le modifiche DDL apportate allo schema dei dati sorgente. È anche possibile applicare alcune modifiche automaticamente.
Per ogni tipo di modifica, è possibile selezionare il tipo di gestione dei cambiamenti nella sezione Evoluzione schema delle impostazioni dell'attività. È possibile applicare le modifiche, ignorarle, sospendere la tabella o arrestare l'elaborazione dell'attività.
È possibile impostare quale azione utilizzare per gestire la modifica DDL per ogni tipo di modifica. Alcune azioni non sono disponibili per tutti i tipi di cambiamento.
-
Applica alla destinazione
Applica le modifiche automaticamente.
-
Ignora
Ignora le modifiche.
-
Sospendi tabella
Sospende la tabella. La tabella verrà visualizzata come in errore in Monitora.
-
Arresta attività
Interrompe l'elaborazione dell'attività. È utile se si desidera gestire manualmente tutte le modifiche allo schema. In questo modo si interrompe anche la pianificazione, cioè le esecuzioni pianificate non vengono eseguite.
Sono supportate le seguenti modifiche:
-
Aggiungi colonna
-
Rinomina colonna
-
Modifica tipo di dati della colonna
-
Crea tabella che corrisponde al modello di selezione
Se si è utilizzata una Regola di selezione per aggiungere set di dati che corrispondono a un modello, le nuove tabelle che soddisfano il modello verranno rilevate e aggiunte.
Per ulteriori informazioni sulle impostazioni dell'attività, vedere Evoluzione dello schema
È inoltre possibile ricevere notifiche sulle modifiche gestite con l'evoluzione dello schema. Per ulteriori informazioni, vedere Impostare notifiche quando vengono apportate modifiche al funzionamento.
Limitazioni per l'evoluzione dello schema
Per l'evoluzione dello schema, si applicano le seguenti limitazioni:
-
L'evoluzione dello schema è supportata solo quando si utilizza il CDC come metodo di aggiornamento.
-
Una volta modificate le impostazioni di evoluzione dello schema, è necessario preparare nuovamente l'attività.
-
Se si rinominano le tabelle, l'evoluzione dello schema non è supportata. In questo caso è necessario aggiornare i metadati prima di preparare l'attività.
-
Se si desidera progettare un'attività, è necessario aggiornare il browser per ottenere le modifiche all'evoluzione dello schema. È possibile impostare delle notifiche per ricevere avvisi relativi alle modifiche.
-
Nelle attività di trasferimento, l'eliminazione delle colonne non è supportata. L'eliminazione e l'aggiunta di una colonna genereranno un errore della tabella.
-
Nelle attività di trasferimento, l'operazione di eliminazione di tabella non eliminerà la tabella. L'eliminazione e la successiva aggiunta di una tabella troncheranno solo la tabella precedente e non verrà aggiunta una nuova tabella.
-
La modifica della lunghezza di una colonna non è possibile per tutte le destinazioni, a seconda del supporto del database di destinazione.
-
Se il nome di una colonna viene modificato, le trasformazioni esplicite definite utilizzando quella colonna non avranno effetto, poiché si basano sul nome della colonna.
-
Le limitazioni dell'opzione Aggiorna metadati si applicano anche all'evoluzione dello schema.
-
Se un'attività contiene modifiche di progettazione che non sono ancora state preparate e vengono rilevate modifiche di evoluzione dello schema di origine quando l'attività viene eseguita, l'attività verrà interrotta per evitare conflitti. Prepara le modifiche di progettazione in attesa ed esegui nuovamente l'attività.
Durante l'acquisizione delle modifiche del DDL, si applicano le seguenti limitazioni:
-
Quando si verifica una rapida sequenza di operazioni nel database di origine (ad esempio, DDL>DML>DDL), Qlik Talend Data Integration può analizzare il registro nell'ordine sbagliato, con conseguente mancanza di dati o comportamento imprevedibile. Per ridurre al minimo le possibilità che ciò accada, la prassi migliore è attendere che le modifiche vengano applicate alla destinazione prima di eseguire l'operazione successiva.
A titolo di esempio, durante l'acquisizione delle modifiche, se una tabella di origine viene rinominata più volte in rapida successione (e la seconda operazione la rinomina con il nome originale), si può verificare un errore che indica che la tabella esiste già nel database di destinazione.
- Se si modifica il nome di una tabella utilizzata in un'attività e poi si interrompe quell'attività, Qlik Talend Data Integration non acquisirà le modifiche apportate a quella tabella dopo la ripresa dell'attività.
-
La ridenominazione di una tabella di origine non è supportata quando un'attività è interrotta.
- La riallocazione delle colonne Chiave primaria di una tabella non è supportata (e quindi non verrà scritta nella tabella di controllo Cronologia DDL).
- Quando il tipo di dati di una colonna viene modificato e la (stessa) colonna viene poi rinominata durante l'interruzione dell'attività, la modifica del DDL apparirà nella tabella di controllo Cronologia DDL come "Elimina colonna", quindi come "Aggiungi colonna" una volta ripresa l'attività. Notare che lo stesso comportamento può verificarsi anche come risultato di una latenza prolungata.
- Le operazioni CREATE TABLE eseguite sulla sorgente durante l'interruzione di un'attività verranno applicate alla destinazione una volta ripresa l'attività, ma non saranno registrate come DDL nella tabella di controllo Cronologia DDL.
-
Le operazioni associate alle modifiche dei metadati (come ALTER TABLE, riorganizzazione, ricreazione di un indice in cluster e così via) possono causare un comportamento imprevedibile se vengono eseguite nei seguenti casi:
-
Durante un caricamento completo
-OPPURE-
-
Tra il timestamp Inizia a elaborare le modifiche da e l'ora corrente (cioè il momento in cui l'utente fa clic su OK nella finestra di dialogo Opzioni di esecuzione avanzate ).
Esempio:
IF:
l'ora specificata per Inizia a elaborare le modifiche da sono le 10:00.
AND:
una colonna denominata Age (Età) è stata aggiunta alla tabella Employees (Dipendenti) alle ore 10:10.
AND:
l'utente fa clic su OK nella finestra di dialogo Opzioni di esecuzione avanzate alle ore 10:15.
THEN:
le modifiche avvenute tra le 10:00 e le 10:10 possono causare errori nel processo CDC.
Nota informaticaIn uno dei casi sopra descritti, la tabella o le tabelle interessate devono essere ricaricate affinché i dati siano correttamente spostato nella destinazione.
-
- L'istruzione DDL
ALTER TABLE ADD/MODIFY <column> <data_type> DEFAULT <>non replica il valore predefinito nella destinazione e la colonna nuova/modificata viene impostata su NULL. Notare che questo può accadere anche se il processo DDL che ha aggiunto/modificato la colonna è stato eseguito precedentemente. Se la colonna nuova/modificata ammette i valori null, l'endpoint di origine aggiorna tutte le righe della tabella prima di registrare il DDL stesso. Di conseguenza, Qlik Talend Data Integration acquisisce le modifiche ma non aggiorna la destinazione. Poiché la colonna nuova/modificata è impostata su NULL, se la tabella di destinazione non ha una chiave primaria/un indice univoco, gli aggiornamenti successivi genereranno il messaggio "zero righe interessate". -
Le modifiche alle colonne di precisione TIMESTAMP e DATE non verranno acquisite.
Gestione delle modifiche che non vengono applicate automaticamente
Questa sezione descrive come gestire le modifiche che non possono essere applicate alla destinazione, ovvero l'azione è Ignora, Sospendi o Interrompi attività.
| Modifica DDL | Per implementare la modifica | Per preservare lo stato corrente |
|---|---|---|
| Aggiungi colonna | Aggiornare i metadati, preparare l'attività e quindi eseguire l'attività. | Nessuna azione richiesta |
| Crea tabella | Aggiornare i metadati, preparare l'attività e quindi eseguire l'attività. | Nessuna azione richiesta |
| Modifica tipo di dati della colonna |
Verificare le limitazioni. Se non si applica alcuna limitazione: Aggiornare i metadati, preparare l'attività e quindi eseguire l'attività. |
La conservazione dello stato corrente non è sempre supportata. Possibili soluzioni alternative:
|
| Rinomina tabella |
Verificare le limitazioni. Se non si applica alcuna limitazione: Preparare l'attività e quindi eseguire l'attività. |
Definire una regola di ridenominazione esplicita per il vecchio nome. |
| Rinomina colonna |
Verificare le limitazioni. Se non si applica alcuna limitazione: Aggiornare i metadati, preparare l'attività e quindi eseguire l'attività. |
Aggiornare i metadati, quindi definire una regola di ridenominazione esplicita per il vecchio nome. |
Rimozione di colonne
Se si elimina una colonna che viene utilizzata da un'attività dati di archiviazione con cronologia abilitata, è necessario seguire questi passaggi per preservare la cronologia ed evitare possibili perdite di dati.
-
Interrompere l'attività dati di trasferimento.
-
Eseguire l'attività dati di archiviazione per assicurarsi che tutti i dati di trasferimento vengano letti.
-
Eliminare la colonna nel trasferimento.
-
Eseguire l'attività dati di trasferimento.
-
Nell'archiviazione, aggiungere la colonna con un'espressione predefinita (Null o valore predefinito) oppure eliminare la colonna.
Visualizzazione delle informazioni sull'attività
Fare clic su sulla barra dei menu per visualizzare le informazioni sull'attività, ad esempio:
-
Proprietario
-
Spazio
-
Piattaforma dati
-
ID progetto
-
ID tempo di esecuzione attività dati
Modifica delle connessioni di origine o del gateway dati
Se si modifica la connessione di origine o il gateway dati di origine, è necessario ricreare tutte le tabelle.
Manutenzione dell'area di trasferimento
La pulizia automatica dell'area di trasferimento non è supportata. Ciò può influire sulle prestazioni.
Si consiglia di eseguire pulizie manuali dei vecchi dati di caricamento completo nell'area di trasferimento.
-
Qlik Cloud (tramite Amazon S3)
Se sono presenti diverse cartelle di dati di caricamento completo, è possibile eliminare tutte le cartelle tranne la più recente. È inoltre possibile eliminare le partizioni dei dati di modifica che sono state elaborate.
-
Data warehouse cloud
È possibile eliminare i record delle tabelle di caricamento completo e di modifica che sono stati elaborati.
Raccomandazioni
-
Se una chiave primaria in una tabella di origine può essere aggiornata, abilitare l'opzione DELETE e INSERT durante l'aggiornamento di una colonna chiave primaria in Ottimizzazione elaborazione modifiche.
Limitazioni
-
La replica di dati varchar più lunghi di 8000 byte o Nvarchar più lunghi di 4000 byte non è supportata.
-
La modifica della nullabilità non è supportata sulle colonne che vengono spostate, né modificandola direttamente né utilizzando una regola di trasformazione. Tuttavia, le nuove colonne create nell'attività sono nullable per impostazione predefinita.
-
Le colonne di origine di tipo CLOB e BLOB verranno impostate come nullable per impostazione predefinita, anche se contrassegnate come non nullable nell'origine. È possibile modificarle in modo che non siano nullable, ma in tal caso è necessario aggiungere un'espressione per aggiungere un valore non null nel caso in cui arrivi come null dall'origine. Ciò può accadere sui record eliminati.
Le trasformazioni sono soggette alle seguenti limitazioni:
- Le trasformazioni non sono supportate per le colonne con lingue da destra a sinistra.
-
Le trasformazioni non possono essere eseguite sulle colonne che contengono caratteri speciali (ad esempio #, \, /, -) nel nome.
- L'unica trasformazione supportata per i tipi di dati LOB/CLOB è il rilascio della colonna nella destinazione.
- L'utilizzo di una trasformazione per rinominare una colonna e quindi aggiungere una nuova colonna con lo stesso nome non è supportato.