Impostazioni di trasferimento
È possibile configurare le impostazioni per l'attività dati di trasferimento.
-
Aprire l'attività di trasferimento e fare clic su Impostazioni nella barra degli strumenti.
Si apre la finestra di dialogo Impostazioni: <Nome-attività>. Le impostazioni disponibili sono descritte di seguito.
Generale
-
Database
Database da utilizzare nella destinazione.
Nota informaticaQuesta opzione non è disponibile quando si trasferiscono dati in Qlik Cloud (tramite Amazon S3). -
Schema attività
È possibile modificare il nome dello schema dell'attività dati di trasferimento. Il nome predefinito è landing.
Nota informaticaQuesta opzione non è disponibile quando si trasferiscono dati in Qlik Cloud (tramite Amazon S3). -
Maiuscole/minuscole predefinite del nome dello schema
È possibile impostare le maiuscole/minuscole predefinite per tutti i nomi di schema. Se il database è configurato per forzare l'uso delle maiuscole, questa opzione non avrà alcun effetto.
-
Prefisso per tutte le tabelle e le viste
È possibile impostare un prefisso per tutte le tabelle e le viste create con questa attività.
Nota informaticaQuesta opzione non è disponibile quando si trasferiscono dati in Qlik Cloud (tramite Amazon S3).Nota informaticaÈ necessario utilizzare un prefisso univoco quando si desidera utilizzare uno schema di database in più attività dati. -
Metodo di aggiornamento
L'attività di trasferimento inizia sempre con un Caricamento completo. Una volta completato il Caricamento completo, è possibile mantenere aggiornati i dati trasferiti utilizzando uno dei metodi descritti di seguito:
Nota informaticaNon è possibile cambiare il metodo di aggiornamento una volta completata l'operazione di preparazione dell'attività di trasferimento dati.-
Change Data Capture (CDC)
I dati trasferiti vengono mantenuti aggiornati usando la tecnologia CDC (Change Data Capture). Non tutte le sorgenti dati potrebbero supportate CDC. CDC non acquisisce le operazioni DDL, quali la ridenominazione di colonne o le modifiche ai metadati.
Se i dati contengono anche visualizzazioni o tabelle che non supportano la funzione CDC, verranno create due pipeline di dati. Una pipeline con tutte le tabelle che supportano la funzione CDC, e un'altra pipeline con tutte le altre tabelle e visualizzazioni che utilizzano Ricaricamento e confronto come metodo di aggiornamento.
-
Ricarica e confronta
Tutti i dati trasferiti vengono ricaricati dalla sorgente. Ciò risulta utile se la sorgente dell'utente non supporta la CDC, ma è utilizzabile con qualsiasi sorgente dati supportata.
È possibile pianificare i ricaricamenti periodicamente.
-
-
Metodo di caricamento
Quando si esegue la replica su una destinazione Snowflake, è possibile scegliere uno dei seguenti metodi di caricamento:
-
Caricamento in blocco (impostazione predefinita)
Se si seleziona il Caricamento in blocco, sarà possibile regolare i parametri di caricamento nella scheda Caricamento dati.
-
Snowpipe Streaming
Nota informaticaSnowpipe Streaming sarà disponibile per la selezione solo se sono soddisfatte le seguenti condizioni:
- Il metodo di aggiornamento Change Data Capture (CDC) è abilitato.
- Il Meccanismo di autenticazione nel connettore Snowflake è impostato su Coppia di chiavi.
- Se si utilizza Gateway Data Movement, è richiesta la versione 2024.11.45 o una successiva.
Se si seleziona Snowpipe Streaming, assicurarsi di comprendere le limitazioni e considerazioni quando si usa questo metodo. Inoltre, se si seleziona Snowpipe Streaming e poi si passa al metodo di aggiornamento Ricarica e confronta, il metodo di caricamento tornerà automaticamente al Caricamento in blocco.
Le ragioni principali per scegliereSnowpipe Streaming anziché Caricamento in blocco sono elencate di seguito:
-
Meno costoso: poiché Snowpipe Streaming non utilizza il warehouse di Snowflake, i costi operativi dovrebbero essere significativamente più bassi, anche se ciò dipenderà dal proprio caso d'uso specifico.
-
Latenza ridotta: poiché i dati vengono inviati in streaming direttamente alle tabelle di destinazione (anziché tramite lo staging), la replica dalla sorgente dati alla destinazione dovrebbe essere più veloce.
Nota di suggerimentoQuando si utilizza Snowpipe Streaming, il caricamento completo iniziale potrebbe essere significativamente più lento del Caricamento in blocco. Per ottimizzare le prestazioni di caricamento, soprattutto quando si caricano set di dati di grandi dimensioni, la procedura consigliata è utilizzare Snowpipe Streaming insieme alla funzionalità di caricamento parallelo. -
-
Cartella da utilizzare nell'area di staging
Per le piattaforme dati che richiedono un'area di staging (ad esempio, Databricks e Azure Synapse Analytics), è possibile selezionare la cartella da utilizzare per il trasferimento dei dati.
-
Cartella predefinita
Viene creata una cartella con il nome predefinito: <nome progetto>/<nome attività dati>.
-
Cartella principale
Archiviare i dati nella cartella principale della memoria.
Nota informaticaQuesta opzione è disponibile solo quando si trasferiscono dati in Qlik Cloud (tramite Amazon S3). -
Cartella
Specificare un nome di cartella da utilizzare.
-
-
Intervallo di elaborazione delle modifiche
È possibile impostare l'intervallo tra l'elaborazione delle modifiche dalla sorgente.
Nota informaticaQuesta opzione è disponibile solo quando si trasferiscono dati in Qlik Cloud (tramite Amazon S3). -
Server proxy quando si utilizza Data Movement gateway
Nota informaticaQuesta opzione è disponibile solo quando si accede alle destinazioni tramite Data Movement gateway.È possibile selezionare di utilizzare un server proxy quando il gateway Data Movement si connette al data warehouse cloud e all'area di archiviazione.
Per ulteriori informazioni sulla configurazione del gateway Data Movement per l'utilizzo di un server proxy, vedere Impostazione del tenant Qlik Cloud e di un server proxy.
-
Usa proxy per connettersi al data warehouse cloud
Nota informaticaDisponibile quando si utilizza Snowflake, Google BigQuery e Databricks. -
Usa proxy per connettersi alla memoria
Nota informaticaDisponibile quando si utilizza Azure Synapse Analytics, Amazon Redshift e Databricks.
-
Caricamento dati
Alcune delle impostazioni in questa scheda sono rilevanti solo per piattaforme di destinazione specifiche.
Rilevante per tutte le piattaforme dati eccetto Qlik Cloud e Snowflake
Dimensione massima file (MB)
Le dimensioni massime che può raggiungere un file prima che venga chiuso. I file di dimensioni inferiori possono essere caricati più velocemente (dipendendo dalla rete) e migliorare le prestazioni quando sono utilizzati insieme all'opzione di esecuzione parallela. Tuttavia, in generale si considera una cattiva prassi ingombrare il database con file di piccole dimensioni.
Rilevante solo per Google BigQuery
Usa compressione
Se selezionato, i file CSV verranno compressi (utilizzando gzip) prima di essere caricati su Google BigQuery.
Richiede Gateway Data Movement 2023.5.16 o versione successiva.
Rilevante solo per Snowflake
Nella scheda Generale , è possibile scegliere se caricare i dati in Snowflake utilizzando Caricamento in blocco o Streaming Snowpipe. Quando è selezionato Streaming Snowpipe, la scheda Caricamento dati non verrà visualizzata. Quando è selezionato Caricamento in blocco, saranno disponibili le seguenti impostazioni:
-
Dimensione massima file (MB): Rilevante per il caricamento completo iniziale e CDC. La dimensione massima che un file può raggiungere prima di essere caricato nella destinazione. Se si riscontrano problemi di prestazioni, provare a regolare questo parametro.
-
Numero di file da caricare in un batch: Rilevante solo per il caricamento completo iniziale. Il numero di file da caricare in un singolo batch. Se si riscontrano problemi di prestazioni, provare a regolare questo parametro.
Per una descrizione dei metodi di caricamento Caricamento in blocco e Streaming Snowpipe, vedere Generale.
Metadati
Colonne LOB
Includi colonne LOB e limita la dimensione della colonna a (KB):
È possibile scegliere di includere le colonne LOB nell'attività e impostare la dimensione massima dei LOB. I LOB di dimensioni superiori a quella massima verranno troncati.
Tabelle di controllo
Selezionare quali delle seguenti tabelle di controllo si desidera creare sulla piattaforma di destinazione:
- Stato trasferimento: Fornisce dettagli sull'attività di trasferimento corrente, tra cui lo stato dell'attività, la quantità di memoria consumata dall'attività, il numero di modifiche non ancora applicate alla piattaforma dati e la posizione nell'endpoint di origine da cui Gateway Data Movement sta attualmente leggendo.
- Tabelle sospese: Fornisce un elenco delle tabelle sospese e il motivo della sospensione.
- Cronologia trasferimento: Fornisce informazioni sulla cronologia dell'attività, tra cui il numero e il volume di record elaborati durante un'attività di trasferimento, la latenza al termine di un'attività CDC e altro ancora.
-
Cronologia DDL: Contiene una cronologia di tutte le modifiche DDL supportate che si sono verificate durante un'attività.
La tabella Cronologia DDL è supportata solo dalle seguenti piattaforme di destinazione:
-
Databricks
- Microsoft Fabric
- Amazon Redshift
- Se si utilizza Gateway Data Movement, le seguenti destinazioni richiedono la versione 2024.11.14 o successiva:
- Amazon S3
- Google Cloud Storage
- Snowflake
- Kafka - Se si utilizza Gateway Data Movement, è richiesta la versione 2025.5.42 o successiva.
- Se si utilizza Gateway Data Movement, le seguenti destinazioni richiedono la versione 2025.11.1 o successiva:
- Google BigQuery
- Google Cloud Alloy DB per PostgreSQL (tramite il connettore PostgreSQL)
- Google Cloud SQL per PostgreSQL (tramite il connettore PostgreSQL)
- Database di Microsoft Azure per PostgreSQL (tramite il connettore PostgreSQL)
- PostgreSQL
-
Per una descrizione dettagliata di ciascuna delle tabelle di controllo, vedere Tabelle di controllo
Caricamento completo
Ottimizzazione delle prestazioni
- Numero massimo di tabelle da caricare in parallelo: Inserire il numero massimo di tabelle da caricare nella destinazione contemporaneamente. Il valore predefinito è 5.
-
Timeout coerenza transazioni (secondi): Inserire il numero di secondi di attesa per la chiusura delle transazioni aperte, prima di iniziare l'operazione di caricamento completo. Il valore predefinito è 600 (10 minuti). Il caricamento completo inizierà dopo il raggiungimento del valore di timeout anche se ci sono transazioni ancora aperte.
Nota informaticaPer replicare le transazioni che erano aperte all'avvio del caricamento completo ma che sono state confermate solo dopo il raggiungimento del valore di timeout, è necessario ricaricare le tabelle di destinazione. - Frequenza di commit durante il caricamento completo: Il numero massimo di eventi che possono essere trasferiti insieme. Il valore predefinito è 10000.
Al termine del caricamento completo
Crea chiave primaria o univoca: Selezionare questa opzione se si desidera ritardare la creazione della chiave primaria o dell'indice univoco sulla piattaforma dati fino al termine del caricamento completo.
Per il caricamento iniziale
Quando si spostano i dati dalla sorgente di un'applicazione SaaS, è possibile impostare il modo in cui viene eseguito il caricamento completo:
| Usa dati in cache |
Quest'opzione consente di utilizzare i dati in cache letti quando si generano metadati con l'opzione Scansione dati completa selezionata. Ciò garantisce un minor tempo di overhead per quanto concerne le quote e l'utilizzo di API, visto che i dati vengono già letti dalla sorgente. Qualsiasi modifica successiva alla scansione dati iniziale può essere rilevata da Change Data Capture (CDC). |
| Carica da origine |
Quest'opzione esegue un nuovo caricamento dalla sorgente dati. Quest'opzione è utile se:
|
Gestione degli errori
Errori dati
La gestione degli errori dei dati è supportata solo con il metodo di aggiornamento Change Data Capture (CDC).
Per errori di troncamento di dati: selezionare l'azione da eseguire quando si verifica un troncamento in uno o più record specifici. È possibile selezionare una delle seguenti opzioni dall'elenco:
- Ignora: l'attività continua e l'errore viene ignorato.
- Sospendi tabella: l'attività continua, ma i dati dalla tabella con il record dell'errore viene spostato in uno stato di errore e i relativi dati non vengono replicati.
- Arresta attività: l'attività viene interrotta ed è richiesto l'intervento manuale.
Per gli altri errori nei dati: selezionare l'azione da eseguire quando si verifica un errore in uno o più record specifici. È possibile selezionare una delle seguenti opzioni dall'elenco:
- Ignora: l'attività continua e l'errore viene ignorato.
- Sospendi tabella: l'attività continua, ma i dati dalla tabella con il record dell'errore viene spostato in uno stato di errore e i relativi dati non vengono replicati.
- Arresta attività: l'attività viene interrotta ed è richiesto l'intervento manuale.
Riassegna gestione errore quando gli altri errori nei dati raggiungono (per tabella): selezionare questa casella di controllo per riassegnare la gestione dell'errore quando il numero di errori nei dati che non sono relativi al troncamento (per tabella) raggiunge la quantità specificata. I valori validi sono 1-10.000.
Azione di riassegnazione: scegliere l'azione da eseguire quando si riassegna la gestione dell'errore. Notare che le operazioni disponibili dipendono dall'azione selezionata dall'elenco a discesa Per gli altri errori nei dati descritto prima.
-
Sospendi tabella (opzione predefinita): l'attività continua, ma i dati dalla tabella con il record dell'errore viene spostato in uno stato di errore e i relativi dati non vengono landed.
- Arresta attività: l'attività viene interrotta ed è richiesto l'intervento manuale.
Errori tabella
Numero di tentativi prima di restituire un errore di tabella
Questa opzione permette di controllare quando verranno attivati i criteri di gestione degli errori nella tabella. Per impostazione predefinita, dopo aver riscontrato un errore nella tabella, questa viene sospesa o l'attività viene interrotta (in base all'azione selezionata) dopo tre tentativi. A volte, si verifica un errore di tabella a causa della manutenzione programmata dell'applicazione SaaS. In questi casi, il numero predefinito di tentativi potrebbe non essere sufficiente per completare la manutenzione prima che vengano attivati i criteri di gestione degli errori nella tabella. Questo dipende anche dall'intervallo di pianificazione dell'attività, in quanto verrà eseguito un tentativo ogni volta che l'attività viene eseguita. Quindi, ad esempio, se si pianifica un'attività da eseguire ogni ora e l'applicazione SaaS viene messa offline per manutenzione proprio quando l'attività inizia a essere eseguita, il valore predefinito di tre tentativi consentirà all'applicazione SaaS di essere offline per un massimo di tre ore senza che vengano attivati i criteri di gestione degli errori nella tabella. Una finestra di manutenzione più lunga richiederebbe di aumentare il numero di tentativi (o di modificare la pianificazione) per evitare che vengano attivati i criteri di gestione degli errori della tabella.
Per riassumere, se sa che la sua applicazione SaaS è sottoposta a manutenzione periodica, la prassi migliore è aumentare il numero di tentativi in base alla pianificazione, in modo che la manutenzione possa essere completata senza che venga attivato il criterio di gestione degli errori nella tabella.
-
Questa opzione sarà visualizzata solo per le attività configurate con un connettore per applicazioni SaaS Lite o Standard.
-
Se si utilizza Gateway Data Movement, è richiesta la versione 2024.11.70 o successiva.
Quando rileva un errore tabella: selezionare una delle opzioni descritte di seguito dall'elenco a discesa:
- Sospendi tabella: (opzione predefinita) l'attività continua, ma i dati dalla tabella con il record dell'errore passano a uno stato di errore e i dati correlati non vengono replicati.
- Interrompi attività: l'attività viene interrotta ed è richiesto l'intervento manuale.
Riassegna gestione quando gli errori di tabelle raggiungono (per tabella): selezionare questa casella di controllo per riassegnare la gestione dell'errore quando il numero di errori della tabella (per tabella) raggiunge il numero specificato. I valori validi sono 1-10.000.
Azione di riassegnazione: i criteri di riassegnazione per gli errori nella tabella sono impostati su Interrompi attività e non è possibile modificarli.
Ambientali
-
Numero massimo di tentativi: selezionare questa opzione, quindi specificare il numero massimo di tentativi in cui cercare di eseguire l'attività quando si verifica un errore ambientale recuperabile. Una volta completato il numero di tentativi specificato per eseguire l'attività, questa viene interrotta ed è richiesto l'intervento manuale da parte dell'utente.
Per fare in modo che non venga eseguito nessun tentativo, deselezionare la casella di controllo o specificare "0".
Per impostare un numero infinito di tentativi, specificare "-1"
-
Intervallo tra nuovi tentativi (secondi): utilizzare il contatore per selezionare o digitare il numero di secondi che il sistema deve attendere tra un tentativo e l'altro quando tenta di eseguire un'attività.
I valori validi sono 0-2.000.
-
- Aumenta intervallo di tentativi per interruzioni prolungate: selezionare questa casella di controllo per aumentare l'intervallo tra i tentativi per le interruzioni prolungate. Quando questa opzione è abilitata, la durata dell'intervallo tra ciascun tentativo di esecuzione dell'attività raddoppia, fino al raggiungimento dell'Intervallo massimo di tentativi (i tentativi continuano a essere eseguiti in base all'intervallo massimo specificato).
- Intervallo massimo di tentativi (secondi): utilizzare il contatore per selezionare o digitare il numero di secondi da attendere tra un tentativo di eseguire un'attività quando l'opzione Aumenta intervallo di tentativi per interruzioni prolungate è selezionata. I valori validi sono 0-2.000.
Ottimizzazione dell'elaborazione delle modifiche
Ottimizzazione dell'offload transazionale
-
Esegui offload delle transazioni in corso su disco se:
I dati delle transazioni vengono solitamente conservati in memoria fino a quando non vengono completamente confermati nella sorgente o nella destinazione. Tuttavia, le transazioni più grandi della memoria allocata o che non vengono confermate entro il limite di tempo specificato verranno scaricate su disco.
- La dimensione totale della memoria per tutte le transazioni supera (MB): La dimensione massima che tutte le transazioni possono occupare in memoria prima di essere scaricate su disco. Il valore predefinito è 1024.
- La durata della transazione supera (secondi): Il tempo massimo che ogni transazione può rimanere in memoria prima di essere scaricata su disco. La durata viene calcolata dal momento in cui Qlik Talend Data Integration ha iniziato a catturare la transazione. Il valore predefinito è 60.
Ottimizzazione batch
Alcune delle impostazioni in questa scheda potrebbero non essere applicabili a tutte le destinazioni o ai metodi di caricamento di destinazione.
Impostazioni applicabili a tutte le destinazioni eccetto Qlik Cloud e Snowflake quando il "Metodo di caricamento" è "Streaming Snowpipe"
- Applica modifiche in batch a intervalli:
-
Più di: Il tempo minimo di attesa tra ogni applicazione di modifiche in batch. Il valore predefinito è 1.
L'aumento del valore Più di diminuisce la frequenza con cui le modifiche vengono applicate alla destinazione, aumentando al contempo la dimensione dei batch. Ciò può migliorare le prestazioni quando si applicano modifiche a database di destinazione ottimizzati per l'elaborazione di batch di grandi dimensioni.
- Meno di: Il tempo massimo di attesa tra ogni applicazione di modifiche in batch (prima di dichiarare un timeout). In altre parole, la latenza massima accettabile. Il valore predefinito è 30. Questo valore determina il tempo massimo di attesa prima di applicare le modifiche, dopo che è stato raggiunto il valore Più di.
-
Forza l'applicazione di un batch quando la memoria di elaborazione supera (MB): La quantità massima di memoria da utilizzare per la pre-elaborazione. Il valore predefinito è 500 MB.
Per la dimensione massima del batch, impostare questo valore sulla quantità massima di memoria che è possibile allocare all'attività dati. Ciò può migliorare le prestazioni quando si applicano modifiche a database di destinazione ottimizzati per l'elaborazione di batch di grandi dimensioni.
-
Applica modifiche in batch a più tabelle contemporaneamente: La selezione di questa opzione dovrebbe migliorare le prestazioni quando si applicano modifiche da più tabelle di origine.
-
Numero massimo di tabelle: Il numero massimo di tabelle a cui applicare le modifiche in batch contemporaneamente. Il valore predefinito è cinque.
Nota informaticaQuesta opzione non è supportata quando si utilizza Google BigQuery come piattaforma dati. -
-
Limita il numero di modifiche applicate per istruzione di elaborazione delle modifiche a: Selezionare questa opzione per limitare il numero di modifiche applicate in una singola istruzione di elaborazione delle modifiche. Il valore predefinito è 10.000.
Nota informaticaQuesta opzione è supportata solo quando si utilizza Google BigQuery come piattaforma dati.
Impostazioni applicabili solo a Qlik Cloud e Snowflake quando il "Metodo di caricamento" è "Streaming Snowpipe"
-
Numero minimo di modifiche per transazione: il numero minimo di modifiche da includere in ogni transazione. Il valore predefinito è 1000.
Nota informaticaLe modifiche verranno applicate alla destinazione quando il numero di modifiche è uguale o maggiore del valore dell'opzione Numero minimo di modifiche per transazione O quando il valore Tempo massimo per raggruppare le transazioni in lotti prima dell'applicazione (secondi), a seconda di quale condizione si verifica per prima. Poiché la frequenza delle modifiche applicate nella destinazione è controllata da questi due parametri, le modifiche ai record di origine potrebbero non essere riflesse immediatamente nei record di destinazione.
- Tempo massimo per raggruppare le transazioni in lotti prima dell'applicazione (secondi): il tempo massimo per raccogliere le transazioni in batch prima che venga dichiarato un timeout. Il valore predefinito è 1.
Intervallo
Impostazioni per l'utilizzo dei connettori SAP ODP e applicazioni SaaS (Lite)
-
Leggi modifiche ogni (minuti)
Impostare l'intervallo tra le modifiche di lettura dalla sorgente in minuti. L'intervallo valido è compreso tra 1 e 1440.
Nota informaticaQuesta opzione è disponibile solo quando l'attività dati è definita con le seguenti opzioni:
- Gateway Data Movement
- Una qualsiasi delle seguenti fonti:
- Applicazione SaaS solo tramite connettori Lite
- SAP ODP
- Il metodo di aggiornamento Change Data Capture (CDC)
Le impostazioni quando si usa il connettore SAP OData
Verifica la presenza di modifiche
-
In base all'intervallo di estrazione delta: quando questa opzione è selezionata, l'attività dati verifica la presenza di modifiche in base all'intervallo di estrazione delta.
Nota informaticaL'intervallo inizierà dopo ogni "round". Un round può essere definito come il tempo necessario all'attività dati per leggere le modifiche dalle tabelle di origine e inviarle alla destinazione (come singola transazione). La durata di un round varia in base al numero di tabelle e modifiche. Quindi, se si specifica un intervallo di 10 minuti e un ciclo richiede 4 minuti, il tempo effettivo tra una verifica e l'altra delle modifiche sarà di 14 minuti.-
Intervallo estrazione Delta: la frequenza con cui i delta verranno estratti dal sistema. L'intervallo predefinito è 60 secondi.
-
-
Come pianificato: quando questa opzione è selezionata, l'attività dati estrarrà il delta una volta e poi si arresterà. Quindi, continuerà l'esecuzione in base alla pianificazione.
Nota informaticaQuesta opzione è rilevante solo se l'intervallo tra i cicli CDC è di 24 ore o più.Per informazioni sulla pianificazione:
-
Per le attività di trasferimento in un progetto di pipeline di dati, vedere Pianificazione delle attività
-
Ottimizzazione varie
- Dimensione cache istruzioni (numero di istruzioni): Il numero massimo di istruzioni preparate da archiviare sul server per l'esecuzione successiva (quando si applicano modifiche alla destinazione). Il valore predefinito è 50. Il massimo è 200.
-
DELETE e INSERT durante l'aggiornamento di una colonna di chiave primaria: Questa opzione richiede che la registrazione supplementare completa sia attivata nel database di origine.
Evoluzione dello schema
Selezionare come gestire i seguenti tipi di modifiche DDL nello schema. Quando si sono modificate le impostazioni di evoluzione dello schema, è necessario preparare nuovamente l'attività. La tabella seguente descrive quali azioni sono disponibili per le modifiche DDL supportate.
| Modifica DDL | Applica alla destinazione | Ignora | Sospendi tabella | Arresta attività |
|---|---|---|---|---|
| Aggiungi colonna | Sì | Sì | Sì | Sì |
| Rinomina colonna | No | No | Sì | Sì |
| Rinomina tabella | No | No | Sì | Sì |
| Modifica tipo di dati colonna | No | Sì | Sì | Sì |
| Crea tabella
Se è stata utilizzata una Regola di selezione per aggiungere set di dati che corrispondono a un modello, le nuove tabelle che soddisfano il modello verranno rilevate e aggiunte. |
Sì | Sì | No | No |
Sostituzione caratteri
È possibile sostituire o eliminare i caratteri nel database di destinazione e/o sostituire o eliminare i caratteri di origine che non sono supportati da un set di caratteri selezionato.
-
Tutti i caratteri devono essere specificati come punti di codice Unicode.
- La sostituzione dei caratteri verrà eseguita anche nelle Tabelle di controllo.
-
I valori non validi saranno indicati da un triangolo rosso nella parte superiore destra della cella della tabella. Se si posiziona il cursore del mouse sul triangolo, viene visualizzato il messaggio di errore.
-
Qualsiasi trasformazione globale o a livello tabella definita per l'attività verrà eseguita una volta completata la sostituzione del carattere.
-
Le azioni di sostituzione definite nella tabella Sostituisci o elimina caratteri di origine vengono eseguite prima dell'azione di sostituzione definita nella tabella Sostituisci o elimina caratteri di origine non supportati dal set di caratteri selezionato.
- La sostituzione dei caratteri non supporta i tipi di dati LOB.
Sostituzione o eliminazione dei caratteri di origine
Utilizzare la tabella Sostituisci o elimina caratteri di origine per definire le sostituzioni per caratteri di origine specifici. Questa opzione può essere utile, ad esempio, quando la rappresentazione Unicode di un carattere è differente nelle piattaforme di origine e di destinazione. Ad esempio, su Linux, il carattere meno nel set di caratteri Shift_JIS è rappresentato come U+2212, ma su Windows è rappresentato come U+FF0D.
| Per | eseguire questa azione |
|---|---|
|
definire le azioni di sostituzione. |
|
|
Modificare i caratteri di origine o di destinazione specificati |
Fare clic su |
|
Elimina voci dalla tabella |
Fare clic su |
Sostituzione o eliminazione dei caratteri di origine non supportati dal set di caratteri selezionato
Utilizzare la tabella Caratteri di origine non supportati dal set di caratteri per definire un singolo carattere di sostituzione per tutti i caratteri non supportati dal set di caratteri selezionato.
| Per | eseguire questa azione |
|---|---|
|
definire o modificare le azioni di sostituzione. |
|
|
Disabilitare l'azione di sostituzione. |
Selezionare la voce vuota dall'elenco a comparsa Set di caratteri. |
Altre opzioni
Queste opzioni non sono esposte nell'interfaccia utente, dato che sono rilevanti solo per versioni o ambienti specifici. Di conseguenza, non impostare queste opzioni a meno che non sia stato esplicitamente indicato dal Supporto Qlik o dalla documentazione dei prodotti.
Per impostare un'opzione, semplicemente copiarla nel campo Aggiungi nome funzionalità e fare clic su Aggiungi. Quindi, impostare il valore o attivare l'opzione in base alle istruzioni ricevute.
Caricamento di segmenti di set di dati in parallelo
Durante il caricamento completo, è possibile accelerare il caricamento di set di dati di grandi dimensioni suddividendo il set di dati in segmenti, che verranno caricati in parallelo. Le tabelle possono essere suddivise per intervalli di dati, tutte le partizioni, tutte le sottopartizioni o partizioni specifiche.
Per ulteriori informazioni, vedere Trasferimento in parallelo di segmenti del set di dati.
Pianificazione delle attività
Nei seguenti casi d'uso, è necessario definire un intervallo di pianificazione per mantenere aggiornati i dati di destinazione:
- Accesso a una sorgente dati senza Gateway Data Movement
- Utilizzo di un connettore di applicazione SaaS che non supporta l'impostazione Leggi modifiche ogni
- Quando si acquisiscono le modifiche da una sorgente SAP OData utilizzando l'opzione Come pianificato.
La pianificazione determina la frequenza con cui i set di dati di destinazione verranno aggiornati con le modifiche ai set di dati di origine. Mentre la pianificazione determina la frequenza di aggiornamento, il tipo di set di dati determina il metodo di aggiornamento. Se i set di dati di origine supportano CDC (Change Data Capture), solo le modifiche ai dati di origine verranno replicate e applicate alle tabelle di destinazione corrispondenti. Se i set di dati di origine non supportano CDC (ad esempio, Viste), le modifiche verranno applicate ricaricando tutti i dati di origine nelle tabelle di destinazione corrispondenti. Se alcuni dei set di dati di origine supportano CDC e altri no, verranno create due sotto-attività separate: una per ricaricare i set di dati che non supportano CDC e l'altra per acquisire le modifiche ai set di dati che supportano CDC. In questo caso, per garantire la coerenza dei dati, si consiglia vivamente di non mantenere lo stesso intervallo di pianificazione per entrambe le attività (se si decide di modificare la frequenza di aggiornamento in futuro).
Per informazioni sugli intervalli di pianificazione minimi in base al tipo di sorgente dati e i livelli di sottoscrizione, vedere Intervalli di pianificazione minimi consentiti.
Per modificare la pianificazione:
-
Aprire il progetto della pipeline e quindi eseguire una delle seguenti operazioni:
- Nella vista attività, fare clic su
sull'attività dati e selezionare Pianificazione.
- Nella vista pipeline, fare clic su
sull'attività dati e selezionare Pianificazione.
- Aprire l'attività di trasferimento e fare clic sul pulsante della barra degli strumenti Pianificazione .
- Nella vista attività, fare clic su
- Modificare le impostazioni di pianificazione secondo necessità e quindi fare clic su OK.
Esecuzione di un'esecuzione mancata per un'attività basata su Gateway Data Movement
A volte un problema di rete può causare l'interruzione della connessione a Gateway Data Movement. Se la connessione a Gateway Data Movement non viene ripristinata prima dell'esecuzione programmata successiva, l'attività dati non potrà essere eseguita come previsto. In questi casi, è possibile scegliere se completare un'esecuzione immediatamente dopo il ripristino della connessione.
Le impostazioni predefinite per tutti i Gateway Data Movement sono definite nel centro attività Amministrazione. È possibile sovrascrivere queste impostazioni per le singole attività come descritto di seguito.
A tale scopo
-
Aprire il progetto e quindi eseguire una delle seguenti operazioni:
-
Nella vista attività, fare clic su
sull'attività dati e selezionare Pianificazione.
-
Nella vista pipeline, fare clic su
sull'attività dati e selezionare Pianificazione.
-
Aprire l'attività dati e fare clic sul pulsante della barra degli strumenti Pianificazione .
Si apre la finestra di dialogo Pianificazione - <attività>.
-
-
Attivare Usa impostazioni personalizzate per questa attività.
-
Nella parte inferiore della finestra di dialogo, scegliere una delle seguenti opzioni Esegui attività pianificate mancate.
-
Il prima possibile e poi come pianificato se è importante eseguire un'attività prima della successiva istanza pianificata
-
Come pianificato per eseguire l'attività alla successiva istanza pianificata
-
-
Salvare le impostazioni.
Vedere anche: Esecuzione di un'attività dopo una pianificazione mancata.