Replica dei dati con una sottoscrizione Avvio Qlik Talend Cloud
Utilizzando la procedura guidata per la configurazione di un'attività, è possibile impostare facilmente un'attività di replica con pochi clic.
Le impostazioni mostrate nella procedura guidata riflettono il tipo di destinazione selezionato. Per esempio, quando si effettua la replica su destinazioni di archiviazione come Amazon S3, verrà richiesto di inserire una posizione di archiviazione. Tuttavia, quando si effettua la replica su destinazioni come Amazon Redshift che richiedono un'area di staging, verrà richiesto di definire un'area di staging.
La seguente tabella può aiutare a sfogliare l'argomento in base alla destinazione prevista.
Effettuare la replica su database e data warehouse senza lo staging
Impostare un'attività di replica su database o data warehouse che non richiedono lo staging, elencati di seguito:
- Google BigQuery
- Snowflake
Effettuare la replica su data warehouse con lo staging
Impostare un'attività di replica su data warehouse, elencati di seguito:
- Amazon Redshift
- Microsoft Fabric
- Databricks
Replica su un'archiviazione cloud
Impostazione di un'attività di replica su un'archiviazione cloud.
Effettuare la replica su database e data warehouse senza lo staging
In questa sezione si spiega come impostare un'attività di replica su database e data warehouse che non richiedono un'area di staging separata.
Operazione da eseguire:
-
In Integrazione dati > Home, fare clic su Replica dati.
Si apre la procedura guidata di Replica dati.
-
Nella scheda Generali procedere come descritto di seguito:
-
Nome attività
Specificare un nome per l'attività.
-
Descrizione
Facoltativamente, immettere una descrizione dell'attività.
-
Progetto
Effettuare una delle seguenti operazioni:
- Selezionare un progetto esistente.
-
Specificare un nome per un nuovo progetto, quindi fare clic su Aggiungi nuovo progetto: <nome-del-progetto> sotto il campo Progetto.
Il nome del progetto verrà aggiunto al campo Progetto.
-
Spazio
Selezionare uno spazio dati per il progetto di replica. Se non è stato creato alcuno spazio dati, effettuare una delle seguenti operazioni:
-
Selezionare Dati-Spazio (il nome dello spazio dati del tenant predefinito)
Nota informaticaDati-Spazio dispone di autorizzazioni complete per tutti i membri. È possibile modificare i ruoli e le autorizzazioni per ogni membro in un secondo momento, come descritto in Ruoli e autorizzazioni dello spazio dati. -
Chiudere la procedura guidata, creare uno spazio dati personale come descritto in Creazione di uno spazio dati, quindi eseguire nuovamente la procedura guidata.
Per ulteriori informazioni sugli spazi dati, vedere Uso degli spazi in Qlik Talend Data Integration.
-
-
-
Fare clic su Avanti. Nella scheda Seleziona una connessione di origine, selezionare una connessione ai dati di origine. Facoltativamente, è possibile modificare le impostazioni della connessione selezionando Modifica dal menu nella colonna Azioni.
Se non si è ancora creata una connessione alla sorgente dati, è necessario crearne una facendo clic su Crea connessione nella parte superiore destra della scheda.
È possibile filtrare l'elenco di connessioni utilizzando i filtri a sinistra. Le connessioni possono essere filtrate in base a tipo di origine, gateway, spazio e proprietario. Il pulsante Tutti i filtri sopra l'elenco delle connessioni mostra il numero di filtri attuali. È possibile utilizzare questo pulsante per chiudere o aprire il pannello Filtri a sinistra. I filtri attualmente attivi sono anche visualizzati sopra l'elenco delle connessioni disponibili.
È possibile inoltre ordinare l'elenco selezionando Ultima modifica, Ultimi creati o Alfabetico dall'elenco a comparsa a destra. Fare clic sulla freccia a destra dell'elenco per modificare l'ordine di ordinamento.
Dopo aver selezionato una connessione per la sorgente dati, facoltativamente, fare clic su Prova connessione nella parte superiore destra della scheda (procedura consigliata), quindi fare clic su Avanti.
-
Nella scheda Seleziona set di dati, selezionare le tabelle e/o le viste da includere nell'attività di replica. È possibile anche utilizzare i caratteri jolly e creare regole di selezione, come descritto nella sezione Selezione di dati da un database.
-
Nella scheda Seleziona connessione di destinazione, selezionare la destinazione dall'elenco delle connessioni disponibili, quindi fare clic su Avanti. In termini di funzionalità, questa scheda è uguale alla scheda Seleziona connessione di origine descritta sopra.
-
Nella scheda Impostazioni, modificare facoltativamente le seguenti impostazioni e fare clic su Avanti.
Modalità di replica
Nota informaticaquando di effettua la replica da sorgenti di applicazioni SaaS, la modalità di replica Caricamento completo è abilitata per impostazione predefinita e non è possibile disabilitarla.- Caricamento completo: carica i dati dalle tabelle di origine selezionate sulla piattaforma di destinazione e, se necessario, crea le tabelle di destinazione. Il caricamento completo viene eseguito automaticamente all'avvio dell'attività, ma può anche essere eseguito manualmente in caso di necessità.
-
Applica le modifiche: mantiene le tabelle di destinazione aggiornate riportando qualsiasi modifica apportata alle tabelle di origine.
-
Archivia modifiche: archivia le modifiche alle tabelle di origine nelle Tabelle di modifica (una per ogni tabella di origine).
Per ulteriori informazioni, vedere Archivia modifiche.
La frequenza di acquisizione dei dati di modifica è determinata dalle impostazioni dell'utilità di pianificazione. L'intervallo di acquisizione delle modifiche predefinito è ogni sei ore. Per ulteriori informazioni, vedere Pianificazione di attività quando non si utilizza il Gateway di Data Movement.
Schemi personalizzati
- Schema del set di dati di destinazione: facoltativamente, selezionare lo schema che si desidera utilizzare per creare i set di dati nella destinazione.
- Schema tabella di controllo: facoltativamente, selezionare lo schema che si desidera utilizzare per creare le tabelle di controllo nella destinazione.
Pianificazione replica
-
Replica dati ogni: è possibile pianificare la frequenza con cui acquisire le modifiche dalla sorgente dati e impostare Ora di inizio e Data di inizio. Se i set di dati di origine supportano il CDC (Change data capture), solo le modifiche ai dati di origine verranno replicate e applicate alle tabelle di destinazione corrispondenti. Se i set di dati di origine non supportano il CDC (ad esempio, le viste), le modifiche verranno applicate ricaricando tutti i dati di origine nelle tabelle di destinazione corrispondenti. Se alcuni dei set di dati di origine supportano il CDC e altri no, verranno create due sottoattività separate (supponendo che il metodo di aggiornamento Applica modifiche o che le opzioni di replica Memorizza modifiche siano selezionate): una per ricaricare i set di dati che non supportano il CDC e l'altra per acquisire le modifiche ai set di dati che supportano il CDC.
L'installazione guidata per l'attività consente di pianificare un intervallo orario. Una volta completata l'installazione guidata per l'attività, è possibile valutare differenti opzioni di pianificazione, come descritto in Pianificazione di attività quando non si utilizza il Gateway di Data Movement.
Per informazioni sugli intervalli di pianificazione minimi in base al tipo di sorgente dati e i livelli di sottoscrizione, vedere Intervalli di pianificazione minimi consentiti.
È possibile modificare le impostazioni in un secondo momento, come descritto in Impostazioni attività replica dati.
-
Nella scheda Riepilogo, viene visualizzata una pipeline di dati visiva. Scegliere una delle seguenti azioni per Dopo che la pipeline è stata creata:
- Aprire il progetto <nome> (opzione predefinita)
-
Aprire l'attività dati <nome>
Nota informaticaSe alcuni dei set di dati selezionati non supportano il processo CDC, verranno visualizzate due pipeline: una per l'attività CDC e un'altra per l'attività di ricaricamento.
Quindi fare clic su Crea ed esegui (opzione predefinita) o su Crea per creare l'attività senza eseguirla.
Se si fa clic su Crea ed esegui, l'attività verrà creata e inizierà a essere eseguita (quest'ultima operazione può richiedere qualche istante).
-
Se si fa clic su Crea, si verificherà una delle seguenti azioni, in base all'opzione selezionata per Dopo che la pipeline è stata creata:
- Il progetto si aprirà e mostrerà l'attività appena creata.
-
L'attività si aprirà visualizzando la scheda Set di dati. La scheda Set di dati mostrerà la struttura e i metadati delle tabelle di origine selezionate. Sono incluse tutte le tabelle elencate in modo esplicito, oltre a quelle che corrispondono alle regole di selezione.
Se si desidera aggiungere più tabelle dalla sorgente dati, fare clic su Seleziona sorgente dati.
-
È possibile eseguire trasformazioni sui set di dati, filtrare i dati o aggiungere colonne.
Per ulteriori informazioni, vedere Gestione dei data mart.
-
Dopo aver aggiunto le trasformazioni desiderate, è possibile convalidare le serie di dati facendo clic su Convalida serie di dati. Se la convalida rileva errori, correggere gli errori prima di procedere.
Per ulteriori informazioni, vedere Convalida e regolazione dei set di dati.
-
Quando si è pronti, fare clic su Prepara ed esegui per preparare ed eseguire l'attività dati.
Per informazioni sul recupero delle attività e altri metodi di esecuzione delle attività, vedere Opzioni di esecuzione avanzate.
-
Ora la replica dovrebbe iniziare ed è possibile vedere l'avanzamento in Monitoraggio. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale
Effettuare la replica su data warehouse con lo staging
In questa sezione si spiega come impostare un'attività di replica su data warehouse che richiedono un'area di staging separata.
Operazione da eseguire:
-
In Integrazione dati> Home, fare clic su Replica dati.
Si apre la procedura guidata di Replica dati.
-
Nella scheda Generali procedere come descritto di seguito:
-
Nome attività
Specificare un nome per l'attività.
-
Descrizione
Facoltativamente, immettere una descrizione dell'attività.
-
Progetto
Effettuare una delle seguenti operazioni:
- Selezionare un progetto esistente.
-
Specificare un nome per un nuovo progetto, quindi fare clic su Aggiungi nuovo progetto: <nome-del-progetto> sotto il campo Progetto.
Il nome del progetto verrà aggiunto al campo Progetto.
-
Spazio
Selezionare uno spazio dati per il progetto di replica. Se non è stato creato alcuno spazio dati, effettuare una delle seguenti operazioni:
-
Selezionare Dati-Spazio (il nome dello spazio dati del tenant predefinito)
Nota informaticaDati-Spazio dispone di autorizzazioni complete per tutti i membri. È possibile modificare i ruoli e le autorizzazioni per ogni membro in un secondo momento, come descritto in Ruoli e autorizzazioni dello spazio dati. -
Chiudere la procedura guidata, creare uno spazio dati personale come descritto in Creazione di uno spazio dati ed eseguire nuovamente la procedura guidata.
Per ulteriori informazioni sugli spazi dati, vedere Uso degli spazi in Qlik Talend Data Integration.
-
-
-
Fare clic su Avanti. Nella scheda Seleziona una connessione di origine, selezionare una connessione ai dati di origine. Facoltativamente, è possibile modificare le impostazioni della connessione selezionando Modifica dal menu nella colonna Azioni.
Se non si è ancora creata una connessione alla sorgente dati, è necessario crearne una facendo clic su Crea connessione nella parte superiore destra della scheda.
È possibile filtrare l'elenco di connessioni utilizzando i filtri a sinistra. Le connessioni possono essere filtrate in base a tipo di origine, gateway, spazio e proprietario. Il pulsante Tutti i filtri sopra l'elenco delle connessioni mostra il numero di filtri attuali. È possibile utilizzare questo pulsante per chiudere o aprire il pannello Filtri a sinistra. I filtri attualmente attivi sono anche visualizzati sopra l'elenco delle connessioni disponibili.
È possibile inoltre ordinare l'elenco selezionando Ultima modifica, Ultimi creati o Alfabetico dall'elenco a comparsa a destra. Fare clic sulla freccia a destra dell'elenco per modificare l'ordine di ordinamento.
Dopo aver selezionato una connessione per la sorgente dati, facoltativamente, fare clic su Prova connessione nella parte superiore destra della scheda (procedura consigliata), quindi fare clic su Avanti.
-
Nella scheda Seleziona set di dati, selezionare le tabelle e/o le viste da includere nell'attività di replica. È possibile anche utilizzare i caratteri jolly e creare regole di selezione, come descritto nella sezione Selezione di dati da un database.
-
Nella scheda Seleziona connessione di destinazione, selezionare la destinazione dall'elenco delle connessioni disponibili, quindi fare clic su Avanti. In termini di funzionalità, questa scheda è uguale alla scheda Seleziona connessione di origine descritta sopra.
-
Nella scheda Impostazioni, modificare facoltativamente le seguenti impostazioni e fare clic su Avanti.
Modalità di replica
Nota informaticaquando di effettua la replica da sorgenti di applicazioni SaaS, la modalità di replica Caricamento completo è abilitata per impostazione predefinita e non è possibile disabilitarla.- Caricamento completo: carica i dati dalle tabelle di origine selezionate sulla piattaforma di destinazione e, se necessario, crea le tabelle di destinazione. Il caricamento completo viene eseguito automaticamente all'avvio dell'attività, ma può anche essere eseguito manualmente in caso di necessità.
-
Applica le modifiche: mantiene le tabelle di destinazione aggiornate riportando qualsiasi modifica apportata alle tabelle di origine.
-
Archivia modifiche: archivia le modifiche alle tabelle di origine nelle Tabelle di modifica (una per ogni tabella di origine).
Per ulteriori informazioni, vedere Archivia modifiche.
La frequenza di acquisizione dei dati di modifica è determinata dalle impostazioni dell'utilità di pianificazione. L'intervallo di acquisizione delle modifiche predefinito è ogni sei ore. Per ulteriori informazioni, vedere Pianificazione di attività quando non si utilizza il Gateway di Data Movement.
Connessione all'area di staging
Quando si effettua la replica nei data warehouse elencati di seguito, è necessario impostare un'area di staging. I dati vengono elaborati e preparati nell'area di staging prima di essere trasferiti nel warehouse.
Selezionare un'area di staging o fare clic su Crea nuovo per definire una nuova area di staging, quindi seguire le istruzioni nella sezione Connessione a un'archiviazione cloud.
Per modificare le impostazioni della connessione, fare clic su Modifica. Per testare la connessione (procedura consigliata), fare clic su Prova connessione.
Per informazioni su quali aree di staging sono supportate con determinati data warehouse, vedere la colonna Supportata come area di staging inCasi d'uso della piattaforma di destinazione e versioni supportate.
Schemi personalizzati
- Schema del set di dati di destinazione: facoltativamente, selezionare lo schema che si desidera utilizzare per creare i set di dati nella destinazione.
- Schema tabella di controllo: facoltativamente, selezionare lo schema che si desidera utilizzare per creare le tabelle di controllo nella destinazione.
Pianificazione replica
-
Replica dati ogni: è possibile pianificare la frequenza con cui acquisire le modifiche dalla sorgente dati e impostare Ora di inizio e Data di inizio. Se i set di dati di origine supportano il CDC (Change data capture), solo le modifiche ai dati di origine verranno replicate e applicate alle tabelle di destinazione corrispondenti. Se i set di dati di origine non supportano il CDC (ad esempio, le viste), le modifiche verranno applicate ricaricando tutti i dati di origine nelle tabelle di destinazione corrispondenti. Se alcuni dei set di dati di origine supportano il CDC e altri no, verranno create due sottoattività separate (supponendo che il metodo di aggiornamento Applica modifiche o che le opzioni di replica Memorizza modifiche siano selezionate): una per ricaricare i set di dati che non supportano il CDC e l'altra per acquisire le modifiche ai set di dati che supportano il CDC.
L'installazione guidata per l'attività consente di pianificare un intervallo orario. Una volta completata l'installazione guidata per l'attività, è possibile valutare differenti opzioni di pianificazione, come descritto in Pianificazione di attività quando non si utilizza il Gateway di Data Movement.
È possibile modificare le impostazioni in un secondo momento, come descritto in Impostazioni attività replica dati.
-
Nella scheda Riepilogo, viene visualizzata una pipeline di dati visiva. Scegliere una delle seguenti azioni per Dopo che la pipeline è stata creata:
- Aprire il progetto <nome> (opzione predefinita)
-
Aprire l'attività dati <nome>
Nota informaticaSe alcuni dei set di dati selezionati non supportano il processo CDC, verranno visualizzate due pipeline: una per l'attività CDC e un'altra per l'attività di ricaricamento.
Quindi fare clic su Crea ed esegui (opzione predefinita) o su Crea per creare l'attività senza eseguirla.
Se si fa clic su Crea ed esegui, l'attività verrà creata e inizierà a essere eseguita (quest'ultima operazione può richiedere qualche istante).
-
Se si fa clic su Crea, si verificherà una delle seguenti azioni, in base all'opzione selezionata per Dopo che la pipeline è stata creata:
- Il progetto si aprirà e mostrerà l'attività appena creata.
-
L'attività si aprirà visualizzando la scheda Set di dati. La scheda Set di dati mostrerà la struttura e i metadati delle tabelle di origine selezionate. Sono incluse tutte le tabelle elencate in modo esplicito, oltre a quelle che corrispondono alle regole di selezione.
Se si desidera aggiungere più tabelle dalla sorgente dati, fare clic su Seleziona sorgente dati.
-
È possibile eseguire trasformazioni sui set di dati, filtrare i dati o aggiungere colonne.
Per ulteriori informazioni, vedere Gestione dei data mart.
-
Dopo aver aggiunto le trasformazioni desiderate, è possibile convalidare le serie di dati facendo clic su Convalida serie di dati. Se la convalida rileva errori, correggere gli errori prima di procedere.
Per ulteriori informazioni, vedere Convalida e regolazione dei set di dati.
-
Quando si è pronti, fare clic su Prepara ed esegui per preparare ed eseguire l'attività dati.
Per informazioni sul recupero delle attività e altri metodi di esecuzione delle attività, vedere Opzioni di esecuzione avanzate.
-
Ora la replica dovrebbe iniziare ed è possibile vedere l'avanzamento in Monitoraggio. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale
Replica su un'archiviazione cloud
In questa sezione si spiega come impostare un'attività di replica su un'archiviazione cloud.
Operazione da eseguire:
-
In Integrazione dati> Home, fare clic su Replica dati.
Si apre la procedura guidata di Replica dati.
-
Nella scheda Generali procedere come descritto di seguito:
-
Nome attività
Specificare un nome per l'attività.
-
Descrizione
Facoltativamente, immettere una descrizione dell'attività.
-
Progetto
Effettuare una delle seguenti operazioni:
- Selezionare un progetto esistente.
-
Specificare un nome per un nuovo progetto, quindi fare clic su Aggiungi nuovo progetto: <nome-del-progetto> sotto il campo Progetto.
Il nome del progetto verrà aggiunto al campo Progetto.
-
Spazio
Selezionare uno spazio dati per il progetto di replica. Se non è stato creato alcuno spazio dati, effettuare una delle seguenti operazioni:
-
Selezionare Dati-Spazio (il nome dello spazio dati del tenant predefinito)
Nota informaticaDati-Spazio dispone di autorizzazioni complete per tutti i membri. È possibile modificare i ruoli e le autorizzazioni per ogni membro in un secondo momento, come descritto in Ruoli e autorizzazioni dello spazio dati. -
Chiudere la procedura guidata, creare uno spazio dati personale come descritto in Creazione di uno spazio dati ed eseguire nuovamente la procedura guidata.
Per ulteriori informazioni sugli spazi dati, vedere Uso degli spazi in Qlik Talend Data Integration.
-
-
-
Fare clic su Avanti. Nella scheda Seleziona una connessione di origine, selezionare una connessione ai dati di origine. Facoltativamente, è possibile modificare le impostazioni della connessione selezionando Modifica dal menu nella colonna Azioni.
Se non si è ancora creata una connessione alla sorgente dati, è necessario crearne una facendo clic su Crea connessione nella parte superiore destra della scheda.
È possibile filtrare l'elenco di connessioni utilizzando i filtri a sinistra. Le connessioni possono essere filtrate in base a tipo di origine, gateway, spazio e proprietario. Il pulsante Tutti i filtri sopra l'elenco delle connessioni mostra il numero di filtri attuali. È possibile utilizzare questo pulsante per chiudere o aprire il pannello Filtri a sinistra. I filtri attualmente attivi sono anche visualizzati sopra l'elenco delle connessioni disponibili.
È possibile inoltre ordinare l'elenco selezionando Ultima modifica, Ultimi creati o Alfabetico dall'elenco a comparsa a destra. Fare clic sulla freccia a destra dell'elenco per modificare l'ordine di ordinamento.
Dopo aver selezionato una connessione per la sorgente dati, facoltativamente, fare clic su Prova connessione nella parte superiore destra della scheda (procedura consigliata), quindi fare clic su Avanti.
-
Nella scheda Seleziona set di dati, selezionare le tabelle e/o le viste da includere nell'attività di replica. È possibile anche utilizzare i caratteri jolly e creare regole di selezione, come descritto nella sezione Selezione di dati da un database.
-
Nella scheda Seleziona connessione di destinazione, selezionare la destinazione dall'elenco delle connessioni disponibili, quindi fare clic su Avanti. In termini di funzionalità, questa scheda è uguale alla scheda Seleziona connessione di origine descritta sopra.
-
Nella scheda Impostazioni, modificare facoltativamente le seguenti impostazioni e fare clic su Avanti.
Metodo di aggiornamento
-
Change Data Capture (CDC): Le attività di trasferimento del data lake iniziano con un ricaricamento completo (durante il quale tutte le tabelle selezionate vengono trasferite). i dati trasferiti vengono quindi mantenuti aggiornati usando la tecnologia CDC (Change Data Capture).
Nota informaticaL'acquisizione dati di modifica (CDC) per le operazioni DDL non è supportata.La frequenza di acquisizione dei dati di modifica è determinata dalle impostazioni dell'utilità di pianificazione. L'intervallo di acquisizione delle modifiche predefinito è ogni sei ore. Per ulteriori informazioni, vedere Pianificazione di attività quando non si utilizza il Gateway di Data Movement.
- Ricarica: esegue un caricamento completo dei dati dalle tabelle di origine selezionate sulla piattaforma di destinazione e, se necessario, crea le tabelle di destinazione. Il caricamento completo viene eseguito automaticamente all'avvio dell'attività, ma può anche essere eseguito o pianificato in modo che venga eseguito regolarmente, in base alle necessità.
Se si seleziona Change data capture (CDC) e i dati contengono anche tabelle che non supportano la funzione CDC o le visualizzazioni, verranno create due pipeline di dati. Una pipeline con tutte le tabelle che supportano la funzione CDC, e un'altra pipeline con tutte le altre tabelle e visualizzazioni che utilizzano Ricarica.
Cartella da utilizzare
Selezionare una delle seguenti opzioni, a seconda della cartella del bucket in cui si desidera che vengano scritti i file:
- Cartella predefinita: il formato della cartella predefinita è <nome-progetto-utente>/<nome-attività-utente>
- Cartella radice: i file verranno scritti direttamente nel bucket.
-
Cartella: inserire il nome della cartella. La cartella verrà creata durante l'attività di trasferimento del data lake se non esiste.
Nota informatica Il nome della cartella non può includere caratteri speciali (ad esempio, @, #, !, e così via).
Pianificazione replica
-
Replica dati ogni: è possibile pianificare la frequenza con cui acquisire le modifiche dalla sorgente dati e impostare Ora di inizio e Data di inizio. Se i set di dati di origine supportano il CDC (Change data capture), solo le modifiche ai dati di origine verranno replicate e applicate alle tabelle di destinazione corrispondenti. Se i set di dati di origine non supportano il CDC (ad esempio, le viste), le modifiche verranno applicate ricaricando tutti i dati di origine nelle tabelle di destinazione corrispondenti. Se alcuni dei set di dati di origine supportano il CDC e altri no, verranno create due sottoattività separate (supponendo che il metodo di aggiornamento Change data capture (CDC) sia selezionate): una per ricaricare i set di dati che non supportano il CDC e l'altra per acquisire le modifiche ai set di dati che supportano il CDC.
L'installazione guidata per l'attività consente di pianificare un intervallo orario. Una volta completata l'installazione guidata per l'attività, è possibile valutare differenti opzioni di pianificazione, come descritto in Pianificazione di attività quando non si utilizza il Gateway di Data Movement.
È possibile modificare le impostazioni dell'attività in un secondo momento, come descritto in Impostazioni per le destinazioni di archiviazione cloud.
-
-
Nella scheda Riepilogo, viene visualizzata una pipeline di dati visiva. Scegliere una delle seguenti azioni per Dopo che la pipeline è stata creata:
- Aprire il progetto <nome> (opzione predefinita)
-
Aprire l'attività dati <nome>
Nota informaticaSe alcuni dei set di dati selezionati non supportano il processo CDC, verranno visualizzate due pipeline: una per l'attività CDC e un'altra per l'attività di ricaricamento.
Quindi fare clic su Crea ed esegui (opzione predefinita) o su Crea per creare l'attività senza eseguirla.
Se si fa clic su Crea ed esegui, l'attività verrà creata e inizierà a essere eseguita (quest'ultima operazione può richiedere qualche istante).
-
Se si fa clic su Crea, si verificherà una delle seguenti azioni, in base all'opzione selezionata per Dopo che la pipeline è stata creata:
- Il progetto si aprirà e mostrerà l'attività appena creata.
-
L'attività si aprirà visualizzando la scheda Set di dati. La scheda Set di dati mostrerà la struttura e i metadati delle tabelle di origine selezionate. Sono incluse tutte le tabelle elencate in modo esplicito, oltre a quelle che corrispondono alle regole di selezione.
Se si desidera aggiungere più tabelle dalla sorgente dati, fare clic su Seleziona sorgente dati.
-
È possibile eseguire trasformazioni sui set di dati, filtrare i dati o aggiungere colonne.
Per ulteriori informazioni, vedere Gestione dei data mart.
-
Dopo aver aggiunto le trasformazioni desiderate, è possibile convalidare le serie di dati facendo clic su Convalida serie di dati. Se la convalida rileva errori, correggere gli errori prima di procedere.
Per ulteriori informazioni, vedere Convalida e regolazione dei set di dati.
-
Quando si è pronti, fare clic su Prepara ed esegui per preparare ed eseguire l'attività dati.
Per informazioni sul recupero delle attività e altri metodi di esecuzione delle attività, vedere Opzioni di esecuzione avanzate.
-
Ora la replica dovrebbe iniziare ed è possibile vedere l'avanzamento in Monitoraggio. Per ulteriori informazioni, vedere Monitoraggio di un'attività dati individuale
Impostazione della priorità di caricamento per i set di dati
È possibile controllare l'ordine di caricamento dei set di dati nelle attività dati assegnando una priorità di caricamento per ogni set di dati. Questa opzione può essere utile, per esempio, se si desidera caricare set di dati più piccoli prima di quelli grandi.
-
Fare clic su Priorità di caricamento.
-
Selezionare una priorità di caricamento per ogni set di dati.
La priorità di caricamento predefinita è Normale. I set di dati verranno caricati nel seguente ordine di priorità:
-
Massima
-
Più alta
-
Alta
-
Normale
-
Bassa
-
Più bassa
-
Minima
I set di dati con la stessa priorità vengono caricati senza seguire un ordine particolare.
-
-
Fare clic su OK.
Aggiornamento metadati
È possibile aggiornare i metadati nell'attività per allinearli con le modifiche nei metadati nella sorgente nella vista Progettazione dell'attività. Per le applicazioni SaaS che utilizzano Metadata Manager, quest'ultimo deve essere aggiornato prima di poter aggiornare i metadati nell'attività dati.
-
È possibile eseguire le seguenti azioni:
-
Fare clic su ..., quindi su Aggiorna metadati per aggiornare i metadati per tutti i set di dati nell'attività.
-
Fare clic su ... su un set di dati in Set di dati, quindi su Aggiorna metadati per aggiornare i metadati per un singolo set di dati.
È possibile visualizzare lo stato del processo di aggiornamento dei metadati in Aggiorna metadati nella parte inferiore dello schermo. È possibile visualizzare la data dell'ultimo aggiornamento dei metadati posizionando il cursore su .
-
-
Preparare l'attività dati per applicare le modifiche.
Una volta preparata l'attività dati e applicate le modifiche, queste vengono rimosse da Aggiorna metadati.
Devi preparare attività di archiviazione che utilizzano questa attività per propagare le modifiche.
Se una colonna viene rimossa, viene aggiunta una trasformazione con valori Null per assicurare che l'archiviazione non perda i dati cronologici.
Limiti
-
Se si esegue un'operazione di ridenominazione con una colonna rimossa anteriormente, nello stesso intervallo di tempo, questa verrà tradotta nella ridenominazione della colonna rimossa se hanno lo stesso tipo e la stessa lunghezza dati.
Esempio:
Prima: a b c d
Dopo: a c1 d
In questo esempio, b è stato rimosso e c è stato rinominato c1, mentre b e c hanno lo stesso tipo di dati e la stessa lunghezza dati.
L'operazione verrà identificata come ridenominazione di b in c1 e rimozione di c.
-
La ridenominazione dell'ultima colonna non viene riconosciuta, anche se questa è stata rimossa e quella prima di essa è stata rinominata.
Esempio:
Prima: a b c d
Dopo: a b c1
In questo esempio, d è stato rimosso e c è stato rinominato c1.
Questa operazione verrà identificata come rimozione di c e d e l'aggiunta di c1.
-
Le nuove colonne dovrebbero essere aggiunte alla fine. Se le colonne vengono aggiunte a metà con lo stesso tipo di dati della colonna successiva, possono essere interpretate come una rimozione e una ridenominazione.
Limiti e considerazioni per la replica dei dati
Le trasformazioni sono soggette alle seguenti limitazioni:
- Le trasformazioni non sono supportate per le colonne con lingue da destra a sinistra.
-
Le trasformazioni non possono essere eseguite sulle colonne che contengono caratteri speciali (ad esempio #, \, /, -) nel nome.
- L'unica trasformazione supportata per i tipi di dati LOB/CLOB è il rilascio della colonna nella destinazione.
- L'utilizzo di una trasformazione per rinominare una colonna e quindi aggiungere una nuova colonna con lo stesso nome non è supportato.
La modifica del supporto dei valori null non è supportata per le colonne che vengono spostate, sia modificandole direttamente che utilizzando una regola di trasformazione. Tuttavia, le nuove colonne create nell'attività ammettono i valori null per impostazione predefinita.