Replikera data med en Standard-, Premium- eller Enterprise-prenumeration
För att ställa in en replikeringsuppgift:
-
I Dataintegrering > Projekt klickar du på Skapa projekt.
-
Gör följande i dialogrutan Nytt projekt:
- Ange ett Namn för ditt projekt.
- Välj det Utrymme där du vill att projektet ska skapas.
- Du kan även lägga till en beskrivning.
- Välj Replikering som Användningsfall.
- Om du vill kan du avmarkera kryssrutan Öppet om du vill skapa ett tomt projekt utan att konfigurera några inställningar.
-
Klicka på Skapa.
Något av följande sker:
- Om kryssrutan Öppna i dialogrutan Nytt projekt valdes (förvalt) kommer projektet att öppnas.
- Om du avmarkerade kryssrutan Öppna i dialogrutan Nytt projekt kommer projektet att läggas till i din lista med projekt. Du kan öppna projektet senare genom att välja Öppna från projektets -meny.
-
När projektet har öppnats klickar du på Replikera data.
Guiden Replikera data öppnas.
-
I fliken Allmänt anger du ett namn och en beskrivning för replikeringsuppgiften. Klicka sedan på Nästa.
-
I fliken Välj källkoppling väljer du en koppling till källdata. Du kan också vid behov redigera kopplingsinställningarna genom att välja Redigera från menyn i kolumnen Åtgärder.
Om du inte har skapat en dataanslutning till din datakälla ännu behöver du skapa en genom att klicka på Skapa koppling längst upp till höger på fliken
Du kan filtrera listan med kopplingar med hjälp av filtren till vänster. Kopplingar kan flitreras efter källtyp, gateway, utrymme och ägare. Knappen Alla filter ovanför Du kan använda den här knappen för att stänga eller öppna panelen Filter till vänster. De aktiva filtren visas också ovanför listan med tillgängliga kopplingar.
Du kan också sortera listan genom att välja Ändrades senast, Skapades senast eller Alfabetiskt från listrutan till höger. Klicka på pilen till höger om listan för att ändra sorteringsordningen.
När du har valt en datakällkoppling kan du klicka på Testa koppling högst upp till höger på fliken (valfritt men rekommenderas) och sedan klicka på Nästa.
-
I fliken Välj datauppsättningar väljer du tabeller och/eller vyer som ska inkluderas i replikeringsuppgiften. Du kan också använda jokertecken och skapa urvalsregler enligt beskrivningen i Välja data från en databas.
-
I fliken Välj målkoppling väljer du målet från listan över tillgängliga kopplingar och klickar sedan på Nästa. Avseende funktioner är fliken identisk med fliken Välj källkoppling som beskrivs tidigare.
-
I fliken Inställningar kan du ändra följande inställningar (valfritt) och sedan klicka på Nästa.
Replikeringsläge
Anteckning om informationVid replikering från SaaS-programkällor aktiveras replikeringsläget Fullständig laddning som standard. Detta kan inte inaktiveras.- Fullständig laddning Laddar data från de valda källtabellerna till målplattformen och skapar måltabellerna vid behov. Den fullständiga laddningen sker automatiskt när uppgiften startar, men kan också utföras manuellt vid behov.
-
Tillämpa ändringar: Håller måltabellerna uppdaterade med de ändringar som görs i källtabellerna.
-
Lagra ändringar: Lagrar ändringarna i källtabellerna i Change Tables (en per källtabell).
Se Lagra ändringar för mer information.
När du arbetar med Gateway för dataflytt registreras ändringar från källan i nära realtid. När du arbetar utan Gateway för dataflytt (genom att konfigurera Data gateway som Ingai kopplingens inställningar) registreras ändringar enligt schemaläggarens inställningar. Standardintervallet för registrering av ändringar är var sjätte timme. Se Schemalägga uppgifter när du arbetar utan Gateway för dataflytt för mer information.
Tillämpa ändringar-läge
Anteckning om informationVid replikering till datalagermål kan du inte välja vilket Tillämpa ändringar-läge som ska användas. Ändringar kommer alltid att tillämpas i Batchoptimerat läge för maximal effektivitet.Ändringar tillämpas i måltabellerna med en av följande metoder:
- Batchoptimerad: detta är standardvärdet. När det här alternativet väljs tillämpas ändringar i batcher. En förbearbetningsåtgärd inträffar för att gruppera transaktionerna i batcher på det mest effektiva sättet.
- Transaktionell: Välj det här alternativet för att tillämpa varje transaktion individuellt i den ordning den allokeras. I det här fallet är strikt referentiell integritet säkerställd för alla tabeller.
Koppling till mellanlagringsområde
När replikering görs till de datalager som anges nedan behöver du konfigurera ett mellanlagringsområde. Data bearbetas och förbereds i mellanlagringsområdet innan det överförs till lagret.
Välj antingen ett befintligt mellanlagringsområde eller klicka på Skapa ny för att definiera ett nytt mellanlagringsområdet och följ instruktionerna i Ansluta till molnlagring.
Klicka på Redigera för att redigera kopplingsinställningarna. Klicka på Testa koppling för att testa kopplingen (rekommenderas).
Information om vilka mellanlagringsområden som stöds med vilka datalager finns i kolumnen Stöds som ett mellanlagringsområde i Användningsfall och versioner som stöds på målplattformen.
Schemaläggare för replikering
Anteckning om informationDenna inställning är endast relevant vid åtkomst till datakällor utan Gateway för dataflytt. Information om fördelarna med Gateway för dataflytt och användningsfall som kräver det finns i Qlik Data Gateway – dataflytt.-
Replikera data varje: Du kan schemalägga hur ofta ändringar ska hämtas från datakällan och ange en starttid och ett startdatum. Om källdatauppsättningarna stöder CDC (Change Data Capture) kommer endast ändringarna i källdata att replikeras och tillämpas på motsvarande måltabeller. Om källdatauppsättningarna inte har stöd för CDC (till exempel Vyer) kommer ändringar att tillämpas genom att ladda alla källdata till motsvarande måltabeller. Tillämpa ändringar eller att replikeringsalternativet Lagra ändringar har valts): en för att ladda om de datauppsättningar som inte stöder CDC, och den andra för att fånga ändringarna till datauppsättningar som stöder CDC.
Med hjälp av guiden för uppgiftsinställning kan du schemalägga ett grundläggande timintervall. När du är klar med att konfigurera uppgiften kan du utforska olika schemaläggningsalternativ, enligt beskrivningen i Schemalägga uppgifter när du arbetar utan Gateway för dataflytt.
Information om minsta schemaläggningsintervall beroende på typ av datakälla och prenumerationsnivå finns i Minsta tillåtna schemaläggningsintervall.
-
I fliken Sammanfattning visas en datapipeline. Om några av de valda datauppsättningarna inte stöder CDC visas två pipelines: en för CDC-uppgiften och en för återladdningsuppgiften. Välj om du vill Öppna datauppgiften <namn> eller Gör ingenting och klicka sedan på Skapa.
Beroende på vad du väljer kommer antingen uppgiften att öppnas eller en lista med projekt att visas.
-
Om du väljer att öppna uppgiften kommer fliken Datauppsättningar att visa struktur och metadata för de valda källtabellerna. Här ingår alla tabeller som är uttryckligt listade samt tabeller som matchar urvalsreglerna.
Klicka på Välj källdata om du vill lägga till fler tabeller från datakällan.
-
Ändra inställningen för uppgiften enligt beskrivningen i Inställningar för datareplikeringsuppgifter (valfritt).
-
Du kan utföra transformeringar på datauppsättningarna, filtrera data eller lägga till kolumner.
Se Hantera datauppsättningar för mer information.
-
När du har lagt till de omvandlingar du vill ha kan du validera datauppsättningarna genom att klicka på Validate datasets. Om valideringen misslyckas åtgärdar du felen innan du fortsätter.
Se Validera och justera datauppsättningarna för mer information.
-
När du är klar klickar du på Förbered för att katalogisera dataarbetsuppgiften och förbereda den för körning.
-
När datauppgiften har förberetts klickar du på Kör.
Mer information om återställningsuppgifter och andra sätt att köra uppgifter finns i Avancerade körningsalternativ.
-
Replikeringen ska nu börja och du kan se förloppet i Övervaka. Mer information finns i Övervaka en enskild datauppgift
Ställa in laddningsordning för datauppsättningar
Du kan kontrollera laddningsordningen för datauppsättningar i din datauppgift genom att tilldela en laddningsordning till varje datauppsättning. Detta kan vara användbart om du till exempel vill ladda små datauppsättningar före stora datauppsättningar.
-
Klicka Laddningsordning.
-
Välj en laddningsordning för varje datauppsättning.
Den förvalda laddningsordningen är Normal. Datauppsättningar laddas i följande ordningsföljd:
-
Högst
-
Högre
-
Högt
-
Normalt
-
Lågt
-
Lägre
-
Lägst
Datauppsättningar med samma prioritet laddas inte i någon särskild ordningsföljd.
-
-
Klicka på OK.
Uppdaterar metadata
Du kan uppdatera metadata i uppgiften så att den stämmer med ändringar i metadata i källan i Designvyn för en uppgift. För SaaS-program som använder Metadata manager måste Metadata manager uppdateras innan du kan uppdatera metadata i datauppgiften.
-
Du kan göra något av följande:
-
Klicka på ... och sedan på Uppdatera metadata för att uppdatera metadata för alla datauppsättningar i uppgiften.
-
Klicka på ... på en datauppsättning i Datauppsättningar och sedan på Uppdatera metadata för att uppdatera metadata för en enstaka datauppsättning.
Du kan visa status för uppdateringen av metadata under Uppdatera metadata i den nedre delen av skärmen. Du kan se när metadata senast uppdaterades genom att hovra över .
-
-
Förbered datauppgiften för att tillämpa ändringarna.
När du har förberett datauppgiften och ändringarna har tillämpats tas ändringarna bort från Uppdatera metadata.
Du måste förbereda lagringsåtgärder som använder den här åtgärden för att sprida ändringarna.
Om en kolumn tas bort läggs en transformation med Null-värden till för att säkerställa att lagringen inte förlorar historiska data.
Begränsningar för uppdatering av metadata
-
Ett namnbyte med en borttagen kolumn före det, i samma tidsfönster, kommer att översättas till namnbytet med den borttagna kolumnen om de är av samma datatyp och har samma datalängd.
Exempel:
Före: a b c d
Efter: a c1 d
I det här exemplet togs b bort och c bytte namn till c1 och b och c är av samma datatyp och har samma datalängd.
Detta kommer att identifieras som ett namnbyte för b till c1 och en borttagning av c.
-
Namnbytet för den sista kolumnen identifieras inte, även om den sista kolumnen togs bort, och den omedelbart före bytte namn.
Exempel:
Före: a b c d
Efter: a b c1
I det här exemplet togs d bort och c bytte namn till c1.
Detta kommer att identifieras som att c och d har tagits bort och att c1 har lagts till.
-
Nya kolumner förutsätts läggas till på slutet. Om kolumner läggs till i mitten med samma datatyp som nästa kolumn kan de tolkas som att de har tagits bort och bytt namn.
Utveckling av schema
Med Schemautveckling kan du enkelt kan upptäcka strukturella förändringar i flera datakällor och sedan styra hur dessa förändringar kommer att tillämpas på din uppgift. Schemautveckling kan användas för att upptäcka alla DDL-ändringar som gjorts i källdataschemat. Du kan också tillämpa vissa ändringar automatiskt.
För varje ändringstyp kan du välja hur du vill hantera ändringarna i avsnittet Schemautveckling i uppgiftsinställningarna. Du kan antingen tillämpa ändringen, ignorera ändringen, avbryta tabellen eller stoppa behandlingen av uppgiften.
Du kan ange vilken åtgärd som ska användas för att hantera DDL-ändringen för varje ändringstyp. Vissa åtgärder är inte tillgängliga för alla ändringstyper.
-
Tillämpa på mål
Tillämpa ändringar automatiskt.
-
Ignorera
Ignorera ändringar.
-
Inaktivera tabell
Inaktivera tabellen. Tabellen kommer att visas som fel i Övervakaren.
-
Stoppa uppgift
Stoppa bearbetningen av uppgiften. Detta är användbart om du vill hantera alla schemaförändringar manuellt. Detta stoppar också schemaläggningen, det vill säga att schemalagda körningar inte kommer att utföras.
Följande ändringar stöds:
-
Lägg till kolumn
-
Byt namn på kolumn
-
Ändra kolumndatatyp:
-
Släpp tabell
-
Släpp kolumn
-
Lägg till en tabell som matchar urvalsmönstret
Om du använde en Urvalsregel för att lägga till datauppsättningar som matchar ett mönster kommer nya tabeller som uppfyller mönstret att upptäckas och läggas till.
Se Utveckling av schema för mer information om uppgiftsinställningar
Du kan också få meddelanden om ändringar som hanteras med schemautveckling. Mer information finns i Konfigurera aviseringar vid ändringar under drift.
Begränsningar för schemautveckling
Följande begränsningar gäller för schemautveckling:
-
Schemautveckling stöds endast när CDC används som uppdateringsmetod.
-
När du har ändrat inställningarna för schemautveckling måste du förbereda uppgiften på nytt.
-
Om du byter namn på tabeller stöds inte schemautveckling. I så fall måste du uppdatera metadata innan du förbereder uppgiften.
-
Om du håller på att utforma en uppgift måste du uppdatera webbläsaren för att ta emot ändringar i schemautvecklingen. Du kan ställa in aviseringar för att få information om ändringar.
-
Det går inte att ta bort kolumner i mellanlagringsuppgifter. Om du tar bort en kolumn och lägger till den kommer det att resultera i ett tabellfel.
-
I mellanlagringsuppgifter går det inte att ta bort en tabell med åtgärden ta bort tabell. Om du tar bort en tabell och sedan lägger till en tabell kommer den gamla tabellen bara att trunkeras, och en ny tabell kommer inte att läggas till.
-
Det är inte möjligt att ändra längden på en kolumn för alla mål beroende på stödet i måldatabasen.
-
Om ett kolumnnamn ändras kommer explicita transformeringar som definieras med hjälp av den kolumnen inte att påverkas eftersom de baseras på kolumnnamnet.
-
Begränsningarna för uppdatering av metadata gäller även för schemautveckling.
När DDL-ändringar registreras gäller följande begränsningar:
-
När en snabb sekvens av åtgärder inträffar i källdatabasen (t.ex. DDL>DML>DDL) kan Qlik Talend Data Integration analysera loggen i fel ordning, vilket kan leda till att data saknas eller till ett oförutsägbart beteende. För att minimera risken för att detta ska hända är bästa praxis att vänta på att ändringarna ska tillämpas på målet innan du utför nästa åtgärd.
Ett exempel vid registrering av ändringar är att om en källtabell byter namn flera gånger i snabb följd (och den andra åtgärden byter tillbaka till det ursprungliga namnet), kan det uppstå ett felmeddelande om att tabellen redan finns i måldatabasen.
- Om du ändrar namnet på en tabell som används i en uppgift och sedan stoppar uppgiften, kommer Qlik Talend Data Integration inte att fånga upp några ändringar som görs i den tabellen när uppgiften återupptas.
-
Det går inte att byta namn på en källtabell medan en uppgift stoppas.
- Omallokering av en tabells Primary Key-kolumner stöds inte (och kommer därför inte att skrivas till kontrolltabellen för DDL-historik).
- När en kolumns datatyp ändras och (samma) kolumn sedan byter namn medan aktiviteten stoppas, kommer DDL-ändringen att visas i kontrolltabellen DDL-historik som "Drop Column" och sedan "Add Column" när aktiviteten återupptas. Observera att samma beteende också kan uppstå som ett resultat av förlängd latens.
- CREATE TABLE-åtgärder som utförs på källan medan en uppgift stoppas kommer att tillämpas på målet när uppgiften återupptas, men kommer inte att registreras som en DDL i kontrolltabellen DDL-historik.
-
Åtgärder som är förknippade med metadataändringar (t.ex. ALTER TABLE, reorg, återuppbyggnad av ett klustrat index osv.) kan orsaka oförutsägbart beteende om de utförs antingen
-
Under fullständig laddning
-ELLER-
-
Mellan tidsmarkören för Börja bearbeta ändringar och aktuell tid (dvs. det ögonblick då användaren klickar på OK i dialogrutan Avancerade körningsalternativ ).
Exempel:
OM:
Den angivna tiden för Börja bearbeta ändringar är 10.00.
OCH:
En kolumn med namnet Ålder lades till i tabellen Medarbetare kl. 10.10.
OCH:
Användaren klickar på OK i dialogrutan Avancerade körningsalternativ kl. 10.15.
SEDAN:
Ändringar som inträffade mellan 10.00 och 10.10 kan leda till CDC-fel.
Anteckning om informationI något av ovanstående fall måste den eller de berörda tabellerna laddas om för att data ska kunna skickas korrekt flyttad till målet.
-
- DDL-satsen
ALTER TABLE ADD/MODIFY <column> <data_type> DEFAULT <>
replikerar inte standardvärdet till målet och den nya/modifierade kolumnen sätts till NULL. Observera att detta kan hända även om den DDL som lade till/ändrade kolumnen kördes tidigare. Om den nya/ändrade kolumnen är nullable, uppdaterar källans slutpunkt alla tabellrader innan DDL:n loggas. Därför fångar Qlik Talend Data Integration upp ändringarna, men uppdaterar inte målet. Eftersom den nya/ändrade kolumnen är inställd på NULL kommer efterföljande uppdateringar att generera ett meddelande om att "noll rader påverkas", om måltabellen inte har något Primary Key/Unique-index. -
Ändringar i precisionskolumnerna TIDSMARKÖR och DATUM kommer inte att registreras.
Hantering av ändringar som inte tillämpas automatiskt
Här beskrivs hur du hanterar ändringar som inte kan tillämpas på målet, det vill säga åtgärden är Ignorera, Avbryt eller Stoppa aktivitet.
Förändring av DDL | För att genomföra förändringen | För att bevara det nuvarande tillståndet |
---|---|---|
Lägg till kolumn | Uppdatera metadata, förbered uppgiften och kör sedan uppgiften. | Ingen åtgärd krävs |
Skapa tabell | Uppdatera metadata, förbered uppgiften och kör sedan uppgiften. | Ingen åtgärd krävs |
Ändra kolumndatatyp: |
Kontrollera begränsningar. Om ingen begränsning gäller: Uppdatera metadata, förbered uppgiften och kör sedan uppgiften. |
Att bevara det aktuella tillståndet stöds inte alltid. Möjliga lösningar:
|
Byt namn på tabell |
Kontrollera begränsningar. Om ingen begränsning gäller: Förbered uppgiften och kör sedan uppgiften. |
Definiera en explicit omdöpningsregel för det gamla namnet. |
Byt namn på kolumn |
Kontrollera begränsningar. Om ingen begränsning gäller: Uppdatera metadata, förbered uppgiften och kör sedan uppgiften. |
Uppdatera metadata och definiera sedan en explicit omdöpningsregel för det gamla namnet. |
Begränsningar och överväganden vid replikering av data
Omvandlingar har följande begränsningar:
- Omvandlingar stöds ej för kolumner med språk som skrivs från höger till vänster.
-
Det går inte att göra omvandlingar av kolumner som innehåller specialtecken (exempelvis #, \, /, -) i sina namn.
- Enda omvandling som stöds för LOB/CLOB-datatyper är att släppa kolumnen på målet.
- Att använda en omvandling för att döpa om en kolumn och sedan lägga till en kolumn med samma namn stöds inte.
Ändra nullbarhet stöds inte för kolumner som tas bort, antingen med direktändring eller med hjälp av en transformeringsregel. Men nya kolumner som skapas i uppgiften är som standard nullbara.