Gegevens repliceren met een Standard-, Premium- of Enterprise-abonnement
Een replicationtaak instellen:
-
In Gegevensintegratie > Projecten klikt u op Project maken.
-
In het dialoogvenster Nieuw project doet u het volgende:
- Geef een naam op voor uw project.
- Selecteer de ruimte waarin u het project wilt maken.
- Geef desgewenst een beschrijving op.
- Selecteer Replication als de Gebruikscase.
- Schakel eventueel het selectievakje Openen uit als u een leeg project wilt maken zonder instellingen te configureren.
-
Klik op Maken.
Een van de volgende dingen zal gebeuren:
- Als het selectievakje Openen in het dialoogvenster Nieuw project is geselecteerd (de standaardinstelling), wordt het project geopend.
- Wanneer u het selectievakje Openen in het dialoogvenster Nieuw project hebt uitgeschakeld, wordt het project toegevoegd aan uw lijst met projecten. U kunt het project later openen door Openen te selecteren in het menu van het project.
-
Nadat het project is geopend, klikt u op Gegevens repliceren.
De wizard Gegevens repliceren wordt geopend.
-
Op het tabblad Algemeen geeft u een naam en beschrijving op voor de replication-taak. Klik vervolgens op Volgende.
-
Selecteer op het tabblad Bronverbinding selecteren een verbinding naar de brongegevens. U kunt eventueel de verbindingsinstellingen bewerken door Bewerken te selecteren in het menu in de kolom Acties.
Als u nog geen verbinding naar uw brongegevens hebt gemaakt, moet u er eerst een maken door in de rechterbovenhoek van het tabblad te klikken op Verbinding maken.
U kunt de lijst met verbindingen filteren met behulp van de filters aan de linkerkant. Verbindingen kunnen gefilterd worden op basis van brontype, gateway, ruimte en eigenaar. De knop Alle filters boven de verbindingslijst toont het aantal huidige filters. U kunt deze knop gebruiken om het venster Filters aan de linkerkant te sluiten of openen. Huidige actieve filters worden ook getoond bovenaan de lijst met beschikbare verbindingen.
U kunt de lijst ook sorteren door Laatst bijgewerkt, Laatst gemaakt of Alfabetisch te selecteren in de vervolgkeuzelijst aan de rechterkant. Klik op de pijl rechts van de lijst om de sorteervolgorde te wijzigen.
Nadat u een gegevensbronverbinding hebt geselecteerd, kunt u in de rechterbovenhoek van het tabblad op Verbinding testen klikken (aanbevolen) en vervolgens op Volgende.
-
Selecteer op het tabblad Gegevensverzamelingen selecteren tabellen en of/weergaven die u wilt opnemen in de replication-taak U kunt ook jokertekens gebruiken en selectieregels maken, zoals beschreven in Gegevens selecteren uit een database.
-
Op het tabblad Doelverbinding selecteren selecteert u het doel in de lijst met beschikbare verbindingen en klikt u vervolgens op Volgende. Wat betreft functionaliteit werkt het tabblad Bronverbinding selecteren hetzelfde als het tabblad dat eerder is beschreven.
-
Op het tabblad Instellingen kunt u eventueel de volgende instellingen wijzigen, klik vervolgens op Volgende.
Replicatiemodus
InformatieBij het repliceren vanuit SaaS-applicatiebronnen is de replicationmodus Volledige lading standaard ingeschakeld en dit kan niet worden uitgeschakeld.- Volledige lading: Laadt de gegevens van de geselecteerde brontabellen naar het doelplatform en maakt indien nodig de doeltabellen. De volledige lading vindt automatisch plaats als de taak is gestart, maar kan indien mogelijk ook handmatig worden uitgevoerd.
-
Wijzigingen toepassen: Werkt de doeltabellen continu bij met wijzigingen die in de brontabellen zijn aangebracht.
-
Wijzigingen opslaan: Slaat de wijzigingen van de brontabellen op in wijzigingstabellen (één per brontabel).
Ga voor meer informatie naar Wijzigingen opslaan.
Bij het werken met Gateway voor gegevensverplaatsing worden wijzigingen van de bron vrijwel direct vastgelegd. Als u werkt zonder Gateway voor gegevensverplaatsing (door Gegevensgateway in te stellen op Geen in de connectorinstellingen), worden wijzigingen vastgelegd volgens de planningsinstellingen. De standaardinterval voor vastleggen van wijzigingen is elke zes uur. Ga voor meer informatie naar Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing.
Modus Wijzigingen toepassen
InformatieBij het repliceren naar datawarehousedoelen, kunt u niet selecteren welke modi voor wijzigingen toepassen u wilt gebruiken. Wijzigingen worden altijd toegepast in de modus Batch geoptimaliseerd voor maximale efficiëntie.Wijzigingen worden toegepast op de doeltabellen met behulp van een van de volgende methoden:
- Batch geoptimaliseerd: Dit is de standaardinstelling. Als deze optie is geselecteerd, worden wijzigingen batchgewijs toegepast. Er wordt een voorverwerkingsactie uitgevoerd om de transacties zo efficiënt mogelijk te groeperen in batches.
- Transactioneel: Selecteer deze optie om elke transactie afzonderlijk toe passen, in de vastgelegde volgorde. In dit geval wordt strikte referentiële integriteit verzekerd voor alle tabellen.
Verbinding met tussenopslaggebied
Bij het repliceren van de onderstaande datawarehouses, moet u een tussenopslag instellen. Gegevens worden verwerkt en voorbereid in de tussenopslag voordat ze naar het warehouse worden verzonden.
Selecteer een bestaande tussenopslag of klik op Nieuwe maken om een nieuwe tussenopslag te definiëren en volg de instructies in Verbinding maken met een cloudopslag.
Klik op Bewerken om de verbindingsinstellingen te bewerken. Klik op Verbinding testen om de verbinding te testen (aanbevolen).
Raadpleeg de kolom Ondersteund als tussenopslaggebied in Gebruikscases doelplatform en ondersteunde versies voor informatie over welke tussenopslaggebieden voor welk datawarehouse worden ondersteund.
Replicatieplanner
InformatieDeze instelling is alleen relevant voor het openen van gegevensbronnen zonder Gateway voor gegevensverplaatsing. Raadpleeg Qlik Gegevensgateway - Gegevensverplaatsing voor informatie over de voordelen van Gateway voor gegevensverplaatsing en usecases waarvoor deze is vereist.-
Gegevens repliceren na: U kunt inplannen hoe vaak wijzigingen van de gegevensbronnen worden vastgelegd. Daarnaast kunt u een begintijd en begindatum instellen. Als de bronmetagegevens CDC (wijzigingsgegevens vastleggen) ondersteunen, worden alleen de wijzigingen van de brongegevens gerepliceerd en toegepast op de betreffende doeltabellen. Ondersteunen de brongegevensverzamelingen CDC niet (zoals, Weergaven), worden wijzigingen toegepast door alle brongegevens te laden naar de betreffende doeltabellen. In het geval enkele brongegevensverzamelingen CDC ondersteunen en andere niet, worden er twee afzonderlijke subtaken gemaakt (ervan uitgaand dat de bijwerkmethode Wijzigingen toepassen of de replicatie-opties van Wijzigingen opslaan zijn geselecteerd): één voor het laden van de gegevensverzamelingen die geen CDC ondersteunen en één subtaak voor het vastleggen van de wijzigingen naar gegevensverzamelingen die CDC wel ondersteunen.
Met de configuratiewizard voor taken kunt een basisuurinterval inplannen. Nadat u het instellen van de taak hebt voltooid, kunt u verschillende planningsopties verkennen, zoals beschreven in Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing.
Raadpleeg Minimumaantal toegestane planningsintervallen voor informatie over minimum planningsintervallen op basis van type gegevensbron en abonnementsniveau.
-
Op het tabblad Overzicht ziet u een visuele weergave van de gegevenspijplijn. Als enkele van de geselecteerde gegevensverzamelingen geen CDC ondersteunen, worden er twee pijplijnen weergegeven: één voor de CDC-taak en een andere voor de laadtaak. Kies om de gegevenstaak <naam> te openen of klik op Niets doen en klik vervolgens op Maken.
Afhankelijk van uw keuze wordt de taak geopend of er wordt een lijst met projecten getoond.
-
Als u ervoor kiest om de taak te openen, worden op het tabblad Gegevensverzamelingen de structuur en de metagegevens van de geselecteerde brontabellen getoond. Dit omvat alle expliciet vermelde tabellen en tabellen die voldoen aan de selectieregels.
Als u meer tabellen uit de gegevensbron wilt toevoegen, klikt u op Brongegevens selecteren.
-
U kunt eventueel de taakinstelling wijzigen zoals beschreven in Instellingen gegevensreplicatietaak.
-
U kunt transformaties uitvoeren voor gegevensverzamelingen, gegevens filteren of kolommen toevoegen.
Ga voor meer informatie naar Gegevensverzamelingen beheren.
-
Wanneer u de gewenste transformaties hebt toegevoegd, kunt u de gegevensverzamelingen valideren door te klikken op Gegevensverzamelingen valideren. Als de validatie mislukt, moet u de fouten oplossen voordat u verdergaat.
Ga voor meer informatie naar Valideren en aanpassen van de gegevensverzamelingen.
-
Als u klaar bent, klikt u op Voorbereiden om de gegevenstaak te catalogiseren en klaar te maken voor uitvoering.
-
Nadat de gegevenstaak is voorbereid, klikt u op Uitvoeren.
Ga naar Geavanceerde uitvoeropties voor informatie over het herstellen van taken en andere methoden voor het uitvoeren van taken.
-
De replicationtaak zou nu moeten beginnen, en u kunt de voortgang zien in Bewaken. Ga voor meer informatie naar Een afzonderlijke gegevenstaak bewaken.
Laadprioriteit voor gegevensverzamelingen instellen
U kunt de laadvolgorde beheren van gegevensverzamelingen in uw gegevenstaak door aan elke gegevensverzameling een laadprioriteit toe te wijzen. Dit kan bijvoorbeeld handig zijn als u kleine gegevensverzamelingen wilt laden voorafgaand aan grotere gegevensverzamelingen.
-
Klik op Laadprioriteit.
-
Selecteer een laadprioriteit voor elke gegevensverzameling.
De standaardlaadprioriteit is Normaal. Gegevensverzamelingen worden in de volgende volgorde van prioriteit geladen:
-
Hoogst
-
Hoger
-
Hoog
-
Normaal
-
Laag
-
Lager
-
Laagst
Gegevensverzamelingen met dezelfde prioriteit worden in willekeurige volgorde geladen.
-
-
Klik op OK.
Metagegevens worden vernieuwd
U kunt de metagegevens in de taak vernieuwen om ze af te stemmen met wijzigingen in de metagegevens van de bron in de ontwerpweergave van een taak. In het geval van SaaS-applicaties die de Metadata Manager gebruiken moet de Metadata Manager worden vernieuwd voordat u de metagegevens in de gegeventaak kunt vernieuwen.
-
U kunt ofwel:
-
Klik op ... en vervolgens op Metagegevens vernieuwen om de metagegevens te vernieuwen voor alle gegevensverzamelingen in de taak.
-
Klik op ... van een gegevensverzameling in Gegevensverzamelingen en vervolgens op Metagegevens vernieuwen om de metagegevens te vernieuwen voor een afzonderlijke gegevensverzameling.
U kunt de status van de vernieuwing van metagegevens bekijken onder Metagegevens vernieuwen in het onderste deel van het scherm. Ga met de muiscursor op staan om te zien wanneer de metagegegevens voor het laatst zijn vernieuwd.
-
-
Bereid de gegeventaak voor om de wijzigingen toe te passen.
Als u de gegevenstaak hebt voorbereid en de wijzigingen zijn toegepast, worden de wijzigingen verwijderd van Metagegevens vernieuwen.
U moet opslagtaken voorbereiden die deze taak gebruiken om de wijzigingen door te geven.
Als er een kolom wordt verwijderd, wordt er een transformatie met null-waarden toegevoegd om ervoor te zorgen dat de opslag geen historische gegevens verliest.
Beperkingen voor het vernieuwen van metagegevens
-
Een hernoeming met daarvoor een verwijderde kolom, in hetzelfde tijdslot, wordt vertaald naar de hernoeming van de verwijderde kolom als ze hetzelfde gegevenstype en dezelfde gegevenslengte hebben.
Voorbeeld:
Vóór: a b c d
Na: a c1 d
In dit voorbeeld is b verwijderd en is c hernoemd naar c1, en hebben b en c hetzelfde gegevenstype en dezelfde gegevenslengte.
Dit wordt geïdentificeerd als een hernoeming van b in c1 en een verwijdering van c.
-
De hernoeming van de laatste kolom is niet herkend, zelfs als de laatste kolom is verwijderd en de kolom ervoor is hernoemd.
Voorbeeld:
Vóór: a b c d
Na: a b c1
In dit voorbeeld is d verwijderd en is c hernoemd naar c1.
Dit wordt geïdentificeerd als een verwijdering van c en d en een toevoeging van c1.
-
Er wordt vanuit gegaan dat er aan het einde nieuwe kolommen worden toegevoegd. Als er in midden kolommen worden toegevoegd met hetzelfde gegevenstype als de volgende kolom, worden ze mogelijk geïnterpreteerd als een verwijdering en een hernoeming.
Schema-evolutie
Met schema-evolutie kunt u eenvoudig structurele wijzigingen in meerdere gegevensbronnen detecteren en vervolgens bepalen hoe die wijzigingen worden toegepast op uw taak. Schema-evolutie kan worden gebruikt om DDL-wijzigingen in het brongegevensschema te detecteren. U kunt sommige wijzigingen ook automatisch toepassen.
Voor elk wijzigingstype kunt u selecteren hoe de wijzigingen moeten worden verwerkt in de sectie Schema-evolutie van de taakinstellingen. U kunt de wijziging toepassen, de wijziging negeren, de tabel onderbreken of de verwerking van de taak stoppen.
U kunt instellen welke actie moet worden gebruikt om de DDL-wijziging af te handelen voor elk wijzigingstype. Sommige acties zijn niet beschikbaar voor alle wijzigingstypen.
-
Toepassen op doel
Wijzigingen automatisch toepassen.
-
Negeren
Wijzigingen negeren.
-
Tabel onderbreken
De tabel onderbreken. De tabel wordt als fout weergegeven in Bewaken.
-
Taak stoppen
De verwerking van de taak stoppen. Dit is handig als u alle schemawijzigingen handmatig wilt afhandelen. Hierdoor wordt de planning ook gestopt, dat wil zeggen dat geplande uitvoeringen niet worden uitgevoerd.
De volgende wijzigingen worden ondersteund:
-
Kolom toevoegen
-
Kolomnaam wijzigen
-
Type kolomgegevens wijzigen
-
Tabel wissen
-
Kolom wissen
-
Tabel toevoegen die overeenkomt met het selectiepatroon
Als u een selectieregel hebt gebruikt om gegevensverzamelingen toe te voegen die aan een patroon voldoen, worden nieuwe tabellen die aan het patroon voldoen gedetecteerd en toegevoegd.
Voor meer informatie over taakinstellingen gaat u naar Schema-evolutie
U kunt ook meldingen krijgen over wijzigingen die met schema-evolutie worden afgehandeld. Ga voor meer informatie naar Meldingen instellen voor wijzigingen van de bewerking.
Beperkingen voor schema-evolutie
De volgende beperkingen zijn van toepassing op schema-evolutie:
-
Schema-evolutie wordt alleen ondersteund bij gebruik van CDC als bijwerkmethode.
-
Wanneer u de instellingen voor schema-evolutie hebt gewijzigd, moet u de taak opnieuw voorbereiden.
-
Als u tabellen hernoemt, wordt schema-evolutie niet ondersteund. In dit geval moet u metagegevens vernieuwen voordat u de taak voorbereidt.
-
Als u een taak ontwerpt, moet u de browser vernieuwen om wijzigingen van schema-evolutie te ontvangen. U kunt meldingen instellen om gewaarschuwd te worden bij wijzigingen.
-
In tussenopslagtaken wordt het verwijderen van een kolom niet ondersteund. Een kolom verwijderen en toevoegen zal resulteren in een tabelfout.
-
Bij tussenopslagtaken zal door een drop table-bewerking de tabel niet worden verwijderd. Als u een tabel verwijdert en vervolgens een tabel toevoegt, wordt de oude tabel alleen afgekapt en wordt er geen nieuwe tabel toegevoegd.
-
Het wijzigen van de lengte van een kolom is niet voor alle doelen mogelijk, afhankelijk van de ondersteuning in de doeldatabase.
-
Als een kolomnaam gewijzigd wordt, zullen expliciete transformaties die met die kolom gedefinieerd zijn niet worden toegepast, aangezien ze gebaseerd zijn op de kolomnaam.
-
Beperkingen voor het vernieuwen van metagegevens gelden ook voor schema-evolutie.
Bij het vastleggen van DDL-wijzigingen gelden de volgende beperkingen:
-
Wanneer er een snelle opeenvolging van bewerkingen plaatsvindt in de brondatabase (bijvoorbeeld DDL>DML>DDL), kan Qlik Talend Data Integration het logboek in de verkeerde volgorde parseren, wat kan leiden tot ontbrekende gegevens of onvoorspelbaar gedrag. Om de kans hierop te minimaliseren, kunt u het beste wachten tot de wijzigingen op het doel zijn toegepast voordat u de volgende bewerking uitvoert.
Als bijvoorbeeld tijdens het vastleggen van wijzigingen een brontabel meerdere keren kort na elkaar hernoemd wordt (en de tweede bewerking hernoemt de tabel terug naar de oorspronkelijke naam), kan er een foutmelding verschijnen dat de tabel al bestaat in de doeldatabase.
- Als u de naam van een tabel die in een taak wordt gebruikt wijzigt en vervolgens de taak stopt, zal Qlik Talend Data Integration geen wijzigingen in die tabel vastleggen nadat de taak is hervat.
-
Het hernoemen van een brontabel terwijl een taak gestopt is, wordt niet ondersteund.
- Het opnieuw toewijzen van de Primary Key-kolommen van een tabel wordt niet ondersteund (en zal daarom niet naar de DDL History Control-tabel worden geschreven).
- Wanneer het gegevenstype van een kolom wordt gewijzigd en de (zelfde) kolom vervolgens wordt hernoemd terwijl de taak wordt gestopt, verschijnt de DDL-wijziging in de DDL History Control-tabel als "Kolom verwijderen" en vervolgens als "Kolom toevoegen" wanneer de taak wordt hervat. Let op dat hetzelfde gedrag ook kan optreden als gevolg van langdurige latentie.
- CREATE TABLE-bewerkingen die worden uitgevoerd op de bron terwijl een taak is gestopt, worden toegepast op het doel wanneer de taak wordt hervat, maar worden niet geregistreerd als een DDL in de DDL History Control-tabel.
-
Bewerkingen die verband houden met wijzigingen van de metagegevens (zoals ALTER TABLE, reorg, heropbouw van een geclusterde index, enzovoort) kunnen onvoorspelbaar gedrag veroorzaken als ze werden uitgevoerd:
-
Tijdens volledige lading
-OF-
-
Tussen de Begin met verwerken van wijzigingen vanaf tijdstempel en de huidige tijd (d.w.z. het moment dat de gebruiker op OK klikt in het dialoogvenster Geavanceerde uitvoeropties).
Voorbeeld:
IF:
De aangegeven tijd voor Begin met verwerken van wijzigingen vanaf is 10:00 uur.
AND:
Een kolom met de naam Leeftijd is om 10:10 uur toegevoegd aan de tabel Werknemers.
AND:
De gebruiker klikt om 10:15 uur op OK in het dialoogvenster Geavanceerde uitvoeropties.
THEN:
Wijzigingen die plaatsvonden tussen 10:00 en 10:10 kunnen leiden tot CDC-fouten.
InformatieIn elk van de bovenstaande gevallen moet(en) de betrokken gegevenstabel(len) opnieuw worden geladen om de gegevens correct naar het doel te kunnen verplaatst.
-
- De DDL-instructie
ALTER TABLE ADD/MODIFY <column> <data_type> DEFAULT <>
repliceert de standaardwaarde niet naar het doel en de nieuwe/gewijzigde kolom is ingesteld op NULL. Let op dat dit zelfs kan gebeuren als de DDL die de kolom heeft toegevoegd/gewijzigd in het verleden is uitgevoerd. Als in de nieuwe/gewijzigde kolom null-waarden zijn toegestaan, werkt het broneindpunt alle tabelrijen bij voordat de DDL zelf geregistreerd wordt. Het resultaat is dat Qlik Talend Data Integration de wijzigingen vastlegt, maar het doel niet bijwerkt. Aangezien de nieuwe/gewijzigde kolom is ingesteld op NULL, als de doeltabel geen primaire sleutel/unieke index heeft, zullen volgende updates het bericht "nul rijen beïnvloed" genereren. -
Wijzigingen van TIMESTAMP- en DATE-precisiekolommen worden niet vastgelegd.
Omgaan met wijzigingen die niet automatisch worden toegepast
Hier wordt beschreven hoe u kunt omgaan met wijzigingen die niet op het doel kunnen worden toegepast, d.w.z. dat de actie Negeren, Opschorten of Taak stoppen is.
DDL wijzigen | De verandering doorvoeren | De huidige status behouden |
---|---|---|
Kolom toevoegen | Vernieuw de metagegevens, bereid de taak voor en voer de taak uit. | Geen actie vereist |
Tabel maken | Vernieuw de metagegevens, bereid de taak voor en voer de taak uit. | Geen actie vereist |
Type kolomgegevens wijzigen |
Controleer beperkingen. Als er geen beperking van toepassing is: Vernieuw de metagegevens, bereid de taak voor en voer de taak uit. |
Het behouden van de huidige status wordt niet altijd ondersteund. Mogelijke oplossingen:
|
Tabelnaam wijzigen |
Controleer beperkingen. Als er geen beperking van toepassing is: Bereid de taak voor en voer de taak uit. |
Definieer een expliciete hernoemingsregel naar de oude naam. |
Kolomnaam wijzigen |
Controleer beperkingen. Als er geen beperking van toepassing is: Vernieuw de metagegevens, bereid de taak voor en voer de taak uit. |
Vernieuw de metagegevens, definieer vervolgens een expliciete hernoemingsregel naar de oude naam. |
Beperkingen en overwegingen bij het repliceren van gegevens
Voor transformaties gelden de volgende beperkingen:
- Transformaties worden niet ondersteund voor kolommen met talen van die van rechts naar links worden geschreven.
-
Transformaties kunnen niet uitgevoerd worden op kolommen die speciale tekens (bijv. #, \, /, -) bevatten in hun naam.
- De enige transformatie die wordt ondersteund voor LOB/CLOB-gegevenstypen is om de kolom in het doel te verwijderen.
- Een transmatie gebruiken om de naam van een kolom te wijzigen en vervolgens een kolom met dezelfde naam toe te voegen wordt niet ondersteund.
Wijzigen of null-waarden worden toegestaan is niet mogelijk in kolommen die zijn verplaatst of direct of via een transformatieregel zijn gewijzigd. Nieuwe kolommen die zijn gemaakt in de taak kunnen standaard null-waarden bevatten.