Instellingen voor cloudopslagdoelen

U kunt de standaardinstellingen voor data lake-tussenopslag naar wens wijzigen.

Algemeen

Updatemethode

U kunt gegevens in twee verschillende modi in de tussenopslag plaatsen. Het is niet mogelijk om de modus te wijzigen nadat de data lake-tussenopslagtaak is voorbereid.

Wijzigingsgegevens vastleggen (CDC) met behulp van wijzigingstabellen: Tussenopslagtaken van de datalake starten met een volledige lading (waarbij alle geselecteerde tabellen naar het doel worden geladen). De doelgegevens worden up-to-date gehouden met behulp van de CDC-technologie (Change Data Capture - vastleggen van wijzigingsgegevens).

InformatieCDC (vastleggen van wijzigingsgegevens) van DDL-bewerkingen wordt niet ondersteund.

Bij het werken met Data Movement gateway worden wijzigingen van de bron vrijwel direct vastgelegd. Als u werkt zonder Data Movement gateway, worden wijzigingen vastgelegd volgens de planningsinstellingen. Ga voor meer informatie naar Instellingen voor cloudopslagdoelen.
Opnieuw laden: Voert een volledige lading uit van de gegevens van de geselecteerde brontabellen naar het doelplatform en maakt indien nodig de doeltabellen. De volledige lading vindt automatisch plaats als de taak is gestart, maar kan indien mogelijk ook handmatig of periodiek worden uitgevoerd.

Te gebruiken map

Selecteer een van de volgende opties, afhankelijk van de bucketmap waarnaar u de bestanden wilt schrijven:

Standaardmap

De indeling van de standaardmap is <uw-projectnaam>/<uw-taaknaam>
Hoofdmap

De bestanden worden naar de hoofd-bucketmap geschreven.
Map

Geef een mapnaam op. De map wordt tijdens de gegevenstaak gemaakt als deze nog niet bestaat.

Informatie De mapnaam mag geen speciale tekens bevatten (bijvoorbeeld @, #, !, enzovoort).

Gegevenspartitionering wijzigen

Deze optie is alleen beschikbaar wanneer de updatemethode Change Data Capture (CDC) is.

In een standaard tussenopslagtaak worden wijzigingen in willekeurige volgorde in de tussenopslag op het doel geplaatst. Met Change Data Partitioning kunnen wijzigingsgegevens uit veel tabellen op een consistente manier worden verwerkt. U kunt de duur van partities en de basistijd voor partitionering definiëren, waardoor de algehele consistentie van de gepartitioneerde gegevens wordt gewaarborgd (d.w.z. geen gedeeltelijke transacties, geen orderkoppen zonder orderregels, enzovoort).

Informatie over de partities wordt vastgelegd in de besturingstabel attrep_cdc_partitions in de doeldatabase. Deze informatie kan worden gebruikt om gepartitioneerde gegevens te identificeren die verder moeten worden verwerkt.

De partitioneringsopties zijn als volgt:

Elke partitioneren - Geef de lengte (in uren en minuten) van elke partitie op.

Informatie
Het wordt aanbevolen om een partitielengte van meer dan een uur op te geven. Hoewel het opgeven van een partitielengte van minder dan een uur de latentie kan verbeteren, kan het maken van veel partities op het doel ook van invloed zijn op de (doel)prestaties (vooral in systemen met grote hoeveelheden wijzigingen).

Als u een taak hervat van VOORDAT de laatste partitie is gemaakt, schrijft de data lake-tussenopslagtaak naar een partitie die al is gesloten.
Basistijd partitie - Partities worden gemaakt gedurende een periode van 24 uur, die wordt berekend op basis van de opgegeven "Basistijd partitionering" in de brondatabase (in UTC-tijd). Een partitie-interval van 8 uur met een "Basistijd partitionering" van 02:00 uur maakt bijvoorbeeld de volgende partities: 02:00-10:00, 10:00-18:00, 18:00-02:00 - maar niet noodzakelijkerwijs in die volgorde. Als een taak bijvoorbeeld om 01:00 uur is gestart, is het tijdsbestek van de eerste partitie 18:00-02:00 uur. Bovendien, als een taak in het midden van een partitie is gestart (bijv. om 04:00 uur), worden de wijzigingsgegevens ingevoegd in de partitie 02:00-10:00 (ook al zijn er vóór 04:00 uur geen wijzigingen vastgelegd).

Gegevens uploaden

Bestandskenmerken

Indeling

U kunt ervoor kiezen om de doelbestanden te maken in de indeling CSV, JSON of Parquet.

Bij gebruik van de Parquet-bestandsindeling worden LOB-kolommen groter dan 1 MB niet ondersteund

In een JSON-bestand wordt elke record weergegeven door een enkele regel, zoals in het volgende voorbeeld:

{ "book_id": 123, "title": "Alice in Wonderland", "price": 6.99, "is_hardcover": false }

{ "book_id": 456, "title": "Winnie the Pooh", "price": 6.49, "is_hardcover": true }

{ "book_id": 789, "title": "The Cat in the Hat", "price": 7.23, "is_hardcover": true }

Zie ook: Eigenschappen van inhoudstype en inhoudsversleuteling

Het wijzigen van de indeling (bijvoorbeeld van CSV naar JSON of van JSON naar CSV) terwijl de taak is gestopt en vervolgens de taak hervatten, wordt niet ondersteund.

Als u de indeling JSON of Parquet kiest, worden de volgende velden verborgen omdat ze alleen relevant zijn voor de CSV-indeling: Veldscheidingsteken, Recordscheidingsteken, Null-waarde, Aanhalingsteken, Escape-teken voor aanhalingsteken en Metagegevenskoptekst toevoegen.
De volgende velden zijn alleen relevant voor de Parquet-indeling: Parquet-versie, Parquet-tijdstempeleenheid en Maximale LOB-grootte Parquet (KB).

Voor informatie over toewijzingen van gegevenstypen bij gebruik van de Parquet-indeling en beperkingen, raadpleegt u Mapping from Qlik Cloud data types to Parquet

Veldscheidingsteken

Het scheidingsteken dat wordt gebruikt om velden (kolommen) in de doelbestanden te scheiden. De standaardwaarde is een komma.

Voorbeeld met een komma als scheidingsteken:

"mike","male"

Scheidingstekens kunnen standaardtekens of een hexadecimale (hex) waarde zijn. Merk op dat het voorvoegsel "0x" moet worden gebruikt om een hexadecimaal scheidingsteken aan te duiden (bijv. 0x01 = SOH). In de velden Veldscheidingsteken, Recordscheidingsteken en Null-waarde kan het scheidingsteken bestaan uit aaneengeschakelde hex-waarden (bijv. 0x0102 = SOHSTX), terwijl het in de velden Aanhalingsteken en Escape-teken voor aanhalingsteken slechts een enkele hex-waarde kan zijn.

Het hexadecimale getal 0x00 wordt niet ondersteund (d.w.z. alleen 0x01-0xFF worden ondersteund).

Null-waarde

De tekenreeks die wordt gebruikt om een null-waarde in de doelbestanden aan te geven.

Voorbeeld (waarbij \n het recordscheidingsteken is en @ de null-waarde is):

"mike","male",295678\n

"sara","female",@\n

Recordscheidingsteken

Het scheidingsteken dat wordt gebruikt om records (rijen) in de doelbestanden te scheiden. De standaardwaarde is een nieuwe regel (\n).

Voorbeeld:

"mike","male"\n

"sara","female"\n

Aanhalingsteken

Het teken dat wordt gebruikt aan het begin en einde van een tekstkolom. De standaardwaarde is het dubbele aanhalingsteken ("). Wanneer een kolom die kolomscheidingstekens bevat, tussen dubbele aanhalingstekens staat, worden de kolomscheidingstekens geïnterpreteerd als werkelijke gegevens en niet als kolomscheidingstekens.

Voorbeeld (waarbij een @ het aanhalingsteken is):

@mike@,@male@

Escape-teken voor aanhalingsteken

Het teken dat wordt gebruikt om een aanhalingsteken in de werkelijke gegevens te escapen. De standaardwaarde is het dubbele aanhalingsteken (").

Voorbeeld (waarbij " het aanhalingsteken is en \ het escape-teken is):

1955,"old, \"rare\", Chevrolet","$1000"

Parquet-versie

Selecteer welke versie u wilt gebruiken, afhankelijk van welke versie het doelplatform ondersteunt. Merk op dat Parquet-versie 1.0 alleen de tijdstempeleenheid MICRO ondersteunt, terwijl Parquet-versie 2.6 zowel de tijdstempeleenheden MICRO als NANO ondersteunt.

Parquet-tijdstempeleenheid

Wanneer de Parquet-versie is ingesteld op 2.6, kiest u MICRO of NANO. Wanneer de Parquet-versie is ingesteld op 1.0, wordt alleen MICRO ondersteund.

Maximale LOB-grootte Parquet (KB)

De standaard maximale LOB-grootte is 64 KB en de maximale waarde die u in dit veld kunt invoeren is 10.000 KB. Het verwerken van LOB-kolommen vereist meer bronnen, wat op zijn beurt de prestaties beïnvloedt. Verhoog deze waarde alleen als u LOB-gegevens repliceert die groter zijn dan 64 KB en u vereist dat alle LOB-gegevens naar het doel worden gerepliceerd.

Maximale bestandsgrootte

De maximale grootte die een bestand kan bereiken voordat het wordt gesloten (en optioneel gecomprimeerd).

De maximumgrootte die een bestand kan bereiken voordat het wordt gesloten. Kleinere bestanden worden mogelijk sneller geüpload (afhankelijk van het netwerk) en verbeteren de prestaties indien ze worden gebruikt in combinatie met de optie Parallelle uitvoering. Het wordt over het algemeen afgeraden om de database te vullen met kleine bestanden.

Bestanden comprimeren met

Kies een van de compressieopties om de doelbestanden te comprimeren of NONE (de standaardwaarde) om ze ongecomprimeerd te laten. Merk op dat de beschikbare compressieopties worden bepaald door de geselecteerde bestandsindeling.

Metagegevenskoptekst toevoegen

U kunt eventueel een veldnamenrij toevoegen aan de gegevensbestanden. De veldnamenrij kan de namen van de bronkolommen en/of de tussenliggende (d.w.z. Qlik Talend Data Integration) gegevenstypen bevatten.

Voorbeeld van een doelbestand met een veldnamenrij als zowel Met kolomnamen als Met gegevenstypen is geselecteerd:

Position:DECIMAL(38,0),Color:VARCHAR(10)

1,"BLUE"

2,"BROWN"

3,"RED"

...

Wijzigingsverwerking

Deze sectie beschrijft voorwaardelijke instellingen in Wijzigingsverwerking.

Wijzigingen toepassen/opslaan wanneer

Bestandsgrootte bereikt: Geef de maximale grootte van wijzigingsgegevens op die moet worden verzameld voordat het bestand naar het doel wordt geüpload.
Verstreken tijd bereikt: Verstreken tijd bereikt x.

Metagegevensbestanden

Wanneer de optie Metagegevensbestanden maken in de doelmap is geselecteerd, wordt voor elk gegevensbestand een bijbehorend metagegevensbestand met de extensie .dfm gemaakt in de opgegeven doelmap. De metagegevensbestanden bieden aanvullende informatie over de taak/gegevens, zoals het type bronconnector, de naam van de brontabel, het aantal records in het gegevensbestand, enzovoort.

Voor een volledige beschrijving van het metagegevensbestand en mogelijke toepassingen, raadpleegt u Beschrijving van het metagegevensbestand

Metagegevens

LOB-kolommen

Deze instelling is niet beschikbaar bij het gebruik van een voorbeeldconnector van een SaaS-applicatie. Voorbeeldconnectoren worden aangegeven met de knop Afbeelding van de knop Voorbeeld

, zowel in het dialoogvenster Verbinding maken als in de online Help.

LOB-kolommen opnemen en kolomgrootte beperken tot (KB)

U kunt ervoor kiezen om LOB-kolommen in de taak op te nemen en de maximale LOB-grootte in te stellen. LOB's die groter zijn dan de maximale grootte, worden afgekapt.

JSON-kolomtoewijzing

Wijs compatibele JSON-kolommen van de bron toe aan JSON-kolommen in het doel

Als u Data Movement gateway gebruikt om toegang te krijgen tot uw gegevensbron, is versie 2024.11.70 of later vereist.
Alleen ondersteund met Preview-connectors voor een SaaS-applicatie.

Wanneer deze optie is geselecteerd, worden JSON-kolommen in de bron automatisch toegewezen aan JSON-kolommen in het doel.

De status en zichtbaarheid van deze optie wordt bepaald door de volgende factoren:

Nieuwe taken: Deze optie wordt standaard ingeschakeld als zowel de bron als het doel het JSON-gegevenstype ondersteunen.
Bestaande taken: Deze optie is standaard uitgeschakeld, zelfs als zowel de bron als het doel het JSON-gegevenstype ondersteunen. Dit is om achterwaartse compatibiliteit te behouden met stroomafwaartse processen - zoals transformaties - die verwachten dat de doelgegevens in STRING-indeling zijn (wat het verouderde gedrag is). U kunt de optie uitgeschakeld laten of u kunt de downstreamprocessen bewerken zodat ze compatibel zijn met de JSON-indeling en vervolgens deze optie inschakelen.
Nieuwe en bestaande taken: Als alleen de bron het JSON-gegevenstype ondersteunt, is deze optie niet zichtbaar. Als JSON-ondersteuning in een later stadium aan het doel wordt toegevoegd, wordt de optie zichtbaar, maar blijft deze uitgeschakeld. Dit is om achterwaartse compatibiliteit te behouden met downstream processen - zoals transformaties - die verwachten dat de doelgegevens in STRING-indeling zijn (wat het verouderde gedrag is).

Besturingstabellen

Selecteer welke van de volgende besturingstabellen u op het doelplatform wilt maken:

Replicatiestatus: Biedt details over de huidige tussenopslagtaak, waaronder de taakstatus, de hoeveelheid geheugen die door de taak wordt verbruikt, het aantal wijzigingen dat nog niet is toegepast op het gegevensplatform en de positie in de gegevensbron van waaruit de gegevens momenteel worden gelezen.
Opgeschorte tabellen: Biedt een lijst met opgeschorte tabellen en de reden waarom ze zijn opgeschort.
Replicatiegeschiedenis: Biedt informatie over de taakgeschiedenis, waaronder het aantal en het volume van de records die zijn verwerkt tijdens een tussenopslagtaak, de latentie aan het einde van een CDC-taak en meer.
Wijzigingsgegevenspartities: Biedt records van partities die in de doeldatabase zijn gemaakt als gevolg van Gegevenspartitionering wijzigen. U kunt deze informatie gebruiken om gepartitioneerde gegevens te identificeren die verder moeten worden verwerkt.

Voor een gedetailleerde beschrijving van elk van de besturingstabellen, raadpleegt u Controletabellen

Volledige lading

Deze instellingen zijn niet beschikbaar tvoor taken die zijn gedefinieerd met een voorbeeldconnector van een SaaS-applicatie. Voorbeeldconnectoren worden aangegeven met de knop Afbeelding van de knop Voorbeeld

, zowel in het dialoogvenster Verbinding maken als in de online Help.

Prestatieafstemming

Maximumaantal tabellen om parallel te laden: Voer het maximumaantal tabellen in dat tegelijkertijd in het doel moet worden geladen. De standaardwaarde is 5.
Time-out voor transactieconsistentie (seconden): Voer het aantal seconden in dat moet worden gewacht tot openstaande transacties zijn gesloten, voordat de bewerking voor volledige lading begint. De standaardwaarde is 600 (10 minuten). De volledige lading start nadat de time-outwaarde is bereikt, zelfs als er nog transacties openstaan.

InformatieOm transacties te repliceren die openstonden toen de volledige lading startte, maar pas werden vastgelegd nadat de time-outwaarde was bereikt, moet u de doeltabellen opnieuw laden.
Vastleggingssnelheid tijdens volledige lading: Het maximumaantal gebeurtenissen dat samen kan worden overgedragen. De standaardwaarde is 10000.

Nadat de volledige lading is voltooid

Primaire sleutel of uniek maken: Selecteer deze optie als u het maken van de primaire sleutel of unieke index op het gegevensplatform wilt uitstellen tot nadat de volledige lading is voltooid.

Voor initiële lading

Bij het verplaatsen van gegevens vanuit een SaaS-applicatiebron, kunt u instellen hoe de initiële volledige lading moet worden uitgevoerd:

Als u Data Movement gateway gebruikt om toegang te krijgen tot uw gegevensbron, is voor deze instellingen versie 2022.11.74 of hoger vereist.

Cachegegevens gebruiken

Met deze optie kunt u cachegegevens gebruiken die zijn gelezen toen metagegevens met Volledige gegevensscan werden geselecteerd.

Dit zorgt voor minder overhead met betrekking tot API-gebruik en quota, in verhouding tot wanneer de gegevens al zijn gelezen vanuit de bron. Alle wijzigingen sinds de initiële gegevensscan kunnen worden opgepikt door Change data capture (CDC).

Gegevens laden vanuit bron

Deze optie voert een nieuwe lading vanuit de gegevensbron uit. Deze optie is nuttig als:

De metagegevensscan niet recentelijk is uitgevoerd.
De brongegevensverzameling klein is en regelmatig verandert en als u geen volledige wijzigingsgeschiedenis wilt bijhouden.

Verwerking van wijzigingen opslaan

De koptekstkolommen van de wijzigingstabel bieden informatie over de bewerking voor wijzigingsverwerking, zoals het type bewerking (bijvoorbeeld INSERT), de vastleggingstijd, enzovoort. Als u deze informatie niet nodig hebt, kunt u de gegevenstaak configureren om de wijzigingstabellen te maken zonder enkele of alle koptekstkolommen, waardoor hun voetafdruk in de doeldatabase wordt verkleind. Schakel hiervoor de selectievakjes uit voor de koptekstkolommen die u wilt uitsluiten.

Merk op dat u geen extra kolommen kunt verwijderen of kolommen kunt herstellen terwijl een taak wordt uitgevoerd. Om uw initiële selectie te wijzigen, moet u eerst de taak stoppen, vervolgens uw selectie wijzigen en ten slotte de doeltabellen opnieuw laden.

Wanneer Gegevenspartitionering wijzigen is ingeschakeld, wordt een extra koptekstkolom met de naam "partition_name" toegevoegd aan de wijzigingstabellen en automatisch geselecteerd in de gebruikersinterface. Omdat deze kolom vereist is, kan deze niet worden uitgesloten.

Voor een beschrijving van de koptekstkolommen, zie Wijzigingstabellen gebruiken.

Foutafhandeling

Gegevensfouten

Afhandeling van gegevensfouten wordt alleen ondersteund met de updatemethode Change Data Capture (CDC).

Fouten bij afkappen van gegevens

Voor fouten in het afkappen van gegevens: Selecteer wat er moet gebeuren als er een afkapping plaatsvindt in een of meer specifieke records. U kunt een van de volgende opties in de lijst selecteren:

Negeren: De taak wordt voorgezet en de fout wordt genegeerd.
Tabel opschorten: De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord wordt omgezet naar een foutstatus en de gegevens worden niet gerepliceerd
Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.

Andere gegevensfouten

Voor overige gegevensfouten: Selecteer wat er moet gebeuren als er een fout ontstaat in één of meer specifieke records. U kunt een van de volgende opties in de lijst selecteren:

Negeren: De taak wordt voorgezet en de fout wordt genegeerd.
Tabel opschorten: De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord wordt omgezet naar een foutstatus en de gegevens worden niet gerepliceerd
Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.

Afhandeling van gegevensfouten escaleren

Foutverwerking escaleren wanneer gegevensfouten ontstaan (per tabel): Schakel dit selectievakje in om foutverwerking te escaleren als het aantal niet-afgekapte gegevensfouten (per tabel) het opgegeven aantal bereikt. Geldige waarden zijn 1-10.000.

Escalatie-actie: Kies wat er moet gebeuren wanneer foutverwerking wordt geëscaleerd. Houd er rekening mee dat de beschikbare acties afhankelijk zijn van de actie die is geselecteerd in de vervolgkeuzelijst Voor overige gegevensfouten die hierboven wordt beschreven.

Tabel opschorten (standaard): De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord worden omgezet naar een foutstatus en de gegevens worden niet landed.
Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.

Tabelfouten

Aantal nieuwe pogingen voordat een tabel fout wordt geretourneerd

Met deze optie kunt u bepalen wanneer het beleid voor tabel foutafhandeling wordt geactiveerd. Standaard, nadat een tabel fout is opgetreden, wordt de tabel opgeschort of de taak gestopt (afhankelijk van de geselecteerde actie) na drie nieuwe pogingen. Soms treedt een tabel fout op als gevolg van gepland onderhoud van de SaaS-applicatie. In deze gevallen is het standaard aantal nieuwe pogingen mogelijk niet voldoende om het onderhoud te voltooien voordat het beleid voor tabel foutafhandeling wordt geactiveerd. Dit hangt ook af van het planningsinterval van de taak, aangezien een nieuwe poging wordt uitgevoerd elke keer dat de taak wordt uitgevoerd. Dus, bijvoorbeeld, als u een taak plant om elk uur uit te voeren en de SaaS-applicatie offline wordt gehaald voor onderhoud precies wanneer de taak begint te draaien, zorgt de standaard van drie nieuwe pogingen ervoor dat de SaaS-applicatie tot drie uur offline kan zijn zonder dat het beleid voor tabel foutafhandeling wordt geactiveerd. Een langer onderhoudsvenster zou vereisen dat u het aantal nieuwe pogingen verhoogt (of de planning wijzigt) om te voorkomen dat het beleid voor tabel foutafhandeling wordt geactiveerd.

Samenvattend, als u weet dat uw SaaS-applicatie periodiek onderhoud ondergaat, is het een goede gewoonte om het aantal nieuwe pogingen te verhogen volgens de planning, zodat het onderhoud kan worden voltooid zonder dat het beleid voor tabel foutafhandeling wordt geactiveerd.

Deze optie wordt alleen weergegeven voor taken die zijn geconfigureerd met een Lite- of Standard SaaS-applicatieconnector.
Als u Data Movement gateway gebruikt, is versie 2024.11.70 of later vereist.

Wanneer een tabelfout ontstaat: selecteer een van het volgende uit de vervolgkeuzelijst:

Tabel opschorten (standaard): de taak wordt voortgezet, maar gegevens van de tabel met het foutrecord worden omgezet naar een foutstatus en de gegevens worden niet gerepliceerd.
Taak stoppen: de taak wordt gestopt en handmatige tussenkomst is vereist.

Foutverwerking escaleren wanneer tabelfouten ontstaan (per tabel):: schakel dit selectievakje in om foutverwerking te escaleren als het aantal tabelfouten (per tabel) het opgegeven aantal bereikt. Geldige waarden zijn 1-10.000.

Escalatie-actie: het escalatiebeleid voor tabelfouten is ingesteld op Taak stoppen en dit kan niet worden gewijzigd.

Omgeving

Maximum aantal nieuwe pogingen: Selecteer deze optie en geef vervolgens het maximumaantal pogingen op voor het opnieuw proberen van een taak als er een herstelbare omgevingsgerelateerde fout plaatsvindt. Nadat u hebt geprobeerd de taak het opgegeven aantal keer opnieuw uit te voeren, wordt de taak gestopt en moet u handmatig ingrijpen.

Schakel het selectievakje uit of geef '0' op om de taak niet te proberen de taak opnieuw uit te voeren.

Geef '-1' op om een oneindig aantal keren te proberen de taak opnieuw uit te voeren.
- Interval tussen nieuwe pogingen (seconden): Gebruik de teller om het aantal seconden te selecteren of in te voeren dat het systeem wacht tussen nieuwe pogingen.
  
  Geldige waarden zijn 0-2.000.
Interval voor opnieuw proberen bij lange storingen vergroten: Schakel dit selectievakje in om de interval voor opnieuw proberen te verhogen voor lange storingen. Als deze optie is ingeschakeld, verdubbelt de interval tussen elke nieuwe poging en de volgende poging totdat de Maximuminterval voor nieuwe pogingen is bereikt (en er door wordt gegaan met nieuwe pogingen op basis van de opgegeven maximuminterval).
- Maximuminterval voor nieuwe pogingen (seconden): Gebruik de teller om te selecteren of in te voeren hoeveel seconden er gewacht wordt tussen pogingen om een taak opnieuw uit te voeren als de optie Interval voor opnieuw proberen bij lange storingen vergroten is ingeschakeld. Geldige waarden zijn 0-2.000.

Afstemming van wijzigingsverwerking

Dit tabblad is alleen beschikbaar wanneer de updatemethode Change Data Capture (CDC) is.

Afstemming van transactionele offload

Lopende transacties offloaden naar schijf als:

Transactiegegevens worden meestal in het geheugen bewaard totdat ze volledig zijn vastgelegd in de bron of het doel. Transacties die groter zijn dan het toegewezen geheugen of die niet binnen de opgegeven tijdslimiet zijn vastgelegd, worden echter naar de schijf geoffload.
- Totale geheugengrootte voor alle transacties overschrijdt (MB): De maximale grootte die alle transacties in het geheugen kunnen innemen voordat ze naar de schijf worden geoffload. De standaardwaarde is 1024.
- Transactieduur overschrijdt (seconden): De maximale tijd dat elke transactie in het geheugen kan blijven voordat deze naar de schijf wordt geoffload. De duur wordt berekend vanaf het moment dat Qlik Talend Data Integration begon met het vastleggen van de transactie. De standaardwaarde is 60.

Batchafstemming

Minimumaantal wijzigingen per transactie: Het minimumaantal wijzigingen dat in elke transactie wordt opgenomen. De standaardwaarde is 1000.

Informatie
De wijzigingen worden toegepast op het doel als het aantal wijzigingen gelijk is aan of groter is dan de waarde Minimumaantal wijzigingen per transactie OF als de waarde Maximumtijd om transacties in batches te plaatsen voor toepassen (seconden) die hieronder wordt beschreven is bereikt - naargelang wat als eerste wordt bereikt. Omdat de frequentie van wijzigingen die worden toegepast op het doel door deze twee parameters wordt beheerd, worden wijzigingen in de bronrecords mogelijk niet direct in de doelrecords weergegeven.
Maximumtijd om transacties in batches te plaatsen voor toepassen (seconden): De maximumtijd om transacties in batches te verzamelen voordat er een time-out optreedt. De standaardwaarde is 1.

Interval

Instellingen bij gebruik van SAP ODP en SaaS-applicatie (Lite) connectoren

Wijzigingen om de (minuten) lezen

De interval tussen het lezen van wijzigingen van de bron in minuten. Het geldige bereik ligt tussen 1 en 1440.
Informatie
Deze optie is alleen beschikbaar wanneer de gegevenstaak is gedefinieerd met:
- Data Movement gateway
- Een van de volgende bronnen:
  - SaaS-applicatie alleen via Lite-connectoren
  - SAP ODP
- Alleen de bijwerkmethode Wijzigingsgegevens vastleggen (CDC).

Instellingen bij gebruik van de SAP OData-connector

Controleren op wijzigingen

Volgens het interval van delta-extractie Wanneer deze optie is geselecteerd, controleert de gegevenstaak op wijzigingen volgens het interval van delta-extractie.

InformatieHet interval begint na elke 'ronde'. Een ronde kan worden gedefinieerd als de tijd die de gegevenstaak nodig heeft om de wijzigingen uit de brontabellen te lezen en deze naar het doel te verzenden (als één transactie). De duur van een ronde varieert afhankelijk van het aantal tabellen en wijzigingen. Dus als u een interval van 10 minuten opgeeft en een ronde 4 minuten duurt, dan is de werkelijke tijd tussen het controleren op wijzigingen 14 minuten.
- Interval delta-extractie: De frequentie waarmee delta's uit uw systeem worden geëxtraheerd. De standaardinstelling is 60 seconden.
Zoals gepland: wanneer deze optie is geselecteerd, zal de gegevenstaak de delta één keer extraheren en dan stoppen. Het zal dan uitgevoerd blijven worden zoals gepland.

InformatieDeze optie is alleen relevant als het interval tussen de CDC-cycli 24 uur of meer is.

Voor informatie over planning:
- "Gegevens tijdelijk opslaan in datalake" taken in een replicatieproject, zie CDC plannen voor lake-tussenopslagtaken

Diverse afstemmingen

Cachegrootte voor instructies (aantal instructies): Het maximumaantal voorbereide instructies dat op de server moet worden opgeslagen voor latere uitvoering (bij het toepassen van wijzigingen op het doel). De standaardwaarde is 50. Het maximum is 200.
DELETE en INSERT bij het bijwerken van een primaire sleutelkolom: Voor deze optie moet volledige aanvullende logboekregistratie zijn ingeschakeld in de brondatabase.

InformatieDeze instelling is niet beschikbaar bij het gebruik van een voorbeeldconnector van een SaaS-applicatie. Voorbeeldconnectoren worden aangegeven met de knop , zowel in het dialoogvenster Verbinding maken als in de online Help.

Schema-evolutie

Selecteer hoe u de volgende typen DDL-wijzigingen in het schema wilt afhandelen. Wanneer u de instellingen voor schema-evolutie hebt gewijzigd, moet u de taak opnieuw voorbereiden. De onderstaande tabel beschrijft welke acties beschikbaar zijn voor de ondersteunde DDL-wijzigingen.

Wanneer de taak is geconfigureerd met een preview-connector voor een SaaS-applicatie, wordt alleen de DDL-wijziging Gegevenstype van kolom wijzigen ondersteund. Raadpleeg de Help van de connector om te zien of uw connector in preview is.

DDL-wijziging	Toepassen op doel	Negeren	Tabel opschorten	Taak stoppen
Kolom toevoegen	Ja	Ja	Ja	Ja
Naam van kolom wijzigen	Nee	Nee	Ja	Ja
Naam van tabel wijzigen	Nee	Nee	Ja	Ja
Gegevenstype van kolom wijzigen	Nee	Ja	Ja	Ja
Tabel maken Als u een Selectieregel hebt gebruikt om gegevenssets toe te voegen die overeenkomen met een patroon, worden nieuwe tabellen die aan het patroon voldoen, gedetecteerd en toegevoegd.	Ja	Ja	Nee	Nee

Tekenvervanging

U kunt brontekens in de doeldatabase vervangen of verwijderen of u kunt brontekens vervangen of verwijderen die niet door een geselecteerde tekenset worden ondersteund.

Alle tekens moeten worden gespecificeerd als Unicode-codepunten.
Tekens worden ook vervangen in controletabellen van de controletabellen.

Ongeldige waarden worden aangegeven met een rode driehoek in de rechterbovenhoek van de tabelcel. Als u met de muiscursor op de driehoek gaat staan, wordt het foutbericht getoond.

Transformaties op tabelniveau of algemene transformaties die voor de taak zijn gedefinieerd, worden uitgevoerd nadat de tekens zijn vervangen.
Vervangingsacties die zijn gedefinieerd in de tabel Brontekens substitueren of verwijderen worden uitgevoerd voorafgaand aan de vervangingsactie die is gedefinieerd in de tabel Brontekens substitueren of verwijderen die niet worden ondersteund door de geselecteerde tekenset.
Tekenvervanging ondersteunt geen LOB‑gegevenstypen.

Brontekens vervangen of verwijderen

Gebruik de tabel Brontekens substitueren of verwijderen om vervangingen voor specifieke brontekens te definiëren. Dit kan bijvoorbeeld handig zijn als de Unicode-weergave van een teken anders is op de bron- en doelplatformen. Op Linux bijvoorbeeld wordt het minusteken in de Shift_JIS tekenset vertegenwoordigd door U+2212, maar op Windows wordt dit vertegenwoordigd als U+FF0D.

Substitutie-acties
Naar	Doe dit
Definieer substitutie-acties.	Klik boven de tabel op de knop Teken toevoegen. Geef een bronteken en doelteken op in de velden Bronteken en Teken substitueren. Als u bijvoorbeeld de letter 'a' wilt vervangen door de letter 'e', geeft u 0061 en 0065 op. Informatie Als u het opgegeven bronteken wilt verwijderen, geeft u 0 op in de kolom Teken substitueren. Herhaal stap 1-2 om aanvullende tekens te vervangen of verwijderen.
Het opgegeven bron- of doelteken bewerken	Klik op aan het einde van een rij en selecteer Bewerken.
Vermeldingen uit de tabel verwijderen	Klik op aan het einde van een rij en selecteer Verwijderen.

Brontekens vervangen of verwijderen die niet worden ondersteund door de geselecteerde tekenset.

Gebruik de tabel Niet-ondersteunde tekens per tekenset om een afzonderlijk vervangingsteken te definiëren voor alle tekens die niet worden ondersteund door de geselecteerde tekenset.

Substitutie-acties voor niet-ondersteunde tekens
Naar	Doe dit
Definieer of bewerk een substitutie-actie.	Selecteer een tekenset in de vervolgkeuzelijst Tekenset in de tabel. Tekens die niet worden ondersteund door de geselecteerde tekenset worden vervangen in het doel door het teken dat hieronder in stap 2 is opgegeven. In de kolom Teken substitueren klikt u in de kolom en geeft u het vervangingsteken op. Geef bijvoorbeeld 0061 op als u alle niet-ondersteunde tekens wilt vervangen door de letter 'a'. Informatie Geef 0 op om alle niet-ondersteunde tekens te verwijderen.
Schakel de substitutie-actie uit.	Selecteer de lege vermelding in de vervolgkeuzelijst Tekenset.

Gegevenssetsegmenten parallel laden

Deze instelling is niet beschikbaar voor SaaS-applicatiebronnen en is alleen beschikbaar voor een specifieke subset van bron- en doeldatabases.

Tijdens een volledige lading kunt u het laden van grote gegevenssets versnellen door de gegevensset in segmenten te splitsen, die parallel worden geladen. Tabellen kunnen worden gesplitst op gegevensbereiken, alle partities, alle subpartities of specifieke partities.

Voor meer informatie, zie Segmenten van gegevensverzamelingen parallel repliceren.

Meer opties

Deze opties worden niet weergegeven in de gebruikersinterface omdat ze alleen relevant zijn voor specifieke versies of omgevingen. Deze opties dienen daarom niet te worden ingesteld tenzij hier expliciet opdracht voor wordt gegeven door Qlik Support of in de productdocumentatie.

Kopieer de optie naar het veld Kenmerknaam toevoegen en klik op Toevoegen om een optie in te stellen. Stel vervolgens de waarde in of schakel de optie in op basis van de instructies die u hebt ontvangen.

CDC plannen voor lake-tussenopslagtaken

Voor het gebruik van de Scheduler is ofwel de rol Kan bedienen of de rol Kan bewerken vereist.

In de volgende use cases moet u een planningsinterval definiëren om de doelgegevens up-to-date te houden:

Toegang tot een gegevensbron zonder Data Movement gateway
Een preview-connector voor een SaaS-applicatie gebruiken. Raadpleeg de Help van de connector om te zien of uw connector in preview is.
Bij het vastleggen van wijzigingen uit een SAP OData-bron met behulp van de optie Zoals gepland.

De planning bepaalt hoe vaak de doelgegevenssets worden bijgewerkt met wijzigingen in de brongegevenssets. Terwijl de planning de updatefrequentie bepaalt, bepaalt het type gegevensset de updatemethode. Als de bronmetagegevens CDC (wijzigingsgegevens vastleggen) ondersteunen, worden alleen de wijzigingen van de brongegevens gerepliceerd en toegepast op de betreffende doeltabellen. Ondersteunen de brongegevensverzamelingen CDC niet (zoals, Weergaven), worden wijzigingen toegepast door alle brongegevens te laden naar de betreffende doeltabellen. In het geval enkele brongegevensverzamelingen CDC ondersteunen en andere niet, worden er twee afzonderlijke subtaken gemaakt (ervan uitgaand dat de bijwerkmethode Wijzigingsgegevens vastleggen (CDC) is ingesteld op geselecteerd): één voor het laden van de gegevensverzamelingen die geen CDC ondersteunen en één subtaak voor het vastleggen van de wijzigingen naar gegevensverzamelingen die CDC wel ondersteunen. In dit geval wordt het ten zeerste aanbevolen om niet hetzelfde planningsinterval voor beide taken aan te houden (als u besluit de updatefrequentie in de toekomst te wijzigen), om de gegevensconsistentie te waarborgen.

De planning wijzigen:

Open uw pijplijnproject en doe vervolgens een van de volgende dingen:
- Klik in de takenweergave op op een gegevenstaak en selecteer Planning.
- Klik in de pijplijnweergave op op een gegevenstaak en selecteer Planning.
- Open de replicatietaak en klik op de werkbalkknop Planning.
Wijzig de planningsinstellingen naar wens en klik vervolgens op OK.

Als een gegevenstaak nog wordt uitgevoerd wanneer de volgende geplande uitvoering moet starten, worden de volgende geplande uitvoering(en) overgeslagen totdat de taak is voltooid.

Een gemiste uitvoering uitvoeren voor een taak op basis van Data Movement gateway

Soms kan een netwerkprobleem ertoe leiden dat de verbinding met Data Movement gateway wordt verbroken. Als de verbinding met Data Movement gateway niet hersteld is vóór de volgende geplande run, kan de gegevenstaak niet volgens schema worden uitgevoerd. In dergelijke gevallen kunt u kiezen of u al dan niet een run onmiddellijk wilt uitvoeren nadat de verbinding is hersteld.

De standaardinstellingen voor alle Data Movement gateways zijn gedefinieerd in het activiteitencentrum Beheer. U kunt deze instellingen voor afzonderlijke taken overschrijven, zoals hieronder wordt beschreven.

Dit doet u als volgt

Open uw project en doe vervolgens een van de volgende dingen:
- Klik in de takenweergave op op de gegevenstaak en selecteer Planning.
- Klik in de pijplijnweergave op op de gegevenstaak en selecteer Planning.
- Open de gegevenstaak en klik op de werkbalkknop Planning.
Het dialoogvenster Planning - <taak> wordt geopend.
Schakel Aangepaste instellingen gebruiken voor deze taak in.
Kies onder aan het dialoogvenster een van de volgende opties voor Gemiste geplande taken uitvoeren.
- Zo snel mogelijk en vervolgens zoals gepland als het belangrijk is om een taak uit te voeren vóór de volgende geplande instantie
- Zoals gepland om de taak uit te voeren bij de volgende geplande instantie
Sla uw instellingen op.

Zie ook: Een taakuitvoering uitvoeren na een gemist schema.

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een tikfout, een ontbrekende stap of een technische fout – laat het ons weten!

Geef hier uw feedback