Instellingen voor tussenopslag
U kunt instellingen configureren voor de gegevenstaak voor tussenopslag.
-
Open de taak voor tussenopslag en klik op Instellingen in de werkbalk.
Het dialoogvenster Instellingen: <Taaknaam> wordt geopend. De beschikbare instellingen worden hieronder beschreven.
Algemeen
-
Database
Database die in het doel moet worden gebruikt.
InformatieDeze optie is niet beschikbaar bij de tussenopslag van gegevens naar Qlik Cloud (via Amazon S3). -
Taakschema
U kunt de naam van het schema van de gegevenstaak voor tussenopslag wijzigen. De standaardnaam is landing.
InformatieDeze optie is niet beschikbaar bij de tussenopslag van gegevens naar Qlik Cloud (via Amazon S3). -
Standaardhoofdlettergebruik van schemanaam
U kunt het standaardhoofdlettergebruik voor alle schemanamen instellen. Als uw database is geconfigureerd om hoofdlettergebruik af te dwingen, heeft deze optie geen effect.
-
Voorvoegsel voor alle tabellen en weergaven
U kunt een voorvoegsel instellen voor alle tabellen en weergaven die met deze taak zijn gemaakt.
InformatieDeze optie is niet beschikbaar bij de tussenopslag van gegevens naar Qlik Cloud (via Amazon S3).InformatieU moet een uniek voorvoegsel gebruiken als u een databaseschema in meerdere gegevenstaken wilt gebruiken. -
Bijwerkmethode
Het tussenopslagtaak start altijd met een volledige lading. Nadat de volledige lading is afgerond, kunt u de tijdelijk opgeslagen gegevens met een van de volgende methoden up-to-date houden:
InformatieU kunt de bijwerkmethode niet wijzigen zodra de voorbereiding van de tussenopslaggegevenstaak is afgerond.-
Vastleggen van wijzigingsgegevens (CDC)
De tijdelijk opgeslagen gegevens worden up-to-date gehouden met behulp van de CDC-technologie (Change Data Capture). CDC wordt mogelijk niet ondersteund door alle gegevensbronnen. CDC legt geen DDL-bewerkingen vast, zoals het hernoemen van kolommen of wijzigingen in metagegevens.
Als uw gegevens ook weergaven of tabellen bevatten die geen CDC ondersteunen, worden er twee gegevenspijplijnen gemaakt. Een pijplijn met alle tabellen die CDC ondersteunen en een andere pijplijn met alle andere tabellen en weergaven waarbij Opnieuw laden en vergelijken als bijwerkmethode wordt gebruikt.
-
Opnieuw laden en vergelijken
Alle tijdelijk opgeslagen gegevens worden opnieuw vanuit de bron geladen. Dit is nuttig als uw bron CDC niet ondersteunt, maar kan worden gebruikt met een willekeurige ondersteunde gegevensbron.
U kunt de nieuwe ladingen regelmatig plannen.
-
-
Laadmethode
Bij replicatie naar een Snowflake-doel kunt u een van de volgende laadmethoden kiezen:
-
Bulksgewijs laden (de standaardinstelling)
Als u Bulksgewijs laden selecteert, kunt u, de laadparameters afstemmen in de op het tabblad Gegevens uploaden.
-
Snowpipe Streaming
InformatieSnowpipe Streaming is alleen beschikbaar voor selectie als aan de volgende voorwaarden wordt voldaan:
- Alleen de bijwerkmethode Wijzigingsgegevens vastleggen (CDC) is ingeschakeld.
- Het authenticatiemechanisme in de Snowflake-connector is ingesteld op Sleutelpaar.
- Als u Data Movement gateway gebruikt, is versie 2024.11.45 of later vereist.
Als u Snowpipe Streaming selecteert, zorg er dan voor dat u bekend bent met de beperkingen en overwegingen bij het gebruik van deze methode. Bovendien, als u Snowpipe Streaming selecteert en vervolgens overschakelt naar de bijwerkmethode Opnieuw laden en vergelijken, zal de laadmethode automatisch terugschakelen naar Bulksgewijs laden.
De belangrijkste redenen om Snowpipe Streaming te verkiezen boven Bulksgewijs laden zijn:
-
Minder duur: aangezien Snowpipe Streaming geen gebruik maakt van het Snowflake-warehouse, zouden de bedrijfskosten aanzienlijk lager moeten zijn, hoewel dit afhangt van uw specifieke gebruikssituatie.
-
Verminderde latentie: aangezien de gegevens rechtstreeks naar de doeltabellen worden gestreamd (in tegenstelling tot via fasering), zou de replicatie van de gegevensbron naar de doeltabellen sneller moeten zijn.
TipWanneer u Snowpipe Streaming gebruikt, kan de eerste volledige lading aanzienlijk langzamer zijn dan bij Bulksgewijze lading. Om de laadprestaties te optimaliseren, vooral bij het laden van grote gegevensverzamelingen, kunt u het beste Snowpipe Streaming gebruiken in combinatie met de functie Parallel laden. -
-
Map die in de staging-ruimte moet worden gebruikt
Voor dataplatforms die een staging-ruimte vereisen (bijvoorbeeld Databricks en Azure Synapse Analytics), kunt u selecteren welke map moet worden gebruikt bij de tussenopslag van gegevens.
-
Standaardmap
Hiermee wordt een map gemaakt met de standaardnaam: <projectnaam>/<naam van gegevenstaak>.
-
Hoofdmap
Sla gegevens op in de hoofdmap van de opslag.
InformatieDeze optie is alleen beschikbaar bij de tussenopslag van gegevens naar Qlik Cloud (via Amazon S3). -
Map
Geef een mapnaam op die u wilt gebruiken.
-
-
Verwerkingsinterval wijzigen
U kunt het interval instellen tussen het verwerken van wijzigingen uit de bron.
InformatieDeze optie is alleen beschikbaar bij de tussenopslag van gegevens naar Qlik Cloud (via Amazon S3). -
Proxyserver bij gebruik van Data Movement gateway
InformatieDeze optie is alleen beschikbaar bij toegang tot doelen via Data Movement gateway.U kunt ervoor kiezen om een proxyserver te gebruiken wanneer de Data Movement gateway verbinding maakt met het clouddatawarehouse en de opslagruimte.
Voor meer informatie over het configureren van de Data Movement gateway voor het gebruik van een proxyserver, raadpleegt u De Qlik Cloud-tenant en een proxyserver instellen.
-
Proxy gebruiken om verbinding te maken met clouddatawarehouse
InformatieBeschikbaar bij gebruik van Snowflake, Google BigQuery en Databricks. -
Proxy gebruiken om verbinding te maken met opslag
InformatieBeschikbaar bij gebruik van Azure Synapse Analytics, Amazon Redshift en Databricks.
-
Gegevens uploaden
Sommige instellingen op dit tabblad zijn alleen relevant voor specifieke doelplatforms.
Relevant voor alle dataplatforms behalve Qlik Cloud en Snowflake
Maximale bestandsgrootte (MB)
De maximumgrootte die een bestand kan bereiken voordat het wordt gesloten. Kleinere bestanden worden mogelijk sneller geüpload (afhankelijk van het netwerk) en verbeteren de prestaties indien ze worden gebruikt in combinatie met de optie Parallelle uitvoering. Het wordt over het algemeen afgeraden om de database te vullen met kleine bestanden.
Alleen relevant voor Google BigQuery
Compressie gebruiken
Indien geselecteerd, worden de CSV-bestanden gecomprimeerd (met gzip) voordat ze naar Google BigQuery worden geüpload.
Vereist Data Movement gateway 2023.5.16 of later.
Alleen relevant voor Snowflake
Op het tabblad Algemeen kunt u kiezen of u de gegevens naar Snowflake wilt laden met behulp van Bulkladen of Snowpipe Streaming. Wanneer Snowpipe Streaming is geselecteerd, wordt het tabblad Gegevens uploaden niet weergegeven. Wanneer Bulkladen is geselecteerd, zijn de volgende instellingen beschikbaar:
-
Maximale bestandsgrootte (MB): Relevant voor de initiële volledige lading en CDC. De maximale grootte die een bestand kan bereiken voordat het naar het doel wordt geladen. Als u prestatieproblemen ondervindt, probeer dan deze parameter aan te passen.
-
Aantal bestanden dat in een batch moet worden geladen: Alleen relevant voor de initiële volledige lading. Het aantal bestanden dat in één batch moet worden geladen. Als u prestatieproblemen ondervindt, probeer dan deze parameter aan te passen.
Voor een beschrijving van de laadmethoden Bulkladen en Snowpipe Streaming, raadpleegt u Algemeen.
Metagegevens
LOB-kolommen
LOB-kolommen opnemen en kolomgrootte beperken tot (KB):
U kunt ervoor kiezen om LOB-kolommen in de taak op te nemen en de maximale LOB-grootte in te stellen. LOB's die groter zijn dan de maximale grootte, worden afgekapt.
Beheertabellen
Selecteer welke van de volgende beheertabellen u op het doelplatform wilt maken:
- Status van tussenopslag: Biedt details over de huidige taak voor tussenopslag, waaronder de taakstatus, de hoeveelheid geheugen die door de taak wordt verbruikt, het aantal wijzigingen dat nog niet is toegepast op het dataplatform en de positie in het broneindpunt van waaruit Data Movement gateway momenteel leest.
- Opgeschorte tabellen: Biedt een lijst met opgeschorte tabellen en de reden waarom ze zijn opgeschort.
- Geschiedenis van tussenopslag: Biedt informatie over de taakgeschiedenis, waaronder het aantal en het volume van de records die tijdens een taak voor tussenopslag zijn verwerkt, de latentie aan het einde van een CDC-taak en meer.
-
DDL-geschiedenis: Bevat een geschiedenis van alle ondersteunde DDL-wijzigingen die tijdens een taak zijn opgetreden.
De DDL‑geschiedenistabel wordt alleen ondersteund door de volgende doelplatformen:
-
Databricks
- Microsoft Fabric
- Amazon Redshift
- Als u Data Movement gateway gebruikt, moeten de volgende doelen versie 2024.11.14 of later hebben:
- Amazon S3
- Google-cloudopslag
- Snowflake
- Kafka - Als u Data Movement gateway gebruikt, is versie 2025.5.42 of later vereist.
- Als u Data Movement gateway gebruikt, moeten de volgende doelen versie 2025.11.1 of later hebben:
- Google BigQuery
- Google Cloud Alloy DB voor PostgreSQL (via de PostgreSQL-connector)
- Google Cloud SQL voor PostgreSQL (via de PostgreSQL-connector)
- Microsoft Azure Database voor PostgreSQL (via de PostgreSQL connector)
- PostgreSQL
-
Voor een gedetailleerde beschrijving van elk van de beheertabellen, raadpleegt u Controletabellen
Volledige lading
Prestatieafstemming
- Maximumaantal tabellen dat parallel moet worden geladen: Voer het maximumaantal tabellen in dat tegelijkertijd in het doel moet worden geladen. De standaardwaarde is 5.
-
Time-out voor transactieconsistentie (seconden): Voer het aantal seconden in dat moet worden gewacht tot openstaande transacties zijn gesloten, voordat de bewerking voor volledige lading begint. De standaardwaarde is 600 (10 minuten). De volledige lading start nadat de time-outwaarde is bereikt, zelfs als er nog openstaande transacties zijn.
InformatieOm transacties te repliceren die openstonden toen de volledige lading begon, maar pas werden vastgelegd nadat de time-outwaarde was bereikt, moet u de doeltabellen opnieuw laden. - Vastleggingssnelheid tijdens volledige lading: Het maximumaantal gebeurtenissen dat samen kan worden overgedragen. De standaardwaarde is 10000.
Nadat de volledige lading is voltooid
Primaire sleutel of uniek maken: Selecteer deze optie als u het maken van de primaire sleutel of unieke index op het dataplatform wilt uitstellen tot nadat de volledige lading is voltooid.
Voor initiële lading
Bij het verplaatsen van gegevens vanuit een SaaS-applicatiebron, kunt u instellen hoe de initiële volledige lading moet worden uitgevoerd:
| Cachegegevens gebruiken |
Met deze optie kunt u cachegegevens gebruiken die zijn gelezen toen metagegevens met Volledige gegevensscan werden geselecteerd. Dit zorgt voor minder overhead met betrekking tot API-gebruik en quota, in verhouding tot wanneer de gegevens al zijn gelezen vanuit de bron. Alle wijzigingen sinds de initiële gegevensscan kunnen worden opgepikt door Change data capture (CDC). |
| Gegevens laden vanuit bron |
Deze optie voert een nieuwe lading vanuit de gegevensbron uit. Deze optie is nuttig als:
|
Foutafhandeling
Gegevensfouten
Afhandeling van gegevensfouten wordt alleen ondersteund met de updatemethode Change Data Capture (CDC).
Voor fouten in het afkappen van gegevens: Selecteer wat er moet gebeuren als er een afkapping plaatsvindt in een of meer specifieke records. U kunt een van de volgende opties in de lijst selecteren:
- Negeren: De taak wordt voorgezet en de fout wordt genegeerd.
- Tabel opschorten: De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord wordt omgezet naar een foutstatus en de gegevens worden niet gerepliceerd
- Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.
Voor overige gegevensfouten: Selecteer wat er moet gebeuren als er een fout ontstaat in één of meer specifieke records. U kunt een van de volgende opties in de lijst selecteren:
- Negeren: De taak wordt voorgezet en de fout wordt genegeerd.
- Tabel opschorten: De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord wordt omgezet naar een foutstatus en de gegevens worden niet gerepliceerd
- Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.
Foutverwerking escaleren wanneer gegevensfouten ontstaan (per tabel): Schakel dit selectievakje in om foutverwerking te escaleren als het aantal niet-afgekapte gegevensfouten (per tabel) het opgegeven aantal bereikt. Geldige waarden zijn 1-10.000.
Escalatie-actie: Kies wat er moet gebeuren wanneer foutverwerking wordt geëscaleerd. Houd er rekening mee dat de beschikbare acties afhankelijk zijn van de actie die is geselecteerd in de vervolgkeuzelijst Voor overige gegevensfouten die hierboven wordt beschreven.
-
Tabel opschorten (standaard): De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord worden omgezet naar een foutstatus en de gegevens worden niet landed.
- Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.
Tabelfouten
Aantal nieuwe pogingen voordat een tabel fout wordt geretourneerd
Met deze optie kunt u bepalen wanneer het beleid voor tabel foutafhandeling wordt geactiveerd. Standaard, nadat een tabel fout is opgetreden, wordt de tabel opgeschort of de taak gestopt (afhankelijk van de geselecteerde actie) na drie nieuwe pogingen. Soms treedt een tabel fout op als gevolg van gepland onderhoud van de SaaS-applicatie. In deze gevallen is het standaard aantal nieuwe pogingen mogelijk niet voldoende om het onderhoud te voltooien voordat het beleid voor tabel foutafhandeling wordt geactiveerd. Dit hangt ook af van het planningsinterval van de taak, aangezien een nieuwe poging wordt uitgevoerd elke keer dat de taak wordt uitgevoerd. Dus, bijvoorbeeld, als u een taak plant om elk uur uit te voeren en de SaaS-applicatie offline wordt gehaald voor onderhoud precies wanneer de taak begint te draaien, zorgt de standaard van drie nieuwe pogingen ervoor dat de SaaS-applicatie tot drie uur offline kan zijn zonder dat het beleid voor tabel foutafhandeling wordt geactiveerd. Een langer onderhoudsvenster zou vereisen dat u het aantal nieuwe pogingen verhoogt (of de planning wijzigt) om te voorkomen dat het beleid voor tabel foutafhandeling wordt geactiveerd.
Samenvattend, als u weet dat uw SaaS-applicatie periodiek onderhoud ondergaat, is het een goede gewoonte om het aantal nieuwe pogingen te verhogen volgens de planning, zodat het onderhoud kan worden voltooid zonder dat het beleid voor tabel foutafhandeling wordt geactiveerd.
-
Deze optie wordt alleen weergegeven voor taken die zijn geconfigureerd met een Lite- of Standard SaaS-applicatieconnector.
-
Als u Data Movement gateway gebruikt, is versie 2024.11.70 of later vereist.
Wanneer een tabelfout ontstaat: selecteer een van het volgende uit de vervolgkeuzelijst:
- Tabel opschorten (standaard): de taak wordt voortgezet, maar gegevens van de tabel met het foutrecord worden omgezet naar een foutstatus en de gegevens worden niet gerepliceerd.
- Taak stoppen: de taak wordt gestopt en handmatige tussenkomst is vereist.
Foutverwerking escaleren wanneer tabelfouten ontstaan (per tabel):: schakel dit selectievakje in om foutverwerking te escaleren als het aantal tabelfouten (per tabel) het opgegeven aantal bereikt. Geldige waarden zijn 1-10.000.
Escalatie-actie: het escalatiebeleid voor tabelfouten is ingesteld op Taak stoppen en dit kan niet worden gewijzigd.
Omgeving
-
Maximum aantal nieuwe pogingen: Selecteer deze optie en geef vervolgens het maximumaantal pogingen op voor het opnieuw proberen van een taak als er een herstelbare omgevingsgerelateerde fout plaatsvindt. Nadat u hebt geprobeerd de taak het opgegeven aantal keer opnieuw uit te voeren, wordt de taak gestopt en moet u handmatig ingrijpen.
Schakel het selectievakje uit of geef '0' op om de taak niet te proberen de taak opnieuw uit te voeren.
Geef '-1' op om een oneindig aantal keren te proberen de taak opnieuw uit te voeren.
-
Interval tussen nieuwe pogingen (seconden): Gebruik de teller om het aantal seconden te selecteren of in te voeren dat het systeem wacht tussen nieuwe pogingen.
Geldige waarden zijn 0-2.000.
-
- Interval voor opnieuw proberen bij lange storingen vergroten: Schakel dit selectievakje in om de interval voor opnieuw proberen te verhogen voor lange storingen. Als deze optie is ingeschakeld, verdubbelt de interval tussen elke nieuwe poging en de volgende poging totdat de Maximuminterval voor nieuwe pogingen is bereikt (en er door wordt gegaan met nieuwe pogingen op basis van de opgegeven maximuminterval).
- Maximuminterval voor nieuwe pogingen (seconden): Gebruik de teller om te selecteren of in te voeren hoeveel seconden er gewacht wordt tussen pogingen om een taak opnieuw uit te voeren als de optie Interval voor opnieuw proberen bij lange storingen vergroten is ingeschakeld. Geldige waarden zijn 0-2.000.
Afstemming van wijzigingsverwerking
Afstemming van transactionele offload
-
Lopende transacties offloaden naar schijf als:
Transactiegegevens worden meestal in het geheugen bewaard totdat ze volledig zijn vastgelegd in de bron of het doel. Transacties die groter zijn dan het toegewezen geheugen of die niet binnen de opgegeven tijdslimiet zijn vastgelegd, worden echter naar de schijf geoffload.
- Totale geheugengrootte voor alle transacties overschrijdt (MB): De maximale grootte die alle transacties in het geheugen in beslag kunnen nemen voordat ze naar de schijf worden geoffload. De standaardwaarde is 1024.
- Transactieduur overschrijdt (seconden): De maximale tijd dat elke transactie in het geheugen kan blijven voordat deze naar de schijf wordt geoffload. De duur wordt berekend vanaf het moment dat Qlik Talend Data Integration begon met het vastleggen van de transactie. De standaardwaarde is 60.
Batchafstemming
Sommige instellingen op dit tabblad zijn mogelijk niet van toepassing op alle doelen of doellaadmethoden.
Instellingen die van toepassing zijn op alle doelen behalve Qlik Cloud en Snowflake wanneer de "Laadmethode" "Snowpipe Streaming" is
- Gebatchte wijzigingen in intervallen toepassen:
-
Meer dan: De minimale wachttijd tussen elke toepassing van batchwijzigingen. De standaardwaarde is 1.
Het verhogen van de waarde Meer dan verlaagt de frequentie waarmee wijzigingen op het doel worden toegepast, terwijl de grootte van de batches toeneemt. Dit kan de prestaties verbeteren bij het toepassen van wijzigingen op doeldatabases die zijn geoptimaliseerd voor het verwerken van grote batches.
- Minder dan: De maximale wachttijd tussen elke toepassing van batchwijzigingen (voordat een time-out wordt gedeclareerd). Met andere woorden, de maximaal acceptabele latentie. De standaardwaarde is 30. Deze waarde bepaalt de maximale wachttijd voordat de wijzigingen worden toegepast, nadat de waarde Groter dan is bereikt.
-
Een batch geforceerd toepassen wanneer het verwerkingsgeheugen (MB) overschrijdt: De maximale hoeveelheid geheugen die moet worden gebruikt voor voorverwerking. De standaardwaarde is 500 MB.
Voor een maximale batchgrootte stelt u deze waarde in op de hoogste hoeveelheid geheugen die u aan de gegevenstaak kunt toewijzen. Dit kan de prestaties verbeteren bij het toepassen van wijzigingen op doeldatabases die zijn geoptimaliseerd voor het verwerken van grote batches.
-
Gebatchte wijzigingen gelijktijdig op meerdere tabellen toepassen: Het selecteren van deze optie zou de prestaties moeten verbeteren bij het toepassen van wijzigingen uit meerdere brontabellen.
-
Maximumaantal tabellen: Het maximumaantal tabellen waarop gebatchte wijzigingen gelijktijdig moeten worden toegepast. De standaardwaarde is vijf.
InformatieDeze optie wordt niet ondersteund bij gebruik van Google BigQuery als uw dataplatform. -
-
Het aantal toegepaste wijzigingen per wijzigingsverwerkingsinstructie beperken tot: Selecteer deze optie om het aantal toegepaste wijzigingen in een enkele wijzigingsverwerkingsinstructie te beperken. De standaardwaarde is 10.000.
InformatieDeze optie wordt alleen ondersteund bij gebruik van Google BigQuery als uw dataplatform.
Instellingen die alleen van toepassing zijn op Qlik Cloud en Snowflake wanneer de "Laadmethode" "Snowpipe Streaming" is
-
Minimumaantal wijzigingen per transactie: Het minimumaantal wijzigingen dat in elke transactie wordt opgenomen. De standaardwaarde is 1000.
InformatieDe wijzigingen worden toegepast op het doel als het aantal wijzigingen gelijk is aan of groter is dan de waarde Minimumaantal wijzigingen per transactie OF als de waarde Maximumtijd om transacties in batches te plaatsen voor toepassen (seconden) die hieronder wordt beschreven is bereikt - naargelang wat als eerste wordt bereikt. Omdat de frequentie van wijzigingen die worden toegepast op het doel door deze twee parameters wordt beheerd, worden wijzigingen in de bronrecords mogelijk niet direct in de doelrecords weergegeven.
- Maximumtijd om transacties in batches te plaatsen voor toepassen (seconden): De maximumtijd om transacties in batches te verzamelen voordat er een time-out optreedt. De standaardwaarde is 1.
Interval
Instellingen bij gebruik van SAP ODP en SaaS-applicatie (Lite) connectoren
-
Wijzigingen om de (minuten) lezen
De interval tussen het lezen van wijzigingen van de bron in minuten. Het geldige bereik ligt tussen 1 en 1440.
InformatieDeze optie is alleen beschikbaar wanneer de gegevenstaak is gedefinieerd met:
- Data Movement gateway
- Een van de volgende bronnen:
- SaaS-applicatie alleen via Lite-connectoren
- SAP ODP
- Alleen de bijwerkmethode Wijzigingsgegevens vastleggen (CDC).
Instellingen bij gebruik van de SAP OData-connector
Controleren op wijzigingen
-
Volgens het interval van delta-extractie Wanneer deze optie is geselecteerd, controleert de gegevenstaak op wijzigingen volgens het interval van delta-extractie.
InformatieHet interval begint na elke 'ronde'. Een ronde kan worden gedefinieerd als de tijd die de gegevenstaak nodig heeft om de wijzigingen uit de brontabellen te lezen en deze naar het doel te verzenden (als één transactie). De duur van een ronde varieert afhankelijk van het aantal tabellen en wijzigingen. Dus als u een interval van 10 minuten opgeeft en een ronde 4 minuten duurt, dan is de werkelijke tijd tussen het controleren op wijzigingen 14 minuten.-
Interval delta-extractie: De frequentie waarmee delta's uit uw systeem worden geëxtraheerd. De standaardinstelling is 60 seconden.
-
-
Zoals gepland: wanneer deze optie is geselecteerd, zal de gegevenstaak de delta één keer extraheren en dan stoppen. Het zal dan uitgevoerd blijven worden zoals gepland.
InformatieDeze optie is alleen relevant als het interval tussen de CDC-cycli 24 uur of meer is.Voor informatie over planning:
-
Tussenopslagtaken in een gegevenspijplijnproject, zie Taken plannen
-
Diverse afstemmingen
- Cachegrootte van instructies (aantal instructies): Het maximumaantal voorbereide instructies dat op de server moet worden opgeslagen voor latere uitvoering (bij het toepassen van wijzigingen op het doel). De standaardwaarde is 50. Het maximum is 200.
-
DELETE en INSERT bij het bijwerken van een primaire-sleutelkolom: Voor deze optie moet volledige aanvullende logboekregistratie zijn ingeschakeld in de brondatabase.
Schema-evolutie
Selecteer hoe u de volgende typen DDL-wijzigingen in het schema wilt afhandelen. Wanneer u de instellingen voor schema-evolutie hebt gewijzigd, moet u de taak opnieuw voorbereiden. De onderstaande tabel beschrijft welke acties beschikbaar zijn voor de ondersteunde DDL-wijzigingen.
| DDL-wijziging | Toepassen op doel | Negeren | Tabel opschorten | Taak stoppen |
|---|---|---|---|---|
| Kolom toevoegen | Ja | Ja | Ja | Ja |
| Naam van kolom wijzigen | Nee | Nee | Ja | Ja |
| Naam van tabel wijzigen | Nee | Nee | Ja | Ja |
| Gegevenstype van kolom wijzigen | Nee | Ja | Ja | Ja |
| Tabel maken
Als u een Selectieregel hebt gebruikt om datasets toe te voegen die overeenkomen met een patroon, worden nieuwe tabellen die aan het patroon voldoen, gedetecteerd en toegevoegd. |
Ja | Ja | Nee | Nee |
Tekenvervanging
U kunt brontekens in de doeldatabase vervangen of verwijderen of u kunt brontekens vervangen of verwijderen die niet door een geselecteerde tekenset worden ondersteund.
-
Alle tekens moeten worden gespecificeerd als Unicode-codepunten.
- Tekens worden ook vervangen in controletabellen van de controletabellen.
-
Ongeldige waarden worden aangegeven met een rode driehoek in de rechterbovenhoek van de tabelcel. Als u met de muiscursor op de driehoek gaat staan, wordt het foutbericht getoond.
-
Transformaties op tabelniveau of algemene transformaties die voor de taak zijn gedefinieerd, worden uitgevoerd nadat de tekens zijn vervangen.
-
Vervangingsacties die zijn gedefinieerd in de tabel Brontekens substitueren of verwijderen worden uitgevoerd voorafgaand aan de vervangingsactie die is gedefinieerd in de tabel Brontekens substitueren of verwijderen die niet worden ondersteund door de geselecteerde tekenset.
- Tekenvervanging ondersteunt geen LOB‑gegevenstypen.
Brontekens vervangen of verwijderen
Gebruik de tabel Brontekens substitueren of verwijderen om vervangingen voor specifieke brontekens te definiëren. Dit kan bijvoorbeeld handig zijn als de Unicode-weergave van een teken anders is op de bron- en doelplatformen. Op Linux bijvoorbeeld wordt het minusteken in de Shift_JIS tekenset vertegenwoordigd door U+2212, maar op Windows wordt dit vertegenwoordigd als U+FF0D.
| Naar | Doe dit |
|---|---|
|
Definieer substitutie-acties. |
|
|
Het opgegeven bron- of doelteken bewerken |
Klik op |
|
Vermeldingen uit de tabel verwijderen |
Klik op |
Brontekens vervangen of verwijderen die niet worden ondersteund door de geselecteerde tekenset.
Gebruik de tabel Niet-ondersteunde tekens per tekenset om een afzonderlijk vervangingsteken te definiëren voor alle tekens die niet worden ondersteund door de geselecteerde tekenset.
| Naar | Doe dit |
|---|---|
|
Definieer of bewerk een substitutie-actie. |
|
|
Schakel de substitutie-actie uit. |
Selecteer de lege vermelding in de vervolgkeuzelijst Tekenset. |
Meer opties
Deze opties worden niet weergegeven in de gebruikersinterface omdat ze alleen relevant zijn voor specifieke versies of omgevingen. Deze opties dienen daarom niet te worden ingesteld tenzij hier expliciet opdracht voor wordt gegeven door Qlik Support of in de productdocumentatie.
Kopieer de optie naar het veld Kenmerknaam toevoegen en klik op Toevoegen om een optie in te stellen. Stel vervolgens de waarde in of schakel de optie in op basis van de instructies die u hebt ontvangen.
Datasetsegmenten parallel laden
Tijdens een volledige lading kunt u het laden van grote datasets versnellen door de dataset in segmenten te splitsen, die parallel worden geladen. Tabellen kunnen worden gesplitst op gegevensbereiken, alle partities, alle subpartities of specifieke partities.
Voor meer informatie, raadpleegt u Segmenten van gegevensverzamelingen parallel aanvoeren.
Taken plannen
In de volgende use cases moet u een planningsinterval definiëren om de doelgegevens up-to-date te houden:
- Toegang tot een gegevensbron zonder Data Movement gateway
- Gebruik van een SaaS-applicatieconnector die de instelling Wijzigingen lezen elke niet ondersteunt
- Bij het vastleggen van wijzigingen uit een SAP OData-bron met behulp van de optie Zoals gepland.
De planning bepaalt hoe vaak de doeldatasets worden bijgewerkt met wijzigingen in de brondatasets. Terwijl de planning de updatefrequentie bepaalt, bepaalt het datasettype de updatemethode. Als de brondatasets CDC (Change data capture) ondersteunen, worden alleen de wijzigingen in de brongegevens gerepliceerd en toegepast op de bijbehorende doeltabellen. Als de brondatasets geen CDC ondersteunen (bijvoorbeeld weergaven), worden wijzigingen toegepast door alle brongegevens opnieuw te laden naar de bijbehorende doeltabellen. Als sommige brondatasets CDC ondersteunen en andere niet, worden er twee afzonderlijke subtaken gemaakt: één voor het opnieuw laden van de datasets die geen CDC ondersteunen, en de andere voor het vastleggen van de wijzigingen in datasets die wel CDC ondersteunen. In dit geval wordt het ten zeerste aanbevolen om niet hetzelfde planningsinterval voor beide taken aan te houden (als u besluit de updatefrequentie in de toekomst te wijzigen), om de gegevensconsistentie te waarborgen.
Raadpleeg Minimumaantal toegestane planningsintervallen voor informatie over minimum planningsintervallen op basis van type gegevensbron en abonnementsniveau.
Om de planning te wijzigen:
-
Open uw pijplijnproject en doe vervolgens een van de volgende dingen:
- Klik in de takenweergave op
op de gegevenstaak en selecteer Planning.
- Klik in de pijplijnweergave op
op de gegevenstaak en selecteer Planning.
- Open de taak voor tussenopslag en klik op de werkbalkknop Planning .
- Klik in de takenweergave op
- Wijzig de planningsinstellingen naar wens en klik vervolgens op OK.
Een gemiste uitvoering uitvoeren voor een taak op basis van Data Movement gateway
Soms kan een netwerkprobleem ertoe leiden dat de verbinding met Data Movement gateway wordt verbroken. Als de verbinding met Data Movement gateway niet hersteld is vóór de volgende geplande run, kan de gegevenstaak niet volgens schema worden uitgevoerd. In dergelijke gevallen kunt u kiezen of u al dan niet een run onmiddellijk wilt uitvoeren nadat de verbinding is hersteld.
De standaardinstellingen voor alle Data Movement gateways zijn gedefinieerd in het activiteitencentrum Beheer. U kunt deze instellingen voor individuele taken overschrijven, zoals hieronder wordt beschreven.
Om dit te doen
-
Open uw project en doe vervolgens een van de volgende dingen:
-
Klik in de takenweergave op
op de gegevenstaak en selecteer Planning.
-
Klik in de pijplijnweergave op
op de gegevenstaak en selecteer Planning.
-
Open de gegevenstaak en klik op de werkbalkknop Planning .
Het dialoogvenster Planning - <taak> wordt geopend.
-
-
Schakel Aangepaste instellingen gebruiken voor deze taak in.
-
Kies onderaan het dialoogvenster een van de volgende opties voor Gemiste geplande taken uitvoeren.
-
Zo snel mogelijk en vervolgens zoals gepland als het belangrijk is om een taak uit te voeren vóór de volgende geplande instantie
-
Zoals gepland om de taak uit te voeren bij de volgende geplande instantie
-
-
Sla uw instellingen op.