Instellingen voor cloudopslagdoelen
U kunt de standaardinstellingen voor het tijdelijk opslaan in een datalake naar wens aanpassen.
Algemeen
Bijwerkmethode
U kunt gegevens tijdelijk opslaan in twee verschillende modi. U kunt de modus niet wijzigen nadat de tussenopslaagtaak voor datalake is voorbereid.
-
Vastleggen van wijzigingsgegevens (CDC): De tussenopslagtaak van de datalake start met een volledige lading (waarbij alle geselecteerde tabellen tijdelijk worden opgeslagen). De tijdelijk opgeslagen gegevens worden up-to-date gehouden met behulp van de CDC-technologie (Change Data Capture).
InformatieCDC (vastleggen van wijzigingsgegevens) van DDL-bewerkingen wordt niet ondersteund.Bij het werken met Gateway voor gegevensverplaatsing worden wijzigingen van de bron vrijwel direct vastgelegd. Als u werkt zonder Gateway voor gegevensverplaatsing, worden wijzigingen vastgelegd volgens de planningsinstellingen. Ga voor meer informatie naar Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing.
- Opnieuw laden: Voert een volledige lading uit van de gegevens van de geselecteerde brontabellen naar het doelplatform en maakt indien nodig de doeltabellen. De volledige lading vindt automatisch plaats als de taak is gestart, maar kan indien mogelijk ook handmatig of periodiek worden uitgevoerd.
Te gebruiken map
Selecteer een van de volgende, op basis van de bucketmap waarnaar de bestanden geschreven moeten worden:
- Standaardmap: De standaardmapindeling is <uw-project-naam>/<uw-taak-naam>
- Hoofdmap: De bestanden worden direct naar de bucket geschreven.
-
Geef: Geef de naam van de map op. De map wordt gemaakt tijdens de uitvoering van de tussenopslagtaak van de datalake als de map niet bestaat.
Informatie De mapnaam kan geen speciale tekens bevatten (zoals, @, #, !, enz.).
Gegevenspartities wijzigen
Bij een standaard tussenopslagtaak worden de gegevens in een willekeurige volgorde in het doel opgeslagen. Met Gegevenspartitie wijzigen kunnen wijzigingsgegevens van veel tabellen consistent worden verwerkt. U kunt de duur van partities evenals als de basistijd van de partities definiëren om de algehele consistentie van de gepartioneerde gegevens te garanderen (d.w.z. geen gedeeltelijke transacties, geen orderkoppen zonder orderrijen enz.).
Informatie over de partities wordt geregistreerd in de controletabel attrep_cdc_partitions in de doeldatabase. U kunt deze informatie gebruiken om gepartioneerde gegevens te identificeren die nog verder verwerkt moeten worden.
De partitioneringsopties zijn als volgt:
-
Partitie om de - Geef de lengte (in uren en minuten) van elke partitie op.
InformatieAanbevolen wordt om een partitielengte van meer dan één uur op te geven. De latentie verbetert mogelijk als u een partitielengte van minder dan één uur opgeeft, maar veel partities in het doel maken kan ook invloed hebben op de prestaties (van het doel), met name in systemen met veel wijzigingen.
Als u een taak hervat van de tijd voordat de laatste partitie is gemaakt, schrijft de tussenopslagtaak voor datalake naar een partitie die al is gesloten.
- Basistijd partitionering - Partities worden gemaakt gedurende een periode van 24 uur die wordt berekend volgens de gespecificeerde Basistijd partitionering in de brondatabase (in UTC-tijd). Bijvoorbeeld: een partitie-interval van 8 uur met een Basistijd partitionering van 02:00 uur, maakt de volgende partities: 02:00-10:00, 10:00-18:00 en 18:00-02:00, maar niet noodzakelijkerwijs in die volgorde. Als een taak bijvoorbeeld om 01:00 uur is gestart, is het tijdsbestek van de eerste partitie 18:00-02:00. Daarnaast geldt dat als een taak in het midden van een partitie is gestart (bijvoorbeeld om 04:00), dan worden de wijzigingsgegevens ingevoegd in de partitie van 02:00-10:00, ook al zijn er vóór 04:00 geen wijzigingen vastgelegd.
Gegevens uploaden
Bestandskenmerken
Opmaak
U kunt kiezen om doelbestanden in de indeling CSV or JSON of Parquet te maken.
In een JSON-bestand wordt elk record vertegenwoordigt door een afzonderlijke regel, zoals in het volgende voorbeeld:
{ "book_id": 123, "title": "Alice in Wonderland", "price": 6.99, "is_hardcover": false }
{ "book_id": 456, "title": "Winnie the Pooh", "price": 6.49, "is_hardcover": true }
{ "book_id": 789, "title": "The Cat in the Hat", "price": 7.23, "is_hardcover": true }
Zie ook: Eigenschappen van inhoudstype en inhoudsversleuteling
- Als u de indeling JSON of Parquet kiest, worden de volgende velden verborgen omdat ze alleen relevant zijn voor de CSV-indeling. Veldscheidingsteken, Recordscheidingsteken, Null-waarde, Aanhalingsteken, Wisselteken aanhalingsteken en Metagegevenskoptekst toevoegen.
- De volgende velden zijn alleen relevant voor de Parquet-indeling: Parquet-versie, Eenheid Parquet-tijdstempel en Maximale LOB-grootte voor Parquet (kB).
Voor informatie over het toewijzen van gegevenstypen bij het gebruik van de Parquet-indeling en de bijbehorende beperkingen, gaat u naar Mapping from Qlik Cloud data types to Parquet
Veldscheidingsteken
Het scheidingsteken dat wordt gebruikt om velden (kolommen) in de doelbestanden te scheiden. De standaardinstelling is een komma.
Voorbeeld van een komma als scheidingsteken gebruiken:
"mike","male"
Scheidingsteken kunnen standaardtekens of een hexadecimale (hex) waarde zijn. U moet het prefix 0x
gebruiken om een hexadecimaal scheidingsteken (bijv. 0x01 = SOH
) aan te geven. In de velden Veldscheidingsteken, Recordscheidingsteken en Null-waarde kan het scheidingsteken uit aaneengeschakelde hex-waarden bestaan (bijv. 0x0102
= SOHSTX
), terwijl in de velden Aanhalingsteken en Wisselteken aanhalingsteken kan dit alleen een afzonderlijke hex-waarde zijn.
Het hexadecimaal getal 0x00
wordt niet ondersteund (d.w.z. alleen 0x01
-0xFF
wordt ondersteund).
Null-waarde
De tekenreeks die wordt gebruikt om een null-waarde in de doelbestanden aan te geven.
Voorbeeld (waarbij \n het recordscheidingsteken en @ de null-waarde is):
Recordscheidingsteken
Het scheidingsteken dat wordt gebruikt om records (rijen) in de doelbestanden te scheiden. De standaardinstelling is een regeleinde (\n
).
Voorbeeld:
Aanhalingsteken
Het teken dat wordt gebruikt aan het begin en einde van een tekstkolom. De standaardinstelling is dubbele aanhalingstekens ("). Als een kolom die kolomscheidingstekens bevat tussen aanhalingstekens wordt geplaatst, worden de kolomscheidingstekens geïnterpreteerd als werkelijke gegevens en niet als kolomscheidingstekens.
Voorbeeld (waarbij @ het aanhalingsteken is):
Wisselteken aanhalingsteken
Het teken dat wordt gebruik om het aanhalingsteken niet te gebruiken in de werkelijke gegevens. De standaardinstelling is dubbele aanhalingstekens (").
Voorbeeld (waarbij " het aanhalingsteken en \ het wisselteken is):
Parquet-versie
Selecteer welke versie wordt gebruikt op basis van de versie die het doelplatform ondersteunt. Houd er rekening mee dat Parquet versie 1.0 alleen de tijdstempeleenheid MICRO ondersteunt, terwijl Parquet-versie 2.6 zowel de tijdstempeleenheden MICRO als NANO ondersteunt.
Eenheid Parquet-tijdstempel
Als de Parquet-versie is ingesteld op 2.6, kiest u MICRO of NANO. Als de Parquet-versie is ingesteld op 1.0, wordt alleen MICRO ondersteund.
Maximale LOB-grootte voor Parquet (kB)
De standaard maximum LOB-grootte is 64 KB en de maximumwaarde die in dit veld kunt opgeven is 10.000 KB. Voor de verwerking van LOB-kolommen zijn grotere hulpbronnen vereist, wat van invloed is op de prestaties. Verhoog deze waarde alleen als u LOB-gegevens repliceert die groter zijn dan 64 KB en alle LOB‑gegevens naar het doel gerepliceerd moeten worden.
Maximumbestandsgrootte
De maximumgrootte die een bestand kan bereiken voordat het wordt gesloten (en optioneel wordt gecomprimeerd).
De maximumgrootte die een bestand kan bereiken voordat het wordt gesloten. Kleinere bestanden worden mogelijk sneller geüpload (afhankelijk van het netwerk) en verbeteren de prestaties indien ze worden gebruikt in combinatie met de optie Parallelle uitvoering. Het wordt over het algemeen afgeraden om de database te vullen met kleine bestanden.
Bestanden comprimeren met
Kies een van de compressie-opties om de doelbestanden te comprimeren of GEEN (standaardinstelling) om ze ongecomprimeerd te laten. De beschikbare compressie-opties worden bepaald door de geselecteerde bestandsindeling.
Metagegevenskoptekst toevoegen
U kunt eventueel een veldnamenrij toevoegen aan de gegevensbestanden. De veldnamenrij kan de namen van de bronkolommen en/of de tussenliggende (d.w.z. Qlik Talend Data Integration) gegevenstypen bevatten.
Voorbeeld van een doelbestand met een veldnamenrij als zowel Met kolomnamen als Met gegevenstypen is geselecteerd:
Position:DECIMAL(38,0),Color:VARCHAR(10)
1,"BLUE"
2,"BROWN"
3,"RED"
...
Verwerken wijzigen
In deze sectie worden de voorwaardelijke instellingen in Verwerken wijzigen beschreven.
Wijzigen toepassen/opslaan als
- Bestandsgrootte bereikt: geef de maximumgrootte op van wijzigingsgegevens die moeten worden samengevoegd voordat u het bestand uploadt naar het doel.
- Verstreken tijd bereikt: verstreken tijd bereikt x.
Metagegevensbestanden
Als de optie Metagegevensbestanden maken in de doelmap is geselecteerd voor elk gegevensbestand, wordt een bijbehorend metagegevensbestand met de extensie .dfm gemaakt in de opgegeven doelmap. De metegegevensbestanden geven extra informatie over de taak/gegevens, zoals het bronconnectortype, de naam van de brontabel, het aantal records in het gegevensbestand, enzovoort.
Voor een volledige beschrijving van het metagegevensbestand en mogelijke gebruikstoepassingen gaat u naar Beschrijving van het metagegevensbestand
Metagegevens
LOB-kolommen
-
LOB-kolommen opnemen en kolomgrootte beperken tot (KB):
U kunt ervoor kiezen om LOB-kolommen in de taak op te nemen en de maximale LOB-grootte in te stellen. LOB's die groter zijn dan de maximum LOB-grootte worden afgekapt.
Controletabellen
Selecteer welke van de volgende controletabellen in het doelplatform moeten worden aangemaakt:
- Replicatiestatus Geeft details over de huidige tussenopslagtaak, inclusief taakstatus, de hoeveelheid geheugen die door de taak wordt gebruikt, het aantal wijzigingen dat nog niet is toegepast op het gegevensplatform en de positie in de gegevensbron van waaruit de gegevens op dit moment worden gelezen.
- Tijdelijk ingetrokken tabellen: geeft een lijst met tijdelijk ingetrokken tabellen en de reden waarom ze tijdelijk zijn ingetrokken.
- Replicatiegeschiedenis: geeft informatie over de taakgeschiedenis, inclusief het aantal en volume aan records dat tijdens een tussenopslagtak wordt verwerkt, de latentie aan het einde van een CDC-taak en meer.
- Gegevenspartities wijzigen: geeft records van partities die zijn gemaakt in de doeldatabase vanwege Gegevenspartities wijzigen. U kunt deze informatie gebruiken om gepartioneerde gegevens te identificeren die nog verder verwerkt moeten worden.
Voor een gedetailleerde beschrijving van elk van de controletabellen, raadpleegt u Controletabellen
Volledige lading
Prestaties afstemmen
- Maximumaantal tabellen dat parallel wordt geladen: geef het maximumaantal tabellen op dat tegelijkertijd naar het doel wordt geladen. De standaardwaarde is 5.
-
Time-out bij transactionele consistentie (seconden):geef het aantal seconden op dat gewacht wordt voordat open transacties worden gesloten en de bewerking Volledige lading wordt gestart. De standaardwaarde is 600 (10 minuten). De volledige lading wordt gestart nadat de waarde van de time-out is bereikt, zelfs als er open transacties aanwezig zijn.
InformatieU moet de doeltabellen opnieuw laden om transacties te repliceren die open waren op het moment dat de volledige lading werd gestart, maar alleen werden doorgevoerd nadat de time-outwaarde is bereikt. - Frequentie doorvoeren tijdens volledige lading: het maximumaantal gebeurtenissen dat samen kan worden overgedragen. De standaardwaarde is 10000.
Nadat volledige lading is voltooid
Primaire sleutel of unieke index maken: selecteer deze optie als u het maken van de primaire sleutel of unieke index op het gegevensplatform wilt uitstellen tot de volledige lading is voltooid.
Voor initiële lading
Bij het verplaatsen van gegevens vanuit een SaaS-applicatiebron, kunt u instellen hoe de initiële volledige lading moet worden uitgevoerd:
Cachegegevens gebruiken |
Met deze optie kunt u cachegegevens gebruiken die zijn gelezen toen metagegevens met Volledige gegevensscan werden geselecteerd. Dit zorgt voor minder overhead met betrekking tot API-gebruik en quota, in verhouding tot wanneer de gegevens al zijn gelezen vanuit de bron. Alle wijzigingen sinds de initiële gegevensscan kunnen worden opgepikt door Change data capture (CDC). |
Gegevens laden vanuit bron |
Deze optie voert een nieuwe lading vanuit de gegevensbron uit. Deze optie is nuttig als:
|
Wijzigingen opslaan verwerken
De kopkolommen van de wijzigingstabel geven informatie over de wijzigingsverwerking, zoals het type bewerking (bijvoorbeeld INSERT), de doorvoertijd enzovoort. Als u al deze informatie niet nodig hebt, kunt u configureren dat de gegevenstaak de wijzigingstabellen maakt met sommige of alle kopkolommen, waardoor de footprint in de doeldatabase wordt verminderd. Schakel hiervoor de selectievakjes uit naast de kopkolommen die u wilt uitsluiten.
U kunt geen aanvullende kolommen verwijderen of kolommen herstellen als een taak wordt uitgevoerd. Om de selectie te wijzigen, moet u de taak eerst stoppen, uw selectie vervolgens wijzigen en tot slot de doeltabellen opnieuw laden.
Als Gegevenspartities wijzigen is ingeschakeld, wordt een extra koptekstkolom met de naam"partition_name" toegevoegd aan de wijzigingstabellen en automatisch geselecteerd in de gebruikersinterface. Deze kolom is vereist en kan daarom niet worden uitgesloten.
Ga naar Wijzigingstabellen gebruiken voor een beschrijving van de kopkolommen.
Fout bij verwerking
Gegevensfouten
Foutverwerking van gegevens wordt alleen ondersteund voor de bijwerkmethode Wijzigingsgegevens vastleggen (CDC).
Fouten in het afkappen van gegevens
Voor fouten in het afkappen van gegevens: Selecteer wat er moet gebeuren als er een afkapping plaatsvindt in een of meer specifieke records. U kunt een van de volgende opties in de lijst selecteren:
- Negeren: De taak wordt voorgezet en de fout wordt genegeerd.
- Tabel opschorten: De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord wordt omgezet naar een foutstatus en de gegevens worden niet gerepliceerd
- Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.
Overige gegevensfouten
Voor overige gegevensfouten: Selecteer wat er moet gebeuren als er een fout ontstaat in één of meer specifieke records. U kunt een van de volgende opties in de lijst selecteren:
- Negeren: De taak wordt voorgezet en de fout wordt genegeerd.
- Tabel opschorten: De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord wordt omgezet naar een foutstatus en de gegevens worden niet gerepliceerd
- Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.
Foutverwerking van gegevens escaleren
Foutverwerking escaleren wanneer gegevensfouten ontstaan (per tabel): Schakel dit selectievakje in om foutverwerking te escaleren als het aantal niet-afgekapte gegevensfouten (per tabel) het opgegeven aantal bereikt. Geldige waarden zijn 1-10.000.
Escalatie-actie: Kies wat er moet gebeuren wanneer foutverwerking wordt geëscaleerd. Houd er rekening mee dat de beschikbare acties afhankelijk zijn van de actie die is geselecteerd in de vervolgkeuzelijst Voor overige gegevensfouten die hierboven wordt beschreven.
-
Tabel opschorten (standaard): De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord worden omgezet naar een foutstatus en de gegevens worden niet landed.
- Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.
Tabelfouten
Wanneer een tabelfout ontstaat: Selecteer een van het volgende uit de vervolgkeuzelijst:
- Tabel opschorten (standaard): De taak wordt voortgezet, maar gegevens van de tabel met het foutrecord wordt omgezet naar een foutstatus en de gegevens worden niet gerepliceerd
- Taak stoppen: De taak wordt gestopt en handmatige tussenkomst is vereist.
Foutverwerking escaleren wanneer tabelfouten ontstaan (per tabel): Schakel dit selectievakje in om foutverwerking te escaleren als het aantal tabelfouten (per tabel) het opgegeven aantal bereikt. Geldige waarden zijn 1-10.000.
Escalatie-actie: Het escalatiebeleid voor tabelfouten is ingesteld op Taak stoppen en dit kan niet worden gewijzigd.
Omgevingsgerelateerd
-
Maximum aantal nieuwe pogingen: Selecteer deze optie en geef vervolgens het maximumaantal pogingen op voor het opnieuw proberen van een taak als er een herstelbare omgevingsgerelateerde fout plaatsvindt. Nadat u hebt geprobeerd de taak het opgegeven aantal keer opnieuw uit te voeren, wordt de taak gestopt en moet u handmatig ingrijpen.
Schakel het selectievakje uit of geef '0' op om de taak niet te proberen de taak opnieuw uit te voeren.
Geef '-1' op om een oneindig aantal keren te proberen de taak opnieuw uit te voeren.
-
Interval tussen nieuwe pogingen (seconden): Gebruik de teller om het aantal seconden te selecteren of in te voeren dat het systeem wacht tussen nieuwe pogingen.
Geldige waarden zijn 0-2.000.
-
- Interval voor opnieuw proberen bij lange storingen vergroten: Schakel dit selectievakje in om de interval voor opnieuw proberen te verhogen voor lange storingen. Als deze optie is ingeschakeld, verdubbelt de interval tussen elke nieuwe poging en de volgende poging totdat de Maximuminterval voor nieuwe pogingen is bereikt (en er door wordt gegaan met nieuwe pogingen op basis van de opgegeven maximuminterval).
- Maximuminterval voor nieuwe pogingen (seconden): Gebruik de teller om te selecteren of in te voeren hoeveel seconden er gewacht wordt tussen pogingen om een taak opnieuw uit te voeren als de optie Interval voor opnieuw proberen bij lange storingen vergroten is ingeschakeld. Geldige waarden zijn 0-2.000.
Verwerking van wijzigingen afstemmen
Afstemming transactionele offload
-
Offload transacties in voortgang naar de schijf als:
Transactiegegevens worden meestal in het geheugen bewaard totdat deze volledig doorgevoerd zijn naar de bron of het doel. Transacties die groter zijn dat het toegewezen geheugen of die niet zijn doorgevoerd binnen de opgegeven tijdslimiet worden geoffloaded naar de schijf.
- Totale geheugengrootte transacties overschrijdt (MB): de maximumtijd dat elke transactie in het geheugen kan blijven voordat het naar de schijf wordt geoffloaded. De standaardwaarde is 1024.
- Duur transacties overschrijdt (seconden): de maximumtijd dat elke transactie in het geheugen kan blijven voordat het naar de schijf wordt geoffloaded. De duur wordt berekend vanaf het moment dat Qlik Talend Data Integration is begonnen met het vastleggen van de transactie. De standaardwaarde is 60.
Batch afstemmen
-
Minimumaantal wijzigingen per transactie: Het minimumaantal wijzigingen dat in elke transactie wordt opgenomen. De standaardwaarde is 1000.
InformatieDe wijzigingen worden toegepast op het doel als het aantal wijzigingen gelijk is aan of groter is dan de waarde Minimumaantal wijzigingen per transactie OF als de waarde Maximumtijd om transacties in batches te plaatsen voor toepassen (seconden) die hieronder wordt beschreven is bereikt - naargelang wat als eerste wordt bereikt. Omdat de frequentie van wijzigingen die worden toegepast op het doel door deze twee parameters wordt beheerd, worden wijzigingen in de bronrecords mogelijk niet direct in de doelrecords weergegeven.
- Maximumtijd om transacties in batches te plaatsen voor toepassen (seconden): De maximumtijd om transacties in batches te verzamelen voordat er een time-out optreedt. De standaardwaarde is 1.
Interval
Deze optie is alleen beschikbaar in de volgende gevallen:
- Gateway voor gegevensverplaatsing gebruiken
- Gegevens tijdelijk opslaan vanuit SaaS-applicatiebronnen
- De taak wordt gedefinieerd met de bijwerkmethode Wijzigingsgegevens vastleggen (CDC)
Wijzigingen om de (minuten) lezen
Stel de interval tussen het lezen van wijzigingen van de bron in minuten in. Het geldige bereik ligt tussen 1 en 1440.
Diverse afstemmingen
- Cachegrootte instructies (aantal instructies): Het maximumaantal voorbereide instructies om te bewaren op de server om later uit te voeren (bij het toepassen van wijzigingen op het doel). De standaardwaarde is 50. Het maximum is 200.
-
VERWIJDER en VOEG IN wanneer u een primaire sleutel van een kolom bijwerkt: Voor deze optie moet volledige aanvullende logboekregistratie zijn ingeschakeld in de brondatabase.
Schema-evolutie
Selecteer hoe de volgende soorten DDL-wijzigingen in het schema moeten worden verwerkt. Als u de instellingen van schema-evolutie hebt gewijzigd, moet u de taak opnieuw voorbereiden. De onderstaande tabel beschrijft welke acties beschikbaar zijn voor de ondersteunde DDL-wijzigingen.
DDL wijzigen | Toepassen op doel | Negeren | Tabel tijdelijk intrekken | Taak stoppen |
---|---|---|---|---|
Kolom toevoegen | Ja | Ja | Ja | Ja |
Kolomnaam wijzigen | Nee | Nee | Ja | Ja |
Tabelnaam wijzigen | Nee | Nee | Ja | Ja |
Type kolomgegevens wijzigen | Nee | Ja | Ja | Ja |
Tabel maken
Als u een selectieregel hebt gebruikt om gegevensverzamelingen toe te voegen die aan een patroon voldoen, worden nieuwe tabellen die aan het patroon voldoen gedetecteerd en toegevoegd. |
Ja | Ja | Nee | Nee |
Tekensubstitutie
U kunt brontekens in de doeldatabase vervangen of verwijderen of u kunt brontekens vervangen of verwijderen die niet door een geselecteerde tekenset worden ondersteund.
-
Alle tekens moeten worden gespecificeerd als Unicode-codepunten.
- Tekens worden ook vervangen in controletabellen van de controletabellen.
-
Ongeldige waarden worden aangegeven met een rode driehoek in de rechterbovenhoek van de tabelcel. Als u met de muiscursor op de driehoek gaat staan, wordt het foutbericht getoond.
-
Transformaties op tabelniveau of algemene transformaties die voor de taak zijn gedefinieerd, worden uitgevoerd nadat de tekens zijn vervangen.
-
Vervangingsacties die zijn gedefinieerd in de tabel Brontekens substitueren of verwijderen worden uitgevoerd voorafgaand aan de vervangingsactie die is gedefinieerd in de tabel Brontekens substitueren of verwijderen die niet worden ondersteund door de geselecteerde tekenset.
- Tekenvervanging ondersteunt geen LOB‑gegevenstypen.
Brontekens vervangen of verwijderen
Gebruik de tabel Brontekens substitueren of verwijderen om vervangingen voor specifieke brontekens te definiëren. Dit kan bijvoorbeeld handig zijn als de Unicode-weergave van een teken anders is op de bron- en doelplatformen. Op Linux bijvoorbeeld wordt het minusteken in de Shift_JIS tekenset vertegenwoordigd door U+2212, maar op Windows wordt dit vertegenwoordigd als U+FF0D.
Naar | Doe dit |
---|---|
Definieer substitutie-acties. |
|
Het opgegeven bron- of doelteken bewerken |
Klik op aan het einde van een rij en selecteer Bewerken. |
Vermeldingen uit de tabel verwijderen |
Klik op aan het einde van een rij en selecteer Verwijderen. |
Brontekens vervangen of verwijderen die niet worden ondersteund door de geselecteerde tekenset.
Gebruik de tabel Niet-ondersteunde tekens per tekenset om een afzonderlijk vervangingsteken te definiëren voor alle tekens die niet worden ondersteund door de geselecteerde tekenset.
Naar | Doe dit |
---|---|
Definieer of bewerk een substitutie-actie. |
|
Schakel de substitutie-actie uit. |
Selecteer de lege vermelding in de vervolgkeuzelijst Tekenset. |
Meer opties
Deze opties worden niet weergegeven in de gebruikersinterface omdat ze alleen relevant zijn voor specifieke versies of omgevingen. Deze opties dienen daarom niet te worden ingesteld tenzij hier expliciet opdracht voor wordt gegeven door Qlik Support of in de productdocumentatie.
Kopieer de optie naar het veld Kenmerknaam toevoegen en klik op Toevoegen om een optie in te stellen. Stel vervolgens de waarde in of schakel de optie in op basis van de instructies die u hebt ontvangen.
Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing
Gateway voor gegevensverplaatsing wordt niet ondersteund met een Qlik Talend Cloud Starter-abonnement en is optioneel bij andere abonnementsniveaus. Bij het werken zonder Gateway voor gegevensverplaatsing wordt vrijwel directe CDC (wijzigingsgegevens vastleggen (niet ondersteund). U houdt de doelgegevens actueel door een planningsinterval in te stellen. Het schema bepaalt hoe vaak de doelgegevensverzamelingen worden bijgewerkt met wijzigingen van de brongegevensverzamelingen. Waar het schema de bijwerkfrequentie bepaalt, bepaalt het type gegevensverzameling juist de bijwerkmethode. Als de bronmetagegevens CDC (wijzigingsgegevens vastleggen) ondersteunen, worden alleen de wijzigingen van de brongegevens gerepliceerd en toegepast op de betreffende doeltabellen. Ondersteunen de brongegevensverzamelingen CDC niet (zoals, Weergaven), worden wijzigingen toegepast door alle brongegevens te laden naar de betreffende doeltabellen. In het geval enkele brongegevensverzamelingen CDC ondersteunen en andere niet, worden er twee afzonderlijke subtaken gemaakt (ervan uitgaand dat de bijwerkmethode Wijzigingsgegevens vastleggen (CDC) is ingesteld op geselecteerd): één voor het laden van de gegevensverzamelingen die geen CDC ondersteunen en één subtaak voor het vastleggen van de wijzigingen naar gegevensverzamelingen die CDC wel ondersteunen. In dit geval wordt sterk aanbevolen om hetzelfde schema in te stellen voor beide subtaken om de consistentie van gegevens te garanderen.
Ga als volgt te werk om de planning te wijzigen:
Open uw gegevensproject en voer een van het volgende uit:
- Klik in de taakweergave op van een gegevenstaak en selecteer Planning.
- Klik in de pijplijnweergave op van een gegevenstaak en selecteer Planning.
- Open de replicatietaak en klik op de werkbalkknop Planning.
- Wijzig de planningsinstellingen naar wens en klik vervolgens op OK.