Ga naar hoofdinhoud Ga naar aanvullende inhoud

Gegevens repliceren met een Qlik Talend Cloud Starter-abonnement

Met behulp van de configuratiewizard voor taken kunt u in slechts enkele muiskliken een replicatietaak instellen.

De instellingen die in de wizard worden getoond weerspiegelen het geselecteerde doeltype. Als u bijvoorbeeld repliceert naar opslagdoelen zoals Amazon S3, wordt u om een opslaglocatie gevraagd. Repliceert u daarentegen naar doelen zoals Amazon Redshift waarbij een tussenopslaggebied is vereist, wordt u gevraagd om een tussenopslaggebied te definiëren of selecteren.

De volgende tabel helpt u bij het navigeren van dit onderwerp op basis van uw beoogde doel.

Repliceren naar databases en datawarehouses zonder tussenopslag

Stel een replicatietaak naar databases of datawarehouses in waarvoor geen tussenopslag is vereist, deze zijn als volgt:

  • Google BigQuery
  • Snowflake

Repliceren naar datawarehouses met tussenopslag

Stel een replicatietaak naar datawarehouses in waarvoor tijdelijk opslaan is vereist, deze zijn als volgt:

  • Amazon Redshift
  • Microsoft Fabric
  • Databricks

Repliceren naar de cloudopslag

Stel een replicatietaak naar een cloudopslag in.

Repliceren naar databases en datawarehouses zonder tussenopslag

In deze sectie wordt uitgelegd hoe u een replicatietaak instelt naar een database of datawarehouse waarvoor geen afzonderlijk tussenopslaggebied is vereist.

Tip

Qlik heeft een nieuwe navigatie-ervaring uitgebracht, die momenteel nog optioneel is. Als uw tenantbeheerder de nieuwe navigatie heeft geactiveerd, geldt het volgende:

  • Het startmenu () voor het openen van Gegevensintegratie vindt u linksboven.
  • Acties die eerder zijn uitgevoerd met de knop Nieuwe toevoegen (die is verwijderd), worden nu uitgevoerd door over te schakelen naar een specifieke context (Gegevensintegratie > Verbindingen, bijvoorbeeld) en te klikken op de knop Maken <object>.

Voor een gedetailleerde beschrijving van de wijzigingen, raadpleegt u Nieuwe Qlik Talend Gegevensintegratie platformnavigatie.

Voor de volgende actie:

  1. In Gegevensintegratie > Startpagina klikt u op Gegevens repliceren.

    De wizard Gegevens repliceren wordt geopend.

  2. Op het tabblad Algemeen doet u het volgende:

    • Geef een naam op voor uw taak.

    • Voer desgewenst een beschrijving voor uw taak in.

    • Voer een van de volgende handelingen uit:

      • Een bestaand project selecteren
      • Geef een naam op voor een nieuw project en klik vervolgens op Nieuw project toevoegen: <uw-projectnaam> onder het veld Project.

        De projectnaam wordt toegevoegd aan het veld Project.

    • Selecteer een gegevensruimte voor uw replicatieproject. Als u nog geen gegevensruimte hebt gemaakt, doet u het volgende:

      • Selecteer Gegevensruimte (de standaard gegevensruimte van de tenant)

        InformatieGegevensruimte biedt volledige machtigingen voor alle gebruikers. U kunt de rollen en machtigingen van elk lid later bewerken, zoals beschreven in Rollen en machtigingen in gegevensruimten.
      • Annuleer de wizard, maakt uw eigen gegevensruimte zoals in beschreven in Een gegevensruimte maken en voer de wizard nogmaals uit.

      Voor informatie over gegevensruimten, gaat u naar Werken in ruimten in Qlik Talend Data Integration.

  3. Klik op Volgende. Selecteer op het tabblad Bronverbinding selecteren een verbinding naar de brongegevens. U kunt eventueel de verbindingsinstellingen bewerken door Bewerken te selecteren in het menu in de kolom Acties.

    Als u nog geen verbinding naar uw brongegevens hebt gemaakt, moet u er eerst een maken door in de rechterbovenhoek van het tabblad te klikken op Verbinding maken.

    U kunt de lijst met verbindingen filteren met behulp van de filters aan de linkerkant. Verbindingen kunnen gefilterd worden op basis van brontype, gateway, ruimte en eigenaar. De knop Alle filters boven de verbindingslijst toont het aantal huidige filters. U kunt deze knop gebruiken om het venster Filters aan de linkerkant te sluiten of openen. Huidige actieve filters worden ook getoond bovenaan de lijst met beschikbare verbindingen.

    U kunt de lijst ook sorteren door Laatst bijgewerkt, Laatst gemaakt of Alfabetisch te selecteren in de vervolgkeuzelijst aan de rechterkant. Klik op de pijl rechts van de lijst om de sorteervolgorde te wijzigen.

    Nadat u een gegevensbronverbinding hebt geselecteerd, kunt u in de rechterbovenhoek van het tabblad op Verbinding testen klikken (aanbevolen) en vervolgens op Volgende.

  4. Selecteer op het tabblad Gegevensverzamelingen selecteren tabellen en of/weergaven die u wilt opnemen in de replication-taak U kunt ook jokertekens gebruiken en selectieregels maken, zoals beschreven in Gegevens selecteren uit een database.

  5. Op het tabblad Doelverbinding selecteren selecteert u het doel in de lijst met beschikbare verbindingen en klikt u vervolgens op Volgende. Wat betreft functionaliteit werkt het tabblad Bronverbinding selecteren hetzelfde als het tabblad dat eerder is beschreven.

  6. Op het tabblad Instellingen kunt u eventueel de volgende instellingen wijzigen, klik vervolgens op Volgende.

    InformatieBij het repliceren vanuit SaaS-applicatiebronnen is de replicationmodus Volledige lading standaard ingeschakeld en dit kan niet worden uitgeschakeld.
    • Volledige lading: Laadt de gegevens van de geselecteerde brontabellen naar het doelplatform en maakt indien nodig de doeltabellen. De volledige lading vindt automatisch plaats als de taak is gestart, maar kan indien mogelijk ook handmatig worden uitgevoerd.
    • Wijzigingen toepassen: Werkt de doeltabellen continu bij met wijzigingen die in de brontabellen zijn aangebracht.

    • Wijzigingen opslaan: Slaat de wijzigingen van de brontabellen op in wijzigingstabellen (één per brontabel).

      Ga voor meer informatie naar Wijzigingen opslaan.

    De frequentie voor het vastleggen van wijzigingsgegevens wordt bepaald door de planningsinstellingen. De standaardinterval voor vastleggen van wijzigingen is elke zes uur. Ga voor meer informatie naar Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing.

    • Schema doelgegevensverzameling: Selecteer eventueel het schema waarin de gegevensverzamelingen in het doel gemaakt moeten worden.
    • Schema controletabel: Selecteer eventueel het schema waarin de controletabellen in het doel gemaakt moeten worden.
    • Gegevens repliceren na: U kunt inplannen hoe vaak wijzigingen van de gegevensbronnen worden vastgelegd. Daarnaast kunt u een begintijd en begindatum instellen. Als de bronmetagegevens CDC (wijzigingsgegevens vastleggen) ondersteunen, worden alleen de wijzigingen van de brongegevens gerepliceerd en toegepast op de betreffende doeltabellen. Ondersteunen de brongegevensverzamelingen CDC niet (zoals, Weergaven), worden wijzigingen toegepast door alle brongegevens te laden naar de betreffende doeltabellen. In het geval enkele brongegevensverzamelingen CDC ondersteunen en andere niet, worden er twee afzonderlijke subtaken gemaakt (ervan uitgaand dat de bijwerkmethode Wijzigingen toepassen of de replicatie-opties van Wijzigingen opslaan zijn geselecteerd): één voor het laden van de gegevensverzamelingen die geen CDC ondersteunen en één subtaak voor het vastleggen van de wijzigingen naar gegevensverzamelingen die CDC wel ondersteunen.

      Met de configuratiewizard voor taken kunt een uurinterval inplannen. Nadat u het instellen van de taak hebt voltooid, kunt u verschillende planningsopties verkennen, zoals beschreven in Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing.

    Raadpleeg Minimumaantal toegestane planningsintervallen voor informatie over minimum planningsintervallen op basis van type gegevensbron en abonnementsniveau.

    U kunt de wijzigingen later wijzigen, zoals beschreven in Instellingen gegevensreplicatietaak.

  7. Op het tabblad Overzicht ziet u een visuele weergave van de gegevenspijplijn. Kies een van de volgende acties nadat de pijplijn is gemaakt:

    • Open het project <naam> (standaardinstelling)
    • Open de gegevenstaak <naam>

      InformatieAls enkele van de geselecteerde gegevensverzamelingen geen CDC ondersteunen, worden er twee pijplijnen weergegeven: één voor de CDC-taak en een andere voor de laadtaak.

    Klik vervolgens op Maken en uitvoeren (standaardinstelling) of Maken om de taak te maken zonder deze uit te voeren.

    Hebt u geklikt op Maken en uitvoeren, dan wordt de taak gemaakt en uitgevoerd (dit kan enkele minuten duren).

  8. Als u geklikt hebt op Maken, gebeurt een van het volgende op basis van de actie nadat de pijplijn is gemaakt die u eerder hebt geselecteerd:

    • Het project wordt geopend en toont de nieuw gemaakte taak.
    • De taak wordt geopend op het tabblad Gegevensverzamelingen. Het tabblad Gegevensverzamelingen toont de structuur en de metagegevens van de geselecteerde brontabellen. Dit omvat alle expliciet vermelde tabellen en tabellen die voldoen aan de selectieregels.

      Als u meer tabellen uit de gegevensbron wilt toevoegen, klikt u op Brongegevens selecteren.

  9. U kunt transformaties uitvoeren voor gegevensverzamelingen, gegevens filteren of kolommen toevoegen.

    Ga voor meer informatie naar Gegevensverzamelingen beheren.

  10. Wanneer u de gewenste transformaties hebt toegevoegd, kunt u de gegevensverzamelingen valideren door te klikken op Gegevensverzamelingen valideren. Als de validatie mislukt, moet u de fouten oplossen voordat u verdergaat.

    Ga voor meer informatie naar Valideren en aanpassen van de gegevensverzamelingen.

  11. Zodra u gereed bent klikt u op Voorbereiden en uitvoeren om de gegevenstaak voor te bereiden en uit te voeren.

    Ga naar Geavanceerde uitvoeropties voor informatie over het herstellen van taken en andere methoden voor het uitvoeren van taken.

  12. De replicationtaak zou nu moeten beginnen, en u kunt de voortgang zien in Bewaken. Ga voor meer informatie naar Een afzonderlijke gegevenstaak bewaken.

Repliceren naar datawarehouses met tussenopslag

In deze sectie wordt uitgelegd hoe u een replicatietaak naar een datawarehouse maakt waarvoor een afzonderlijk tussenopslaggebied is vereist.

Tip

Qlik heeft een nieuwe navigatie-ervaring uitgebracht, die momenteel nog optioneel is. Als uw tenantbeheerder de nieuwe navigatie heeft geactiveerd, geldt het volgende:

  • Het startmenu () voor het openen van Gegevensintegratie vindt u linksboven.
  • Acties die eerder zijn uitgevoerd met de knop Nieuwe toevoegen (die is verwijderd), worden nu uitgevoerd door over te schakelen naar een specifieke context (Gegevensintegratie > Verbindingen, bijvoorbeeld) en te klikken op de knop Maken <object>.

Voor een gedetailleerde beschrijving van de wijzigingen, raadpleegt u Nieuwe Qlik Talend Gegevensintegratie platformnavigatie.

Voor de volgende actie:

  1. In Gegevensintegratie> Startpagina klikt u op Gegevens repliceren.

    De wizard Gegevens repliceren wordt geopend.

  2. Op het tabblad Algemeen doet u het volgende:

    • Geef een naam op voor uw taak.

    • Voer desgewenst een beschrijving voor uw taak in.

    • Voer een van de volgende handelingen uit:

      • Een bestaand project selecteren
      • Geef een naam op voor een nieuw project en klik vervolgens op Nieuw project toevoegen: <uw-projectnaam> onder het veld Project.

        De projectnaam wordt toegevoegd aan het veld Project.

    • Selecteer een gegevensruimte voor uw replicatieproject. Als u nog geen gegevensruimte hebt gemaakt, doet u het volgende:

      • Selecteer Gegevensruimte (de standaard gegevensruimte van de tenant)

        InformatieGegevensruimte biedt volledige machtigingen voor alle gebruikers. U kunt de rollen en machtigingen van elk lid later bewerken, zoals beschreven in Rollen en machtigingen in gegevensruimten.
      • Annuleer de wizard, maak uw eigen gegevensruimte zoals in beschreven in Een gegevensruimte maken en voer de wizard nogmaals uit.

      Voor informatie over gegevensruimten, gaat u naar Werken in ruimten in Qlik Talend Data Integration.

  3. Klik op Volgende. Selecteer op het tabblad Bronverbinding selecteren een verbinding naar de brongegevens. U kunt eventueel de verbindingsinstellingen bewerken door Bewerken te selecteren in het menu in de kolom Acties.

    Als u nog geen verbinding naar uw brongegevens hebt gemaakt, moet u er eerst een maken door in de rechterbovenhoek van het tabblad te klikken op Verbinding maken.

    U kunt de lijst met verbindingen filteren met behulp van de filters aan de linkerkant. Verbindingen kunnen gefilterd worden op basis van brontype, gateway, ruimte en eigenaar. De knop Alle filters boven de verbindingslijst toont het aantal huidige filters. U kunt deze knop gebruiken om het venster Filters aan de linkerkant te sluiten of openen. Huidige actieve filters worden ook getoond bovenaan de lijst met beschikbare verbindingen.

    U kunt de lijst ook sorteren door Laatst bijgewerkt, Laatst gemaakt of Alfabetisch te selecteren in de vervolgkeuzelijst aan de rechterkant. Klik op de pijl rechts van de lijst om de sorteervolgorde te wijzigen.

    Nadat u een gegevensbronverbinding hebt geselecteerd, kunt u in de rechterbovenhoek van het tabblad op Verbinding testen klikken (aanbevolen) en vervolgens op Volgende.

  4. Selecteer op het tabblad Gegevensverzamelingen selecteren tabellen en of/weergaven die u wilt opnemen in de replication-taak U kunt ook jokertekens gebruiken en selectieregels maken, zoals beschreven in Gegevens selecteren uit een database.

  5. Op het tabblad Doelverbinding selecteren selecteert u het doel in de lijst met beschikbare verbindingen en klikt u vervolgens op Volgende. Wat betreft functionaliteit werkt het tabblad Bronverbinding selecteren hetzelfde als het tabblad dat eerder is beschreven.

  6. Op het tabblad Instellingen kunt u eventueel de volgende instellingen wijzigen, klik vervolgens op Volgende.

    InformatieBij het repliceren vanuit SaaS-applicatiebronnen is de replicationmodus Volledige lading standaard ingeschakeld en dit kan niet worden uitgeschakeld.
    • Volledige lading: Laadt de gegevens van de geselecteerde brontabellen naar het doelplatform en maakt indien nodig de doeltabellen. De volledige lading vindt automatisch plaats als de taak is gestart, maar kan indien mogelijk ook handmatig worden uitgevoerd.
    • Wijzigingen toepassen: Werkt de doeltabellen continu bij met wijzigingen die in de brontabellen zijn aangebracht.

    • Wijzigingen opslaan: Slaat de wijzigingen van de brontabellen op in wijzigingstabellen (één per brontabel).

      Ga voor meer informatie naar Wijzigingen opslaan.

    De frequentie voor het vastleggen van wijzigingsgegevens wordt bepaald door de planningsinstellingen. De standaardinterval voor vastleggen van wijzigingen is elke zes uur. Ga voor meer informatie naar Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing.

    Bij het repliceren van de onderstaande datawarehouses, moet u een tussenopslag instellen. Gegevens worden verwerkt en voorbereid in de tussenopslag voordat ze naar het warehouse worden verzonden.

    Selecteer een bestaande tussenopslag of klik op Nieuwe maken om een nieuwe tussenopslag te definiëren en volg de instructies in Verbinding maken met een cloudopslag.

    Klik op Bewerken om de verbindingsinstellingen te bewerken. Klik op Verbinding testen om de verbinding te testen (aanbevolen).

    Raadpleeg de kolom Ondersteund als tussenopslaggebied in Gebruikscases doelplatform en ondersteunde versies voor informatie over welke tussenopslaggebieden voor welk datawarehouse worden ondersteund.

    • Schema doelgegevensverzameling: Selecteer eventueel het schema waarin de gegevensverzamelingen in het doel gemaakt moeten worden.
    • Schema controletabel: Selecteer eventueel het schema waarin de controletabellen in het doel gemaakt moeten worden.
    • Gegevens repliceren na: U kunt inplannen hoe vaak wijzigingen van de gegevensbronnen worden vastgelegd. Daarnaast kunt u een begintijd en begindatum instellen. Als de bronmetagegevens CDC (wijzigingsgegevens vastleggen) ondersteunen, worden alleen de wijzigingen van de brongegevens gerepliceerd en toegepast op de betreffende doeltabellen. Ondersteunen de brongegevensverzamelingen CDC niet (zoals, Weergaven), worden wijzigingen toegepast door alle brongegevens te laden naar de betreffende doeltabellen. In het geval enkele brongegevensverzamelingen CDC ondersteunen en andere niet, worden er twee afzonderlijke subtaken gemaakt (ervan uitgaand dat de bijwerkmethode Wijzigingen toepassen of de replicatie-opties van Wijzigingen opslaan zijn geselecteerd): één voor het laden van de gegevensverzamelingen die geen CDC ondersteunen en één subtaak voor het vastleggen van de wijzigingen naar gegevensverzamelingen die CDC wel ondersteunen.

      Met de configuratiewizard voor taken kunt een uurinterval inplannen. Nadat u het instellen van de taak hebt voltooid, kunt u verschillende planningsopties verkennen, zoals beschreven in Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing.

    U kunt de wijzigingen later wijzigen, zoals beschreven in Instellingen gegevensreplicatietaak.

  7. Op het tabblad Overzicht ziet u een visuele weergave van de gegevenspijplijn. Kies een van de volgende acties nadat de pijplijn is gemaakt:

    • Open het project <naam> (standaardinstelling)
    • Open de gegevenstaak <naam>

      InformatieAls enkele van de geselecteerde gegevensverzamelingen geen CDC ondersteunen, worden er twee pijplijnen weergegeven: één voor de CDC-taak en een andere voor de laadtaak.

    Klik vervolgens op Maken en uitvoeren (standaardinstelling) of Maken om de taak te maken zonder deze uit te voeren.

    Hebt u geklikt op Maken en uitvoeren, dan wordt de taak gemaakt en uitgevoerd (dit kan enkele minuten duren).

  8. Als u geklikt hebt op Maken, gebeurt een van het volgende op basis van de actie nadat de pijplijn is gemaakt die u eerder hebt geselecteerd:

    • Het project wordt geopend en toont de nieuw gemaakte taak.
    • De taak wordt geopend op het tabblad Gegevensverzamelingen. Het tabblad Gegevensverzamelingen toont de structuur en de metagegevens van de geselecteerde brontabellen. Dit omvat alle expliciet vermelde tabellen en tabellen die voldoen aan de selectieregels.

      Als u meer tabellen uit de gegevensbron wilt toevoegen, klikt u op Brongegevens selecteren.

  9. U kunt transformaties uitvoeren voor gegevensverzamelingen, gegevens filteren of kolommen toevoegen.

    Ga voor meer informatie naar Gegevensverzamelingen beheren.

  10. Wanneer u de gewenste transformaties hebt toegevoegd, kunt u de gegevensverzamelingen valideren door te klikken op Gegevensverzamelingen valideren. Als de validatie mislukt, moet u de fouten oplossen voordat u verdergaat.

    Ga voor meer informatie naar Valideren en aanpassen van de gegevensverzamelingen.

  11. Zodra u gereed bent klikt u op Voorbereiden en uitvoeren om de gegevenstaak voor te bereiden en uit te voeren.

    Ga naar Geavanceerde uitvoeropties voor informatie over het herstellen van taken en andere methoden voor het uitvoeren van taken.

  12. De replicationtaak zou nu moeten beginnen, en u kunt de voortgang zien in Bewaken. Ga voor meer informatie naar Een afzonderlijke gegevenstaak bewaken.

Repliceren naar de cloudopslag

In deze sectie wordt uitgelegd hoe u een replicatietaak naar een cloudopslag instelt.

Tip

Qlik heeft een nieuwe navigatie-ervaring uitgebracht, die momenteel nog optioneel is. Als uw tenantbeheerder de nieuwe navigatie heeft geactiveerd, geldt het volgende:

  • Het startmenu () voor het openen van Gegevensintegratie vindt u linksboven.
  • Acties die eerder zijn uitgevoerd met de knop Nieuwe toevoegen (die is verwijderd), worden nu uitgevoerd door over te schakelen naar een specifieke context (Gegevensintegratie > Verbindingen, bijvoorbeeld) en te klikken op de knop Maken <object>.

Voor een gedetailleerde beschrijving van de wijzigingen, raadpleegt u Nieuwe Qlik Talend Gegevensintegratie platformnavigatie.

Voor de volgende actie:

  1. In Gegevensintegratie> Startpagina klikt u op Gegevens repliceren.

    De wizard Gegevens repliceren wordt geopend.

  2. Op het tabblad Algemeen doet u het volgende:

    • Geef een naam op voor uw taak.

    • Voer desgewenst een beschrijving voor uw taak in.

    • Voer een van de volgende handelingen uit:

      • Een bestaand project selecteren
      • Geef een naam op voor een nieuw project en klik vervolgens op Nieuw project toevoegen: <uw-projectnaam> onder het veld Project.

        De projectnaam wordt toegevoegd aan het veld Project.

    • Selecteer een gegevensruimte voor uw replicatieproject. Als u nog geen gegevensruimte hebt gemaakt, doet u het volgende:

      • Selecteer Gegevensruimte (de standaard gegevensruimte van de tenant)

        InformatieGegevensruimte biedt volledige machtigingen voor alle gebruikers. U kunt de rollen en machtigingen van elk lid later bewerken, zoals beschreven in Rollen en machtigingen in gegevensruimten.
      • Annuleer de wizard, maak uw eigen gegevensruimte zoals in beschreven in Een gegevensruimte maken en voer de wizard nogmaals uit.

      Voor informatie over gegevensruimten, gaat u naar Werken in ruimten in Qlik Talend Data Integration.

  3. Klik op Volgende. Selecteer op het tabblad Bronverbinding selecteren een verbinding naar de brongegevens. U kunt eventueel de verbindingsinstellingen bewerken door Bewerken te selecteren in het menu in de kolom Acties.

    Als u nog geen verbinding naar uw brongegevens hebt gemaakt, moet u er eerst een maken door in de rechterbovenhoek van het tabblad te klikken op Verbinding maken.

    U kunt de lijst met verbindingen filteren met behulp van de filters aan de linkerkant. Verbindingen kunnen gefilterd worden op basis van brontype, gateway, ruimte en eigenaar. De knop Alle filters boven de verbindingslijst toont het aantal huidige filters. U kunt deze knop gebruiken om het venster Filters aan de linkerkant te sluiten of openen. Huidige actieve filters worden ook getoond bovenaan de lijst met beschikbare verbindingen.

    U kunt de lijst ook sorteren door Laatst bijgewerkt, Laatst gemaakt of Alfabetisch te selecteren in de vervolgkeuzelijst aan de rechterkant. Klik op de pijl rechts van de lijst om de sorteervolgorde te wijzigen.

    Nadat u een gegevensbronverbinding hebt geselecteerd, kunt u in de rechterbovenhoek van het tabblad op Verbinding testen klikken (aanbevolen) en vervolgens op Volgende.

  4. Selecteer op het tabblad Gegevensverzamelingen selecteren tabellen en of/weergaven die u wilt opnemen in de replication-taak U kunt ook jokertekens gebruiken en selectieregels maken, zoals beschreven in Gegevens selecteren uit een database.

  5. Op het tabblad Doelverbinding selecteren selecteert u het doel in de lijst met beschikbare verbindingen en klikt u vervolgens op Volgende. Wat betreft functionaliteit werkt het tabblad Bronverbinding selecteren hetzelfde als het tabblad dat eerder is beschreven.

  6. Op het tabblad Instellingen kunt u eventueel de volgende instellingen wijzigen, klik vervolgens op Volgende.

    • Vastleggen van wijzigingsgegevens (CDC): De tussenopslagtaak van de datalake start met een volledige lading (waarbij alle geselecteerde tabellen tijdelijk worden opgeslagen). De tijdelijk opgeslagen gegevens worden up-to-date gehouden met behulp van de CDC-technologie (Change Data Capture).

      InformatieCDC (vastleggen van wijzigingsgegevens) van DDL-bewerkingen wordt niet ondersteund.

      De frequentie voor het vastleggen van wijzigingsgegevens wordt bepaald door de planningsinstellingen. De standaardinterval voor vastleggen van wijzigingen is elke zes uur. Ga voor meer informatie naar Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing.

    • Opnieuw laden: Voert een volledige lading uit van de gegevens van de geselecteerde brontabellen naar het doelplatform en maakt indien nodig de doeltabellen. De volledige lading vindt automatisch plaats als de taak is gestart, maar kan indien mogelijk ook handmatig of periodiek worden uitgevoerd.

    Als u Gegevens vastleggen (CDC) selecteert en uw gegevens ook tabellen bevatten die geen CDC of weergaven ondersteunen, worden er twee gegevenspijplijnen gemaakt. Een pijplijn met alle tabellen die CDC ondersteunen en een andere pijplijn met alle andere tabellen en weergaven waarbij Opnieuw laden wordt gebruikt.

    Selecteer een van de volgende, op basis van de bucketmap waarnaar de bestanden geschreven moeten worden:

    • Standaardmap: De standaardmapindeling is <uw-project-naam>/<uw-taak-naam>
    • Hoofdmap: De bestanden worden direct naar de bucket geschreven.
    • Geef: Geef de naam van de map op. De map wordt gemaakt tijdens de uitvoering van de tussenopslagtaak van de datalake als de map niet bestaat.

      Informatie De mapnaam kan geen speciale tekens bevatten (zoals, @, #, !, enz.).
    • Gegevens repliceren na: U kunt inplannen hoe vaak wijzigingen van de gegevensbronnen worden vastgelegd. Daarnaast kunt u een begintijd en begindatum instellen. Als de bronmetagegevens CDC (wijzigingsgegevens vastleggen) ondersteunen, worden alleen de wijzigingen van de brongegevens gerepliceerd en toegepast op de betreffende doeltabellen. Ondersteunen de brongegevensverzamelingen CDC niet (zoals, Weergaven), worden wijzigingen toegepast door alle brongegevens te laden naar de betreffende doeltabellen. In het geval enkele brongegevensverzamelingen CDC ondersteunen en andere niet, worden er twee afzonderlijke subtaken gemaakt (ervan uitgaand dat de bijwerkmethode Wijzigingsgegevens vastleggen (CDC) is ingesteld op geselecteerd): één voor het laden van de gegevensverzamelingen die geen CDC ondersteunen en één subtaak voor het vastleggen van de wijzigingen naar gegevensverzamelingen die CDC wel ondersteunen.

      Met de configuratiewizard voor taken kunt een uurinterval inplannen. Nadat u het instellen van de taak hebt voltooid, kunt u verschillende planningsopties verkennen, zoals beschreven in Taken plannen bij het werken zonder Gateway voor gegevensverplaatsing.

    U kunt de taakinstellingen later wijzigen zoals beschreven in Instellingen voor cloudopslagdoelen.

  7. Op het tabblad Overzicht ziet u een visuele weergave van de gegevenspijplijn. Kies een van de volgende acties nadat de pijplijn is gemaakt:

    • Open het project <naam> (standaardinstelling)
    • Open de gegevenstaak <naam>

      InformatieAls enkele van de geselecteerde gegevensverzamelingen geen CDC ondersteunen, worden er twee pijplijnen weergegeven: één voor de CDC-taak en een andere voor de laadtaak.

    Klik vervolgens op Maken en uitvoeren (standaardinstelling) of Maken om de taak te maken zonder deze uit te voeren.

    Hebt u geklikt op Maken en uitvoeren, dan wordt de taak gemaakt en uitgevoerd (dit kan enkele minuten duren).

  8. Als u geklikt hebt op Maken, gebeurt een van het volgende op basis van de actie nadat de pijplijn is gemaakt die u eerder hebt geselecteerd:

    • Het project wordt geopend en toont de nieuw gemaakte taak.
    • De taak wordt geopend op het tabblad Gegevensverzamelingen. Het tabblad Gegevensverzamelingen toont de structuur en de metagegevens van de geselecteerde brontabellen. Dit omvat alle expliciet vermelde tabellen en tabellen die voldoen aan de selectieregels.

      Als u meer tabellen uit de gegevensbron wilt toevoegen, klikt u op Brongegevens selecteren.

  9. U kunt transformaties uitvoeren voor gegevensverzamelingen, gegevens filteren of kolommen toevoegen.

    Ga voor meer informatie naar Gegevensverzamelingen beheren.

  10. Wanneer u de gewenste transformaties hebt toegevoegd, kunt u de gegevensverzamelingen valideren door te klikken op Gegevensverzamelingen valideren. Als de validatie mislukt, moet u de fouten oplossen voordat u verdergaat.

    Ga voor meer informatie naar Valideren en aanpassen van de gegevensverzamelingen.

  11. Zodra u gereed bent klikt u op Voorbereiden en uitvoeren om de gegevenstaak voor te bereiden en uit te voeren.

    Ga naar Geavanceerde uitvoeropties voor informatie over het herstellen van taken en andere methoden voor het uitvoeren van taken.

  12. De replicationtaak zou nu moeten beginnen, en u kunt de voortgang zien in Bewaken. Ga voor meer informatie naar Een afzonderlijke gegevenstaak bewaken.

Laadprioriteit voor gegevensverzamelingen instellen

U kunt de laadvolgorde beheren van gegevensverzamelingen in uw gegevenstaak door aan elke gegevensverzameling een laadprioriteit toe te wijzen. Dit kan bijvoorbeeld handig zijn als u kleine gegevensverzamelingen wilt laden voorafgaand aan grotere gegevensverzamelingen.

  1. Klik op Laadprioriteit.

  2. Selecteer een laadprioriteit voor elke gegevensverzameling.

    De standaardlaadprioriteit is Normaal. Gegevensverzamelingen worden in de volgende volgorde van prioriteit geladen:

    • Hoogst

    • Hoger

    • Hoog

    • Normaal

    • Laag

    • Lager

    • Laagst

    Gegevensverzamelingen met dezelfde prioriteit worden in willekeurige volgorde geladen.

  3. Klik op OK.

InformatieGegevensverzamelingen van SaaS-applicatiebronnen kunnen afhankelijkheden bevatten in de laadvolgorde. Houd hier rekening mee bij het instellen van de laadprioriteit.

Metagegevens worden vernieuwd

U kunt de metagegevens in de taak vernieuwen om ze af te stemmen met wijzigingen in de metagegevens van de bron in de ontwerpweergave van een taak. In het geval van SaaS-applicaties die de Metadata Manager gebruiken moet de Metadata Manager worden vernieuwd voordat u de metagegevens in de gegeventaak kunt vernieuwen.

InformatieDeze bewerking is alleen van invloed op de tabellen in de ontwerptaak.
  1. U kunt ofwel:

    • Klik op ... en vervolgens op Metagegevens vernieuwen om de metagegevens te vernieuwen voor alle gegevensverzamelingen in de taak.

    • Klik op ... van een gegevensverzameling in Gegevensverzamelingen en vervolgens op Metagegevens vernieuwen om de metagegevens te vernieuwen voor een afzonderlijke gegevensverzameling.

    U kunt de status van de vernieuwing van metagegevens bekijken onder Metagegevens vernieuwen in het onderste deel van het scherm. Onder infoknop kunt u zien wanneer de metagegegevens voor het laatst zijn vernieuwd.

  2. Bereid de gegeventaak voor om de wijzigingen toe te passen.

    Als u de gegevenstaak hebt voorbereid en de wijzigingen zijn toegepast, worden de wijzigingen verwijderd van Metagegevens vernieuwen.

U moet opslagtaken voorbereiden die deze taak gebruiken om de wijzigingen door te geven.

Als er een kolom wordt verwijderd, wordt er een transformatie met null-waarden toegevoegd om ervoor te zorgen dat de opslag geen historische gegevens verliest.

Beperkingen

  • Een hernoeming met daarvoor een verwijderde kolom, in hetzelfde tijdslot, wordt vertaald naar de hernoeming van de verwijderde kolom als ze hetzelfde gegevenstype en dezelfde gegevenslengte hebben.

    Voorbeeld:  

    Vóór: a b c d

    Na: a c1 d

    In dit voorbeeld is b verwijderd en is c hernoemd naar c1, en hebben b en c hetzelfde gegevenstype en dezelfde gegevenslengte.

    Dit wordt geïdentificeerd als een hernoeming van b in c1 en een verwijdering van c.

  • De hernoeming van de laatste kolom is niet herkend, zelfs als de laatste kolom is verwijderd en de kolom ervoor is hernoemd.

    Voorbeeld:  

    Vóór: a b c d

    Na: a b c1

    In dit voorbeeld is d verwijderd en is c hernoemd naar c1.

    Dit wordt geïdentificeerd als een verwijdering van c en d en een toevoeging van c1.

  • Er wordt vanuit gegaan dat er aan het einde nieuwe kolommen worden toegevoegd. Als er in midden kolommen worden toegevoegd met hetzelfde gegevenstype als de volgende kolom, worden ze mogelijk geïnterpreteerd als een verwijdering en een hernoeming.

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een typfout, een ontbrekende stap of een technische fout – laat het ons weten zodat we dit kunnen verbeteren!