Een Qlik Open Lakehouse-project maken

Maak een Qlik Open Lakehouse-pijplijnproject om gegevens van een willekeurige bron op te nemen. Sla uw gegevens op in een Iceberg open tabelindeling.

Vereisten

Om een Qlik Open Lakehouse-project te maken, hebt u het volgende nodig:

Een netwerkintegratie waarmee Qlik namens u rekenkracht kan leveren en beheren.
Een lakehouse-cluster dat is geconfigureerd om de gegevensopslagtaak binnen uw Iceberg-project uit te voeren.
Een verbinding met een gegevenscatalogus om te gebruiken als datadoel voor uw project, of de nodige details zodat u een nieuwe verbinding kunt maken.

Ondersteunde taken

De volgende taken worden ondersteund in een Qlik Open Lakehouse-project.

CDC- en SaaS-applicatiebronnen

Gegevenstaak voor lake-tussenopslag

Tussenopslag van gegevens in CSV‑indeling in S3, van elke door Qlik ondersteunde gegevensbron, inclusief een hoog volume aan gegevensstromen.

Ga voor meer informatie naar Gegevens tijdelijk opslaan in Qlik Open Lakehouse.
Opslaggegevenstaak

De opslaggegevenstaak gebruikt de gegevens die tijdelijk zijn opgeslagen in de cloud door de lake-tussenopslagtaak. De taak schrijft gegevens naar Iceberg-tabellen voor efficiënte opslag en de uitvoering van query's.
Ga voor meer informatie naar Gegevensverzamelingen opslaan.
Gegevens spiegelen-taak

Spiegel Iceberg-tabellen van uw opslagtaak naar uw clouddatawarehouse. Gebruikers kunnen query's uitvoeren op gegevens via externe tabellen zonder gegevens te migreren naar uw clouddatawarehouse.

Streamingbronnen

Streaming-tussenopslaggegevenstaak

Tussenopslag van gegevens in Avro-indeling in S3, van elke door Qlik ondersteunde streamingbron.

Ga voor meer informatie naar Tussenopslag van streaminggegevens naar Qlik Open Lakehouse.
Streaming-gegevenstransformatietaak

De Streaming-gegevenstransformatietaak verbruikt de gebeurtenissen die in de cloud zijn opgeslagen door de Streaming-tussenopslagtaak. De taak schrijft gegevens naar Iceberg-tabellen voor efficiënte opslag en de uitvoering van query's, en ondersteunt transformaties.

Ga voor meer informatie naar Streaming datasets opslaan.
Gegevens spiegelen-taak

Spiegel Iceberg-tabellen van uw streaming-opslagtaak naar uw clouddatawarehouse. Gebruikers kunnen query's uitvoeren op gegevens via externe tabellen zonder gegevens te migreren naar uw clouddatawarehouse.

Voorbeeld van het maken van een Qlik Open Lakehouse-project

In het volgende voorbeeld wordt een Qlik Open Lakehouse-pijplijnproject gemaakt, worden gegevens vanuit een CDC-bron toegevoegd en in tabellen in Iceberg-indeling opgeslagen. In dit voorbeeld wordt een eenvoudige pijplijn gemaakt die u kunt uitbreiden door meer gegevensbronnen toe te voegen. U kunt een gegevens spiegelen-taak toevoegen om uw tabellen in uw datawarehouse te spiegelen zonder gegevens te dupliceren, of dit project gebruiken als bron voor een project dat transformaties vereist in uw clouddatawarehouse.

Om een Qlik Open Lakehouse-project te maken, doet u het volgende:

Klik op de startpagina van Gegevensintegratie op Pijplijn maken en configureer deze:

Naam: voer de naam voor het project in.
Ruimte: selecteer de ruimte waartoe het project behoort.
Beschrijving: voer optioneel een beschrijving voor het project in.

Selecteer Gegevenspijplijn voor Gebruiksscenario.
Configureer het gegevensplatform:

Gegevensplatform: selecteer Qlik Open Lakehouse in de lijst.
Verbinding gegevenscatalogus: selecteer in de lijst een bestaande verbinding of klik op Nieuwe maken om een nieuwe gegevenscatalogusverbinding toe te voegen.
Doelverbinding tussenopslag: selecteer de S3-bucket voor tussenopslag van de gegevens of klik op Nieuwe maken om een nieuwe bucketlocatie toe te voegen.
Rekencluster opslag: selecteer het lakehouse-cluster dat de opslagtaak zal uitvoeren.

Maak het project.
Volg de stappen in de wizard voor het toevoegen van gegevens.Zie voor meer informatie Gegevens onboarden, die instructies biedt voor CDC- en streamingsbronnen.

Beperkingen

Als u een taak opnieuw maakt, moet u ook alle downstream taken opnieuw maken.

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een tikfout, een ontbrekende stap of een technische fout – laat het ons weten!

Geef hier uw feedback