Werken met Apache Parquet-bestanden

Apache Parquet is een opslagindeling met kolommen, wat zeer efficiënt is voor het opslaan en doorzoeken van grote gegevensverzamelingen. In Qlik Sense kunt u lezen vanuit Parquet-bestanden en tabellen opslaan als Parquet-bestanden.

Met Parquet kunnen specifieke kolommen in een tabel efficiënt worden doorzocht in plaats van dat de volledige tabel gelezen moet worden. Daarom is het zeer geschikt om te gebruiken voor de verwerking van big data. Parquet ondersteunt ook efficiënte compressie en versleuteling van gegevens. Dit vermindert de benodigde opslagruimte en verbetert de queryprestaties.

Alle bestaande apps die zijn gemaakt in een Qlik Sense-versie vóór augustus 2023 moeten handmatig worden bijgewerkt om Parquet-ondersteuning mogelijk te maken. Dit is vereist voor zowel implementaties die worden geüpgraded naar augustus 2023, als bij het importeren van bestaande apps naar een nieuwe implementatie. Zie Ondersteuning voor parquet-bestanden inschakelen voor bestaande apps in Qlik Sense voor meer informatie over het bijwerken van de apps.

Parquet-bestanden maken

U kunt Parquet-bestanden maken met behulp van de opdracht Store in het script. U geeft in het script aan dat u een eerder gelezen tabel of deel ervan wilt exporteren naar een expliciet genoemd bestand op een locatie van uw keuze.

Ga voor meer informatie naar Store.

Gegevens uit Parquet-bestanden lezen

U kunt gegevens lezen vanuit een Parquet-bestand net als andere gegevensbestanden die door Qlik Sense worden ondersteund. Dit heeft betrekking op Gegevensbeheer, de editor voor laden van gegevens of als u gegevens toevoegt aan een nieuwe app.

Ga voor meer informatie naar Gegevens uit bestanden laden.

U kunt ook gegevens laden vanuit een Parquet-bestand in het load-script voor gegevens met de opdracht LOAD. Bijvoorbeeld:

LOAD * from xyz.parquet (parquet);

Ga voor meer informatie naar Load.

Beperkingen

Geneste veldtypen worden niet ondersteund door Qlik Sense. De velden worden geladen, maar de inhoud is null.
Parquet-bestanden die een int96-tijdstempelveld bevatten worden mogelijk niet correct geladen.

Int96 is een verouderd gegevestype dat een tijdstempel zonder tijdzonegegevens bevat. Er wordt een poging gedaan om het veld als UTC te lezen, maar vanwege verschillende implementaties van de leverancier kan succes niet worden gegarandeerd.

Controleer de geladen gegevens en wijzig de tijdzone in de juiste tijdzone met indien nodig een marge.

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een typfout, een ontbrekende stap of een technische fout – laat het ons weten zodat we dit kunnen verbeteren!

Geef hier uw feedback