Utilizzo dei file Apache Parquet

Apache Parquet è un formato di archiviazione a colonne, molto efficiente per archiviare e interrogare grandi set di dati. In Qlik Sense è possibile leggere dati da file Parquet e archiviare tabelle sotto forma di file Parquet.

Parquet consente di interrogare efficacemente colonne specifiche in una tabella, anziché leggere l'intera tabella. Ciò lo rende ideale per l'elaborazione di big data. Inoltre, Parquet consente di comprimere e codificare efficacemente i dati. Ciò può ridurre ulteriormente lo spazio di archiviazione e migliorare le prestazioni dell'interrogazione.

Tutte le app esistenti create in una versione di Qlik Sense prima di agosto 2023 devono essere aggiornate manualmente per abilitare il supporto per Parquet. Ciò è richiesto sia per le distribuzioni che vengono aggiornate ad agosto 2023 sia per quando si importano app esistenti in una nuova distribuzione. Per ulteriori informazioni sull'aggiornamento delle app, vedere Abilitazione del supporto per file parquet per le app esistenti in Qlik Sense.

Creazione di file Parquetome dividere

È possibile creare file Parquet utilizzando il comando Store nello script. Dichiarare nello script che si desidera esportare una tabella letta in precedenza, o una sua parte, in un file con un nome esplicito nella posizione desiderata.

Per ulteriori informazioni, vedere Store.

Lettura dei dati dai file Parquet

È possibile leggere dati da un file Parquet così come si leggono da qualsiasi altro file di dati supportato da Qlik Sense. Ciò include Gestione dati, Editor caricamento dati o quando si aggiungono dati a una nuova app.

Per ulteriori informazioni, vedere Caricamento di dati da file.

È inoltre possibile caricare dati da un file Parquet nello script di caricamento dei dati con il comando LOAD. Ad esempio:

LOAD * from xyz.parquet (parquet);

Per ulteriori informazioni, vedere Load.

Limiti

I campi nidificati non sono supportati da Qlik Sense. I campi vengono caricati ma il contenuto sarà null.
I file parquet che contengono un campo data e ora int96 potrebbero non caricarsi correttamente.

Int96 è un tipo di dato deprecato che contiene informazioni su data e ora senza il fuso orario. Verrà eseguito un tentativo di lettura del campo in UTC ma, dato che ci sono implementazioni di fornitori di diverso tipo, il successo del tentativo non è garantito.

Verificare i dati caricati e adattarli al fuso orario corretto mediante uno scarto, se necessario.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!

Lascia qui il tuo feedback