Utilizzo dei file Apache Parquet
Apache Parquet è un formato di archiviazione a colonne, molto efficiente per archiviare e interrogare grandi set di dati. In Qlik Sense è possibile leggere dati da file Parquet e archiviare tabelle sotto forma di file Parquet.
Parquet consente di interrogare efficacemente colonne specifiche in una tabella, anziché leggere l'intera tabella. Ciò lo rende ideale per l'elaborazione di big data. Inoltre, Parquet consente di comprimere e codificare efficacemente i dati. Ciò può ridurre ulteriormente lo spazio di archiviazione e migliorare le prestazioni dell'interrogazione.
Creazione di file Parquetome dividere
È possibile creare file Parquet utilizzando il comando Store nello script. Dichiarare nello script che si desidera esportare una tabella letta in precedenza, o una sua parte, in un file con un nome esplicito nella posizione desiderata.
Per ulteriori informazioni, vedere Store.
Lettura dei dati dai file Parquet
È possibile leggere dati da un file Parquet così come si leggono da qualsiasi altro file di dati supportato da Qlik Sense. Ciò include Gestione dati, Editor caricamento dati o quando si aggiungono dati a una nuova app.
Per ulteriori informazioni, vedere Caricamento di dati da file.
È inoltre possibile caricare dati da un file Parquet nello script di caricamento dei dati con il comando LOAD. Ad esempio:
Per ulteriori informazioni, vedere Load.
Limitazioni
-
I campi nidificati non sono supportati da Qlik Sense. I campi vengono caricati ma il contenuto sarà null.
-
I file parquet che contengono un campo data e ora int96 potrebbero non caricarsi correttamente.
Int96 è un tipo di dato deprecato che contiene informazioni su data e ora senza il fuso orario. Verrà eseguito un tentativo di lettura del campo in UTC ma, dato che ci sono implementazioni di fornitori di diverso tipo, il successo del tentativo non è garantito.
Verificare i dati caricati e adattarli al fuso orario corretto mediante uno scarto, se necessario.