Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Praca z plikami Apache Parquet

Apache Parquet to kolumnowy format pamięci masowej, wykazujący się wysoką wydajnością podczas przechowywania i wysyłania zapytań do dużych zestawów danych. W Qlik Sense można odczytywać dane z plików Parquet i przechowywać tabele jako pliki Parquet.

Parquet umożliwia efektywne odpytywanie określonych kolumn zamiast czytania całej tabeli. Dzięki temu doskonale nadaje się do użytku podczas przetwarzania zbiorów big data. Ponadto Parquet obsługuje wydajną kompresję i kodowanie danych. Może to jeszcze bardziej zmniejszyć zajmowane miejsce w pamięci i poprawić wydajność zapytań.

InformacjaWszystkie aplikacje utworzone w wersji Qlik Sense sprzed sierpnia 2023 r. muszą zostać ręcznie zaktualizowane, aby umożliwić obsługę plików Parquet. Jest to wymagane zarówno w przypadku wdrożeń uaktualnionych do sierpnia 2023 r., jak i podczas importowania istniejących aplikacji do nowego wdrożenia. Aby uzyskać więcej informacji na temat aktualizowania aplikacji, zobacz temat Włączenie obsługi plików Parquet dla istniejących aplikacji w Qlik Sense.

Tworzenie plików Parquet

Pliki Parquet można tworzyć za pomocą polecenia Store w skrypcie. W skrypcie należy określić, że wcześniej wczytana tabela lub część takiej tabeli ma zostać eksportowana do pliku o podanej nazwie i lokalizacji.

Więcej informacji można znaleźć w temacie Store.

Odczyt danych z plików Parquet

Dane z pliku Parquet można odczytywać tak jak z każdego innego pliku danych obsługiwanego przez Qlik Sense. Dotyczy to Menedżera danych, Edytora ładowania danych lub dodawania danych do nowej aplikacji.

Więcej informacji można znaleźć w temacie Ładowanie danych z plików.

Możesz także załadować dane z pliku Parquet w skrypcie ładowania danych za pomocą polecenia LOAD. Na przykład:

LOAD * from xyz.parquet (parquet);

Więcej informacji można znaleźć w temacie Load.

Ograniczenia

  • Zagnieżdżone typy pól nie są obsługiwane przez Qlik Sense. Pola są ładowane, ale zawartość będzie pusta.

  • Pliki Parquet, które zawierają pole znacznika czasu int96, mogą nie być ładowane poprawnie.

    Int96 to przestarzały typ danych, który zawiera sygnaturę czasową bez informacji o strefie czasowej. Zostanie podjęta próba odczytania pola jako wartości w strefie czasowej UTC, ale ponieważ istnieją różne implementacje producentów, nie ma gwarancji powodzenia.

    Sprawdź załadowane dane i w razie potrzeby dostosuj je do prawidłowej strefy czasowej, używając przesunięcia.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!