Store

Instrukcja Store tworzy plik QVD, Parquet, CSV lub TXT.

Składnia:

Store [ fieldlist from] table into filename [ format-spec ];

Ta instrukcja utworzy plik jawnie nazwany QVD, Parquet lub plik tekstowy.

Instrukcja może eksportować pola tylko z jednej tabeli danych, chyba że zachowuje się dane w formacie Parquet. W przypadku eksportowania pól z kilku tabel do pliku QVD, CSV lub TXT należy wcześniej wykonać w skrypcie jawną instrukcję join, aby utworzyć tabelę danych do wyeksportowania. Można przechowywać wiele tabel w jednym pliku Parquet, zagnieżdżając dane w plikach Parquet.

Wartości tekstowe są eksportowane do pliku CSV w formacie UTF-8 z BOM. Możliwe jest określenie ogranicznika — zobacz opis instrukcji LOAD. Instrukcja store do pliku CSV nie obsługuje eksportu BIFF.

W niektórych przypadkach, gdy dane nie są poprawnie sformułowane, pola będą otoczone podwójnymi cudzysłowami, aby zapewnić poprawną interpretację danych. Może się tak zdarzyć na przykład wtedy, gdy pole będzie zawierać znaki takie jak cudzysłowy, przecinek, spację lub podziały wierszy.

Możesz określić, czy plik ma zostać zapisany w Twojej przestrzeni prywatnej, czy w przestrzeni udostępnionej, do której masz uprawnienia do zapisu. Jeśli zapiszesz w przestrzeni udostępnionej, członkowie będą mogli używać tych danych w celu tworzenia aplikacji w tej przestrzeni. Zob.: Zarządzanie uprawnieniami w przestrzeniach udostępnionych.

Argumenty:

Argumenty polecenia Store
Argument	Opis
fieldlist::= ( * \| field) { , field } )	Lista wybieranych pól. Użycie znaku * jako listy pól oznacza wszystkie pola. field::= fieldname [as aliasname ] fieldname jest tekstem identycznym z nazwą pola w tabeli table. (Jeśli nazwa pola zawiera spacje lub inne znaki niestandardowe, musi być ujęta w proste podwójne cudzysłowy lub nawiasy kwadratowe). aliasname jest alternatywną nazwą dla pola, która będzie używana w wynikowym pliku QVD lub CSV.
table	Etykieta skryptu reprezentująca już załadowaną tabelę do użycia jako źródło danych.
filename	Nazwa pliku docelowego wraz z poprawną ścieżką połączenia danych istniejącego folderu. Informacje o tym, co jest uważane za prawidłową ścieżkę, zawiera temat Zasady używania prawidłowych ścieżek folderów przestrzeni. W Qlik Cloud Analytics są obsługiwane hierarchiczne struktury folderów i można się do nich odwoływać w instrukcji. Przykłady: Przestrzeń prywatna (ścieżka najwyższego poziomu): [lib://DataFiles/abc.qvd] Przestrzeń prywatna (folder zagnieżdżony): [lib://DataFiles/MyFolder/abc.qvd] Przestrzeń udostępniona (ścieżka najwyższego poziomu): [lib://TeamSharedSpace:DataFiles/xyz.qvd] Przestrzeń udostępniona (folder zagnieżdżony): [lib://TeamSharedSpace:DataFiles/MyFolder/abc.qvd] Więcej informacji i przykładów zawiera temat Zapisywanie plików w przestrzeniach w Qlik Cloud Analytics.
format-spec ::=( ( txt \| qvd \| parquet), kompresja to kodek)	Specyfikację formatu można ustawić na jeden z następujących formatów plików. Jeśli specyfikacja formatu będzie pominięta, wówczas zostanie przyjęty format qvd. txt w przypadku plików CSV i TXT. qvd dla plików QVD. parquet dla plików Parquet. Jeśli używasz parquet, możesz również ustawić, który kodek kompresji ma być używany z compression is. Jeśli nie określisz kodeka z compression is, zostanie użyty kodek snappy. Dostępne są następujące ustawienia kompresji: uncompressed snappy gzip lz4 brotli zstd lz4_hadoop Przykład: Store mytable into [lib://DataFiles/myfile.parquet] (parquet, compression is lz4);

W rozszerzeniach plików powiązań DataFiles rozróżniana jest wielkość liter. Na przykład: .qvd.

Przykłady:

Store mytable into [lib://DataFiles/xyz.qvd];

Store * from mytable into [lib://DataFiles/myfile.qvd];

Store Name, RegNo from mytable into [lib://DataFiles/xyz.qvd];

Store Name as a, RegNo as b from mytable into [lib://DataFiles/myfile.qvd];

Store mytable into [lib://DataFiles/myfile.txt] (txt);

Store mytable into [lib://DataFiles/myfile.parquet] (parquet);

Store * from mytable into [lib://DataFiles/myfile.csv] (txt);

Store * from mytable into [lib://TeamSharedSpace:DataFiles/myfile.qvd];

Zapisywanie w plikach parquet

Parquet to format pliku o silnym typowaniu, w którym każde pole zawiera pojedynczy, określony typ danych (np. in32, double, sygnatura czasowa lub tekst). Qlik Sense przechowuje dane wewnętrzne jako słabo typowane wartości typu dual, w których dane z różnych źródeł można mieszać w tych samych polach. Ponieważ w każdym polu w pliku Parquet można przechowywać tylko jedną część wartości typu dual, ważne jest, aby wiedzieć, co zawiera każde pole. Qlik Sense używa domyślnie typu pola do określenia sposobu przechowywania tego pola. W przypadku przechowywania danych w plikach Parquet w określonym formacie należy podczas ich ładowania określić, jakiego rodzaju dane mają być Twoje pola. Jeśli spróbujesz zapisać dane w niezgodnych polach pliku Parquet, na przykład liczby w polu tekstowym lub tekst w polu znacznika czasu, otrzymasz wartości zerowe.

Podczas ładowania danych, które zamierzasz przechowywać w pliku Parquet, można zmienić domyślny sposób działania. Możesz sformatować plik tak, aby zmienić typ danych, lub dodać znacznik, aby wymusić określone typy kolumn w formacie Parquet.

Formatowanie danych do przechowywania w pliku Parquet

Do klasyfikowania danych można używać funkcji formatowania Qlik Sense. Na przykład Text(), Num(), Interval() lub Timestamp() mogą wymuszać formaty danych podczas zapisywania danych w pliku Parquet. Qlik Sense może przechowywać dane w prawie 20 typach danych w zależności od atrybutów pól i automatycznych znaczników pól. Więcej informacji zawiera temat Funkcje interpretacji.

Przykład: Formatowanie danych przy użyciu Num() i Text()

Poniższy przykład ilustruje przygotowanie danych do przechowywania w pliku Parquet. Funkcja Num() jest stosowana do pola liczbowego. Funkcję Text() stosuje się zarówno do tekstu, jak i typu mieszanego. W przypadku typu mieszanego funkcja Text() zapobiega traktowaniu go jak pola liczbowego w Parquet i zmianie wartości tekstowych na wartości null.

Data: LOAD * INLINE [ num, text, mixed 123.321, abc, 123 456.654, def, xyz 789.987, ghi, 321 ]; Format:
NoConcatenate LOAD num, text, Text(mixed) as mixed RESIDENT Data; STORE Format INTO [lib://DataFiles/Tmp.parquet] (parquet);

Oznaczanie danych w celu zapisu w pliku Parquet

Dane oznacza się znacznikami $parquet, aby wymusić określone typy kolumn podczas przechowywania danych w pliku Parquet. Każdy typ danych można wymusić, dodając odpowiedni znacznik sterujący. Na przykład, aby zapisać pole jako typ INT32 w pliku Parquet, oznacz je znacznikiem $parquet-int32 w skrypcie ładowania. W zależności od typu danych będzie przechowywany ciąg znaków lub reprezentacja numeryczna danych typu dual.

Poniższych znaczników sterujących Parquet można używać do oznaczania pól do przechowywania w plikach Parquet.

Znaczniki sterujące Parquet
Znacznik sterujący	Dual	Typ fizyczny	Typ logiczny	Przekształcony typ
$parquet-boolean	Liczba	BOOLEAN	BRAK	BRAK
$parquet-int32	Liczba	INT32	BRAK	BRAK
$parquet-int64	Liczba	INT64	BRAK	BRAK
$parquet-float	Liczba	FLOAT	BRAK	BRAK
$parquet-double	Liczba	DOUBLE	BRAK	BRAK
$parquet-bytearray	Ciąg znaków	TABLICA_BAJTÓW	BRAK	UTF8
$parquet-bytearrayfix	Liczba	TABLICA_BAJTÓW_O_STAŁEJ_DŁUGOŚCI	BRAK	DECIMAL
$parquet-decimal	Liczba	INT64	DECIMAL	DECIMAL
$parquet-date	Liczba	INT32	DATE	DATE
$parquet-time	Liczba	INT64	TIME	TIME_MICROS
$parquet-timestamp	Liczba	INT64	ZNACZNIK CZASU	TIMESTAMP_MICROS
$parquet-string	Ciąg znaków	TABLICA_BAJTÓW	STRING	UTF8
$parquet-enum	Ciąg znaków	TABLICA_BAJTÓW	ENUM	ENUM
$parquet-interval	Liczba	TABLICA_BAJTÓW_O_STAŁEJ_DŁUGOŚCI	INTERVAL	INTERVAL
$parquet-json	Ciąg znaków	TABLICA_BAJTÓW	JSON	JSON
$parquet-bson	Ciąg znaków	TABLICA_BAJTÓW	BSON	BSON
$parquet-uuid	Ciąg znaków	TABLICA_BAJTÓW_O_STAŁEJ_DŁUGOŚCI	UUID	BRAK

Przykład: Oznaczanie danych w celu zapisu w pliku Parquet

W tym przykładzie dwa znaczniki służą do definiowania danych dla formatu Parquet. Pole num jest oznaczone znacznikiem $parquet-int32 w celu zdefiniowania go jako pola liczbowego, które w pliku Parquet zostanie ustawione jako INT32.

Data: LOAD * INLINE [ num, text, 123.321, abc 456.654, def 789.987, ghi ]; TAG num WITH '$parquet-int32'; STORE Format INTO [lib://DataFiles/Tmp.parquet] (parquet);

Przechowywanie zagnieżdżonych danych w plikach Parquet

Możesz przechowywać wiele tabel w plikach Parquet, zagnieżdżając je w uporządkowanych danych. Store obsługuje ustrukturyzowane węzły i węzły w formie listy w schemacie gwiazdy. Pojedyncze tabele można również przechowywać w trybie zagnieżdżonym, używając określenia Ogranicznikiem jest.

Podczas zapisywania tabel określ tabele, które chcesz uwzględnić, oddzielając je przecinkami. Na przykład: STORE Table1, Table2, Table3 INTO [lib://<file location>/<file name>.parquet] (parquet);. Możesz kontrolować, które pola mają być zachowane, korzystając z listy pól w instrukcji Store. Na przykład STORE Field1, Field2, FROM Table1, Table2 INTO [lib://<file location>/<file name>.parquet] (parquet);. Wszystkie pola na liście pól muszą znajdować się w co najmniej jednej z wymienionych tabel. Pierwsza tabela w instrukcji Store zostanie użyta jako tabela faktów w schemacie gwiaździstym.

Nazwy pól służą do kontrolowania sposobu tworzenia i zagnieżdżania grup. Domyślnie nazwy pól są dzielone na węzły za pomocą kropki (.). Separator można zmienić, ustawiając zmienną systemową FieldNameDelimiter lub używając specyfikatora Delimiter is. Specyfikator spowoduje zastąpienie zmiennej systemowej. Więcej informacji zawiera temat Praca ze zmiennymi w edytorze ładowania danych.

Nazwy pól są oddzielane separatorem, a poszczególne części służą do tworzenia schematu z zagnieżdżonymi grupami. Na przykład instrukcja STORE Field1, Field1.Field2, Field1.Field3, Field1.Field4 FROM Table1 INTO [nested.parquet] (parquet, delimiter is '.'); utworzy dwie grupy (Group1 i Group2) z Field1, Field2 i Field3, Field4.

Grupy i pola nie mogą mieć tej samej nazwy w węźle schematu. Na przykład instrukcja STORE Address, Address.Street INTO [nested.parquet] (parquet, delimiter is '.''); zakończy się niepowodzeniem, ponieważ Adres jest niejednoznaczny i jest zarówno polem danych, jak i grupą.

Podczas przechowywania zagnieżdżonych danych w formacie Parquet klucze między tabelami są przekształcane w węzły łączy w schemacie. Tabele są przekształcane w ustrukturyzowane węzły w schemacie. Domyślną transformację można zastąpić za pomocą nazw pól.

Przykład: Przechowywanie zagnieżdżonych danych w pliku Parquet

company: LOAD * INLINE [ company, contact A&G, Amanda Honda Cabro, Cary Frank Fenwick, Dennis Fisher Camros, Molly McKenzie ]; salesrep: LOAD * INLINE [ company, salesrep A&G, Bob Park Cabro, Cezar Sandu Fenwick, Ken Roberts Camros, Max Smith ]; headquarter: LOAD * INLINE [ company, country, city A&G, USA, Los Angeles Cabro, USA, Albuquerque Fenwick, USA, Baltimore Camros, USA, Omaha ]; region: LOAD * INLINE [ region, city West, Los Angeles Southwest, Albuquerque East, Baltimore Central, Omaha ]; STORE company, salesrep, headquarter, region INTO [lib://DataFiles/company.parquet] (parquet) DROP TABLES company, salesrep, headquarter, region;

Wynikowy plik Parquet ma następujący schemat:

company (String) contact (String) company:salesrep (List) salesrep (Group) salesrep (String) company:headquarter (List) headquarter (Group) country (String) city (String) city:region (List) region (Group) region (String)

Ograniczenia

Przechowywanie zagnieżdżonych danych w formacie Parquet ma następujące ograniczenia:

Operacja Store nie obsługuje węzłów mapy.
Przechowywanie nie obejmuje pól klucza generowanych w wyniku ładowania zagnieżdżonych plików Parquet.
Nie można przechowywać razem danych z tabel, które nie są powiązane z polami klucza.
Zagnieżdżony plik denormalizuje model danych. Wartości, do których nie ma odniesień, nie zostaną zapisane, a wartości, do których istnieje wiele odwołań, zostaną skopiowane.

Zapisywanie plików w przestrzeniach w Qlik Cloud Analytics

Gdy używasz instrukcji Store w skrypcie ładowania w Qlik Cloud, możesz odwołać się do dokładnego folderu w przestrzeni, w którym chcesz przechowywać utworzone pliki. Przestrzegaj zasad używania prawidłowych ścieżek folderów przestrzeni. Dodatkowo mają również zastosowanie następujące działania i są unikatowe dla instrukcji Store:

Jeśli przestrzeń istnieje, ale określona ścieżka folderu nie, ścieżka zostanie utworzona w tej przestrzeni. W zależności od zdefiniowanej struktury folderów może zostać utworzony jeden lub więcej folderów. Plik jest generowany i tam zapisywany.
Jeśli przestrzeń istnieje, ale określona ścieżka folderu używa nieprawidłowych separatorów folderów (na przykład \, \\, //, /./ lub /../), instrukcja Store jest nadal wykonywana. Plik wyjściowy jest zamiast tego zapisywany w ścieżce najwyższego poziomu w przestrzeni docelowej i będzie miał nazwę zawierającą pełną ścieżkę, a nie tylko określoną nazwę.
Jeśli przestrzeń nie istnieje, nie można wykonać instrukcji Store i zostanie zwrócony błąd.

Poniższe przykłady pokazują, jak odwołać się do konkretnej ścieżki folderu w przestrzeni w instrukcji Store.

Przykład: Zapisywanie pliku w ścieżce najwyższego poziomu w przestrzeni

W tym przykładzie cała tabela mytable jest eksportowana do Qlik Cloud Analytics jako plik o nazwie myfile.qvd. Plik zostanie dodany do przestrzeni udostępnionej TeamSharedSpace. Plik nie znajduje się w żadnym konkretnym folderze, tylko na ścieżce najwyższego poziomu w przestrzeni.

Store * from mytable into [lib://TeamSharedSpace:DataFiles/myfile.qvd];

Przykład: Zapisywanie pliku w konkretnej ścieżce folderów w przestrzeni

W tym przykładzie cała tabela mytable jest eksportowana do Qlik Cloud Analytics jako plik o nazwie myfile.qvd. Plik jest dodawany do folderu SalesData w przestrzeni TeamSharedSpace.

Store * from mytable into [lib://TeamSharedSpace:DataFiles/SalesData/myfile.qvd];

Więcej informacji na temat odwoływania się do struktury folderów w przestrzeni w skryptach ładowania zawiera temat Odwoływanie się do struktury folderów w rozwoju aplikacji i skryptów.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!

Przekaż tu opinię