Table is
W przypadku plików w formacie Excel, XML, Parquet lub JSON tabelę, z której ładuje się dane, można określić w specyfikatorze formatu tabeli.
Składnia:
Table is table name
Argumenty:
Argumenty
table name |
Określa nazwę tabeli. Wartość zależy od formatu tabeli:
-
Excel: nazwa arkusza.
-
XML: ścieżka określająca część pliku XML do załadowania.
-
Parquet: ścieżka określająca tabelę, w formacie <węzeł>.<węzeł>.<węzeł>.
Użyj Table is podczas określania tabeli w strukturze zagnieżdżonej.
Na przykład masz dane w formacie Parquet w następującym schemacie:
Schema:
Field(name: "Name", datatype: String),
Field(name: "Age", datatype: Float),
Field(name: "Phone", datatype: List(
Field(name: "Item", datatype: Struct[
Field(name: "Number", datatype: String)
Możesz załadować Phone wraz z zagnieżdżonymi polami jako tabelę z argumentem Table is [Schema:Phone.Item]. Spowoduje to wygenerowanie pola klucza %Key_Phone z tabelą.
-
JSON: w plikach JSON z tablicami ścieżka do iteratora dla tabeli podrzędnej.
Możesz załadować wszystkie tabele, określając all tables zamiast Table is. Na przykład:
LOAD * FROM [lib://DataFiles/Sales.json] (json, all tables);
Jeśli dane zawierają wiele tablic o identycznej zawartości, należy użyć słowa kluczowego DISTINCT w instrukcjach ładowania tabeli podrzędnej. Na przykład:
LOAD DISTINCT * FROM [lib://DataFiles/Sales.json] (json, all tables);
|
Przykład: Excel
LOAD
"Item Number",
"Product Group",
"Product Line",
"Product Sub Group",
"Product Type"
FROM [lib://DataFiles/Item master.xlsx]
(ooxml, embedded labels, table is [Item master]);
Przykład: XML
LOAD
city%Table,
%Key_row_7FAC1F878EC01ECB
FROM [lib://DataFiles/cities.xml]
(XmlSimple, table is [root/row/country/city]);
Przykład: Parquet
Plik company.parquet zawiera następujący schemat:
company (String)
contact (String)
company:salesrep (List)
salesrep (Group)
salesrep (String)
company:headquarter (List)
headquarter (Group)
country (String)
city (String)
city:region (List)
region (Group)
region (String)
Poniższy kod załaduje zawartość z pliku do tabel. Pierwsza instrukcja Load ładuje grupę elementu głównego. Druga instrukcja Load ładuje zawartość grupy salesrep w postaci tabeli. Trzecia ładuje grupę headquarter jako tabelę. Czwarta ładuje grupę region jako tabelę.
LOAD * FROM […] (parquet);
LOAD * FROM […] (parquet, table is [company:salesrep.salesrep]);
LOAD * FROM […] (parquet, table is [company:headquarter.headquarter]
LOAD * FROM […] (parquet, table is [company:headquarter.headquarter.city:region.region]
Przykład: JSON
LOAD
customers.customerid,
customers.companyname,
customers.contactname,
customers.contacttitle,
customers.address,
customers.city,
customers.postalcode,
customers.country,
customers.phone,
customers.fax,
%Key_customers,
customers.region
FROM [lib://DataFiles/example.json]
(json, table is [/*/customers]);
Ograniczenia:
Określnik Table is dotyczy wyłącznie plików w formacie Excel, XML, Parquet, JSON.