Tabell är
För Excel-, XML-, Parquet- och JSON-filer kan du ange tabellen som du laddar data från i specifikatorn för tabellformat.
Syntax:
Table is table name
Argument:
Argument
table name |
Anger tabellens namn. Värdet beror på tabellformatet:
-
Excel: arknamnet.
-
XML: sökvägen som anger den del av XML som ska laddas.
-
Parquet: sökvägen som anger tabellen med formatet <nod> <nod> <nod>.
Använd Table is när du anger en tabell i en nästlad struktur.
Om du exempelvis har Parquet-data i följande schema:
Schema:
Field(name: "Name", datatype: String),
Field(name: "Age", datatype: Float),
Field(name: "Phone", datatype: List(
Field(name: "Item", datatype: Struct[
Field(name: "Number", datatype: String)
Du kan ladda Phone och dess nästlade fält som en tabell med argumentet Table is [Schema:Phone.Item]. Då genereras nyckelfältet %Key_Phone med tabellen.
-
JSON: i JSON-filer med matriser, sökvägen till iteratorn för undertabellen.
Du kan göra en laddning av alla tabeller genom att ange all tables istället för Table is. Exempel:
LOAD * FROM [lib://DataFiles/Sales.json] (json, all tables);
Om dina data innehåller flera matriser med identiskt innehåll, använd nyckelordet DISTINCT i undertabellens LOAD-satser. Exempel:
LOAD DISTINCT * FROM [lib://DataFiles/Sales.json] (json, all tables);
|
Exempel: Excel
LOAD
"Item Number",
"Product Group",
"Product Line",
"Product Sub Group",
"Product Type"
FROM [lib://DataFiles/Item master.xlsx]
(ooxml, embedded labels, table is [Item master]);
Exempel: XML
LOAD
city%Table,
%Key_row_7FAC1F878EC01ECB
FROM [lib://DataFiles/cities.xml]
(XmlSimple, table is [root/row/country/city]);
Exempel: Parquet
Filen company.parquet innehåller följande schema::
company (String)
contact (String)
company:salesrep (List)
salesrep (Group)
salesrep (String)
company:headquarter (List)
headquarter (Group)
country (String)
city (String)
city:region (List)
region (Group)
region (String)
Följande laddar innehållet från filen till tabeller. Den första laddningssatsen laddar rotgruppen. Den andra laddningssatsen laddar innehållet i salesrep-gruppen som en tabell. Den tredje laddar headquarter-gruppen som en tabell. Den fjärde laddar region-gruppen som en tabell.
LOAD * FROM […] (parquet);
LOAD * FROM […] (parquet, table is [company:salesrep.salesrep]);
LOAD * FROM […] (parquet, table is [company:headquarter.headquarter]
LOAD * FROM […] (parquet, table is [company:headquarter.headquarter.city:region.region]
Exempel: JSON
LOAD
customers.customerid,
customers.companyname,
customers.contactname,
customers.contacttitle,
customers.address,
customers.city,
customers.postalcode,
customers.country,
customers.phone,
customers.fax,
%Key_customers,
customers.region
FROM [lib://DataFiles/example.json]
(json, table is [/*/customers]);
Begränsningar:
Table is-specifikatorn är endast relevant för Excel-, XML-, Parquet, och JSON-filer.