Tabel is
Voor Excel-, XML-, Parquet- of JSON‑bestanden kunt u de tabel specificeren van waaruit u gegevens laadt in de tabelindelingsspecificatie.
Syntaxis:
Table is table name
Argumenten:
Argumenten
table name |
Specificeert de naam van de tabel. De waarde is afhankelijk van de tabelindeling:
-
Excel: de werkbladnaam.
-
XML: het pad dat het deel van de XML specificeert dat moet worden geladen.
-
Parquet: het pad dat de tabel specificeert met de indeling <node>.<node>.<node>.
Gebruik Table is wanneer u een tabel specificeert binnen een geneste structuur.
Bijvoorbeeld: u hebt Parquet-gegevens in het volgende schema:
Schema:
Field(name: "Name", datatype: String),
Field(name: "Age", datatype: Float),
Field(name: "Phone", datatype: List(
Field(name: "Item", datatype: Struct[
Field(name: "Number", datatype: String)
U kunt Phone en de daarin geneste velden laden als een tabel met het argument Table is [Schema:Phone.Item]. Dit genereert het sleutelveld %Key_Phone met de tabel.
-
JSON: In JSON-bestanden met matrices, het pad naar de iterator voor de subtabel.
U kunt een lading maken van alle tabellen door alle tabellen op te geven in plaats van Tabel is. Bijvoorbeeld:
LOAD * FROM [lib://DataFiles/Sales.json] (json, all tables);
Als uw gegevens meerdere matrices met identieke inhoud bevatten, gebruik dan het trefwoord DISTINCT in de load-instructies voor subtabellen. Bijvoorbeeld:
LOAD DISTINCT * FROM [lib://DataFiles/Sales.json] (json, all tables);
|
Voorbeeld: Excel
LOAD
"Item Number",
"Product Group",
"Product Line",
"Product Sub Group",
"Product Type"
FROM [lib://DataFiles/Item master.xlsx]
(ooxml, embedded labels, table is [Item master]);
Voorbeeld: XML
LOAD
city%Table,
%Key_row_7FAC1F878EC01ECB
FROM [lib://DataFiles/cities.xml]
(XmlSimple, table is [root/row/country/city]);
Voorbeeld: Parquet
Het bestand company.parquet bevat het volgende schema:
company (String)
contact (String)
company:salesrep (List)
salesrep (Group)
salesrep (String)
company:headquarter (List)
headquarter (Group)
country (String)
city (String)
city:region (List)
region (Group)
region (String)
Het volgende zou de inhoud uit het bestand in tabellen laden. De eerste LOAD-instructie laadt de hoofdgroep. De tweede LOAD-instructie laadt de inhoud van de salesrep-groep als een tabel. De derde laadt de headquarter-groep als een tabel. De vierde laadt de region-groep als een tabel.
LOAD * FROM […] (parquet);
LOAD * FROM […] (parquet, table is [company:salesrep.salesrep]);
LOAD * FROM […] (parquet, table is [company:headquarter.headquarter]
LOAD * FROM […] (parquet, table is [company:headquarter.headquarter.city:region.region]
Voorbeeld: JSON
LOAD
customers.customerid,
customers.companyname,
customers.contactname,
customers.contacttitle,
customers.address,
customers.city,
customers.postalcode,
customers.country,
customers.phone,
customers.fax,
%Key_customers,
customers.region
FROM [lib://DataFiles/example.json]
(json, table is [/*/customers]);
Beperkingen:
De specificatie Table is is alleen relevant voor Excel-, XML, Parquet- of JSON-bestanden.