Tabel is
Voor Excel-, xml- of Parquet-bestanden kunt u de tabel specificeren vanwaaruit u gegevens laadt in de tabelindelingsspecificatie.
Syntaxis:
Table is table name
Argumenten:
Argumenten
table name |
Specificeert de naam van de tabel. De waarde is afhankelijk van de tabelindeling:
-
Excel: de werkbladnaam.
-
XML: het pad dat het deel van de XML specificeert dat moet worden geladen.
-
Parquet: het pad dat de tabel specificeert met de indeling <node>.<node>.<node>.
Gebruik Table is wanneer u een tabel specificeert binnen een geneste structuur.
Bijvoorbeeld: u hebt Parquet-gegevens in het volgende schema:
Schema:
Field(name: "Name", datatype: String),
Field(name: "Age", datatype: Float),
Field(name: "Phone", datatype: List(
Field(name: "Item", datatype: Struct[
Field(name: "Number", datatype: String)
U kunt Phone en de daarin geneste velden laden als een tabel met het argument Table is [Schema:Phone.Item]. Dit genereert het sleutelveld %Key_Phone met de tabel.
|
Voorbeeld: Excel
LOAD
"Item Number",
"Product Group",
"Product Line",
"Product Sub Group",
"Product Type"
FROM [lib://AttachedFiles/Item master.xlsx]
(ooxml, embedded labels, table is [Item master]);
Voorbeeld: XML
LOAD
city%Table,
%Key_row_7FAC1F878EC01ECB
FROM [lib://AttachedFiles/cities.xml]
(XmlSimple, table is [root/row/country/city]);
Voorbeeld: Parquet
Het bestand company.parquet bevat het volgende schema:
company (String)
contact (String)
company:salesrep (List)
salesrep (Group)
salesrep (String)
company:headquarter (List)
headquarter (Group)
country (String)
city (String)
city:region (List)
region (Group)
region (String)
Het volgende zou de inhoud uit het bestand in tabellen laden. De eerste LOAD-instructie laadt de hoofdgroep. De tweede LOAD-instructie laadt de inhoud van de salesrep-groep als een tabel. De derde laadt de headquarter-groep als een tabel. De vierde laadt de region-groep als een tabel.
LOAD * FROM […] (parquet);
LOAD * FROM […] (parquet, table is [company:salesrep.salesrep]);
LOAD * FROM […] (parquet, table is [company:headquarter.headquarter]
LOAD * FROM […] (parquet, table is [company:headquarter.headquarter.city:region.region]
Beperkingen:
De specificatie Table is is alleen relevant voor Excel-, xml- of Parquet-bestanden.