跳到主要内容

Table is

对于 Excel、XML 或 Parquet 文件,可以在表格式说明符中指定要从中加载数据的表。

语法:  

Table is table name

参数:  

参数
参数 描述
table name

指定表的名称。该值取决于表格式:

  • Excel:工作表名称。

  • XML:指定要加载的 XML 部分的路径。

  • Parquet:指定表的路径,格式为 <node>.<node>.<node>

    在嵌套结构中指定表时使用 Table is

    例如,您有以下模式中的 Parquet 数据:

    Schema: Field(name: "Name", datatype: String), Field(name: "Age", datatype: Float), Field(name: "Phone", datatype: List( Field(name: "Item", datatype: Struct[ Field(name: "Number", datatype: String)

    您可以将 Phone 及其嵌套字段加载为带有参数 Table is [Schema:Phone.Item] 的表。这将与表一起生成关键字段 %Key_Phone

示例: Excel

LOAD "Item Number", "Product Group", "Product Line", "Product Sub Group", "Product Type" FROM [lib://DataFiles/Item master.xlsx] (ooxml, embedded labels, table is [Item master]);

示例: 数据截断,

LOAD city%Table, %Key_row_7FAC1F878EC01ECB FROM [lib://DataFiles/cities.xml] (XmlSimple, table is [root/row/country/city]);

示例: Parquet

文件 company.parquet 包含以下模式:

company (String) contact (String) company:salesrep (List) salesrep (Group) salesrep (String) company:headquarter (List) headquarter (Group) country (String) city (String) city:region (List) region (Group) region (String)

以下操作将把文件中的内容加载到表中。第一个 LOAD 语句加载根组。第二个 LOAD 语句将 salesrep 组的内容加载为一个表。第三个 LOAD 语句将总部组加载为一个表。第四个 LOAD 语句将地区组加载为表。

LOAD * FROM […] (parquet); LOAD * FROM […] (parquet, table is [company:salesrep.salesrep]); LOAD * FROM […] (parquet, table is [company:headquarter.headquarter] LOAD * FROM […] (parquet, table is [company:headquarter.headquarter.city:region.region]

限制:  

Table is 说明符仅对 Excel、XML 或 Parquet 文件相关。

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们如何改进!