在加载脚本中选择数据
您可以使用 数据加载编辑器 或 脚本 中的 选择数据 选择要从文件或数据库表中加载哪些字段,以及需要数据源的哪些视图。
除了选择字段外,您还可以在对话框中重命名字段。完成字段选择后,您可以将生成的脚本代码插入到脚本中。
某些数据源(例如 CSV 文件)包含单个表,而其他数据源(例如 Microsoft Excel 电子表格或数据库)可以包含多个表。
不要在数据加载编辑器中添加在数据管理器内具有相同名称和相同列,且已作为脚本化表格添加的表格。
您可以通过在 数据加载编辑器 或 脚本 中的数据连接上单击 来打开 选择数据。
您还可以从数据目录中选择要加载的数据。有关详细信息,请参阅 从数据目录加载数据。
从数据库中选择数据
从数据库中选择数据时,数据源可以包含多个表。
执行以下操作:
-
在脚本编辑器中,单击 数据源。
-
在左侧的 数据连接 下,单击数据库连接上的
。
此时将显示选择数据对话框。
-
此步骤仅适用于 Databricks。如果您的 Databricks 主机支持 Unity 目录,您在 创建新连接 对话框中指定的目录将显示在 目录 字段中。您可以保持其不变,也可以从下拉列表中选择其他目录。
信息注释虽然您可以从多个数据库中选择数据,但所有数据库必须属于同一个目录。 -
从下拉列表中选择 数据库。
某些选择对话框没有 数据库 下拉列表,因为数据库名称是在配置连接时输入的。
-
选择数据库的 所有者。
表 列表将填充所选数据库中可用的视图和表。
某些数据库不需要在数据选择过程中指定所有者。
- 选择一个表。
-
通过勾选要加载的每个字段旁边的复选框,选择要加载的字段。
您可以通过勾选表名旁边的复选框来选择表中的所有字段。
提示注释您可以通过单击现有字段名称并输入新名称来编辑字段名称。这可能会影响该表与其他表的链接方式,因为默认情况下它们是通过公共字段进行联接的。 -
如果确定要从其他表中添加数据,请选择这些表。
信息注释在通过搜索筛选字段时,不能同时在数据选择向导中重命名字段。首先必须在文本框中删除搜索字符串。信息注释不能重命名同一表格中的两个字段,使它们具有相同的名称。 -
完成数据选择后,执行以下操作:
-
单击 添加。
数据选择窗口将关闭,并且 LOAD /SELECT 语句将根据您的选择插入到脚本中。
-
从 Microsoft Excel 电子表格中选择数据
当您从 Microsoft Excel 电子表格中选择数据时,该文件可以包含多个工作表。每个工作表都作为单独的表加载。例外情况是,如果该工作表与其他工作表或已加载的表具有相同的字段/列结构,在这种情况下,这些表将被串联。
有关详细信息,请参阅 从 Microsoft Excel 电子表格加载数据。
执行以下操作:
-
单击 数据源。
-
如果电子表格位于您可以访问的空间中,您可以使用下拉菜单选择空间。
-
单击 数据加载编辑器 中相应文件夹连接上的
。
此时将显示选择文件对话框。
-
从该文件夹连接可访问的文件列表中选择一个文件,然后单击 继续。
您可以导航到该文件所在空间内的文件夹。通过在列表中选择文件夹进行导航,或在 路径 下输入特定的文件夹路径。
-
选择要从中选择数据的第一个工作表。您可以通过勾选工作表名称旁边的复选框来选择工作表中的所有字段。
-
确保您对该工作表进行了适当的设置:
帮助您正确解释表格数据的设置 UI 项目 说明 字段名称 设置以指定表格是包含嵌入的字段名称还是无字段名称。通常在 Excel 电子表格中,第一行包含嵌入的字段名称。如果选择无字段名称,则将字段命名为 A、B、C... 标题大小
将要省略的行数设置为表格标题,通常包含一般信息的行不是为列格式。
-
通过勾选要加载的每个字段旁边的复选框,选择要加载的字段。
提示注释您可以通过单击现有字段名称并输入新名称来编辑字段名称。这可能会影响该表与其他表的链接方式,因为默认情况下它们是通过公共字段进行联接的。 -
完成数据选择后,执行以下操作:
-
单击 添加。
数据选择窗口将关闭,并且 LOAD /SELECT 语句将根据您的选择插入到脚本中。
-
从表文件中选择数据
您可以从大量数据文件中选择数据:
- 文本文件,字段数据在其中以逗号、制表符或分号等分隔符分隔(以逗号分隔的变量 (CSV) 文件)。
- HTML 表格。
- XML 文件。
- KML 文件。
- Qlik 本地 QVD 和 QVX 文件。
- 固定记录长度文件。
- DIF 文件(Data Interchange Format)。
执行以下操作:
-
If the file is in a space that you can access, you can select a space using the drop down menu.
-
单击脚本编辑器中相应文件夹连接上的
。
此时将显示选择文件对话框。
-
从该文件夹连接可访问的文件列表中选择一个文件,然后单击 继续。
您可以导航到该文件所在空间内的文件夹。通过在列表中选择文件夹进行导航,或在 路径 下输入特定的文件夹路径。
- 确保在 文件格式 中选择了适当的文件类型。
-
确保您对该文件进行了适当的设置。不同的文件类型具有不同的文件设置。
有关详细信息,请参阅 选择文件类型的设置。
-
通过勾选要加载的每个字段旁边的复选框,选择要加载的字段。您也可以通过勾选工作表名称旁边的复选框来选择文件中的所有字段。
提示注释您可以通过单击现有字段名称并输入新名称来编辑字段名称。这可能会影响该表与其他表的链接方式,因为默认情况下它们是通过公共字段进行联接的。 -
完成数据选择后,单击 添加。
-
数据选择窗口将关闭,并且 LOAD /SELECT 语句将根据您的选择插入到脚本中。
信息注释在空间中具有编辑权限的用户可以在该空间中读取、写入和加载 DataFiles。其他用户将看不到 DataFiles。
选择文件类型的设置
定界符表文件
这些设置针对定界符表文件进行了验证,该文件包含单个表,其中每个记录由换行符分隔,每个字段由定界符字符分隔,例如 CSV 文件。
| UI 项目 | 说明 |
|---|---|
| 定界表文件的文件格式 |
设置为 定界 或 固定记录。 进行选择时,选择数据对话框将适应您选择的文件格式。 |
| 字段名 | 设置以指定表是包含 嵌入式字段名 还是 无字段名。 |
|
定界符 |
设置表文件中使用的定界符字符。 |
| 引用 |
设置以指定如何处理引号: 无 = 不接受引号字符 标准 = 标准引用(引号可用作字段值的首尾字符) MSQ = 现代风格引用(允许字段中包含多行内容) |
|
表头大小 |
设置要作为表头忽略的行数。 |
|
字符集 |
设置表文件中使用的字符集。 |
| 注释 |
数据文件可以在记录之间包含注释,通过在行首使用一个或多个特殊字符(例如 //)来表示。 指定一个或多个字符来表示注释行。Qlik Sense 不会加载以此处指定的字符开头的行。 |
| 忽略文件结束字符 | 如果您的数据包含作为字段值一部分的文件结束字符,请选择忽略文件结束字符。 |
固定记录数据文件
固定记录数据文件包含单个表,其中每个记录(数据行)包含若干具有固定字段大小的列,通常用空格或制表符填充。
您可以通过两种不同的方式设置字段中断位置:
-
手动在 字段中断位置 中输入以逗号分隔的字段中断位置。每个位置标记字段的开始。
示例: 1,12,24
- 启用 字段中断 以在字段数据预览中以交互方式编辑字段中断位置。字段中断位置 将更新为所选位置。您可以:
在字段数据预览中单击以插入字段中断。
- 单击字段中断将其删除。
- 拖动字段中断将其移动。
| 界面项目 | 说明 |
|---|---|
| 字段名称 | 设置以指定表是包含嵌入式字段名称还是无字段名称。 |
|
标题大小 |
将标题大小设置为要作为表标题忽略的行数。 |
|
字符集 |
设置为表文件中使用的字符集。 |
| 制表符大小 | 设置为一个制表符在表文件中代表的空格数。 |
| 记录行大小 |
设置为一个记录在表文件中跨越的行数。默认值为 1。 |
| 忽略文件结束字符 | 如果您的数据包含作为字段值一部分的文件结束字符,请选择忽略文件结束字符。 |
HTML 文件
HTML 文件可以包含多个表。Qlik Sense 将所有带有 <TABLE> 标签的元素解释为表。
| UI 项目 | 说明 |
|---|---|
| 字段名称 | 设置以指定表格是包含嵌入的字段名称还是无字段名称。 |
|
字符集 |
设置在表格文件中使用的字符集。 |
XML 文件
您可以加载以 XML 格式存储的数据。
没有针对 XML 文件的特定文件格式设置。
KML 文件
您可以加载以 KML 格式存储的地图文件,以便在地图 可视化 中使用。
没有针对 KML 文件的特定文件格式设置。
有关详细信息,请参阅 加载您自己的地图数据。
QVD 文件
您可以加载以 QVD 格式存储的数据。QVD 是原生的 Qlik 格式,只能由 Qlik Sense 或 QlikView 写入和读取。该文件格式在从 Qlik Sense 脚本读取数据时进行了速度优化,但它仍然非常紧凑。
没有针对 QVD 文件的特定文件格式设置。
有关详细信息,请参阅 使用 QVD 文件。
QVX 文件
您可以加载以 Qlik data eXchange (QVX) 格式存储的数据。QVX 文件由使用 Qlik QVX SDK 开发的自定义连接器创建。
没有针对 QVX 文件的特定文件格式设置。
有关详细信息,请参阅 使用 Qlik QVX SDK 构建自定义连接器(仅限英语)。
Apache Parquet
您可以加载以 Parquet 格式存储的数据。
没有针对 Parquet 文件的特定文件格式设置。
JSON
您可以加载以 JSON 格式存储的数据。
没有针对 JSON 文件的特定文件格式设置。
预览脚本
将要插入的语句显示在脚本预览中,您可以通过单击 预览脚本 选择将其隐藏。
包括 LOAD 语句
如果选中了 包括 LOAD 语句,则会生成带有前置 LOAD 语句的 SELECT 语句,并使用 SELECT 语句作为输入。
内联加载
通过内联加载,您可以手动将数据输入为文本。基本的内联加载会创建一个表,并插入数据字段和记录。
您可以在 数据加载编辑器 中创建和加载内联表。
以下脚本包含一个简单的内联加载。
MyTable:
Load * Inline [
Country, Year, Sales
Argentina, 2014, 66295.03
Argentina, 2015, 140037.89
Austria, 2014, 54166.09
Austria, 2015, 182739.87
];以下语法用于以上内联加载:
Load * Inline 指示 Qlik Sense 从下面的内联表中加载所有字段。
MyTable: 定义表的名称。可以从 数据模型查看器 和其他区域访问应用程序中的表列表。
方括号包含数据。
LOAD 语句的第一行定义了数据字段。
逗号分隔数据字段和记录。
LOAD 语句以分号结束。
有关内联加载的信息,请参阅 使用内联加载来加载数据。