添加数据集
从目录中添加数据集以供使用。您可以将数据文件直接上传到 Qlik Cloud,在那里,它们可以用作数据集或在加载脚本中使用。您还可以创建引用存储在 Qlik Cloud 外部的数据集—具体来说,这些数据集是使用 数据连接 定义的。
将数据集添加为存储在 Qlik Cloud 中的本地文件
您可以将数据文件直接上传到 Qlik Cloud。当您将数据文件上传到 Qlik Cloud 时,它也会被创建为一个数据集,其中包含可以通过目录、影响分析和世系工具进行访问的元数据。有关数据文件和数据集之间区别的其他注意事项,请参阅 数据文件和数据集之间的区别。
有关支持的文件类型,请参阅从文件中加载数据。
数据文件最多可达 100 GB。然而,当上载非常大的数据文件(超过 6 GB)时,您可能会遇到引擎容量的限制。由于将 QVD 文件加载到引擎中所需的内存使用量,QVD 数据文件更有可能遇到这些约束。有关增加可用容量的更多信息,请参阅 大型应用程序支持。
执行以下操作:
-
转到 Analytics 活动中心的“创建”页面,然后选择数据集。
您还可以通过在目录中单击新建 > 数据集,从迷你主页添加数据集。
- 单击上传数据文件。
-
将数据文件拖放到添加文件对话框中。
或者单击浏览并导航至您的数据文件。
-
使用下拉菜单指定文件的路径。首先选择一个空间,然后导航到空间中要存储文件的文件夹。
也可以手动键入完整路径。
- 选择文件的目标空间。
-
单击上传。
或者,要立即从数据集创建应用程序,请单击上传和分析。
使用 数据管理器(拖放或其他直接上载)将数据集文件导入 Qlik Sense 应用程序或空间时,最多可以加载 5000 个字段。
数据文件和数据集之间的区别
在 Qlik Cloud 中本地存储的基于文件的数据源,从源上讲就是数据文件。每个数据文件还以数据集的形式存在,可以使用目录、世系和影响分析工具进行分析和编辑。为简单起见,数据文件及数据集通常被等同使用。不过,这两个术语之间还是有重要区别的 - 尤其是在加载脚本开发中使用数据文件时。
当您直接在Qlik Cloud中存储数据文件时,该资源将作为数据文件创建。在Qlik Cloud中,同一文件将以两种不同方式显示:
-
在空间详细信息 > 数据文件中,将显示底层数据文件。
-
从目录中的一般概览,以及在主页、收藏夹和集合中,都将显示数据集。根据您在用户界面中的访问权限和位置,您可能还可以查看数据集的底层数据文件。
当您编辑存储在 Qlik Cloud 中的数据文件和数据集时,这种区别很重要。编辑存储在 Qlik Cloud 中作为文件的数据集—具体来说,是重命名它—不会重命名底层数据文件。相反,它只是向数据集添加一个别名。因为分析内容(例如应用程序和脚本)引用的是底层数据文件而不是数据集,所以如果您需要引用在应用程序和脚本开发期间正常运行,则必须重命名底层数据文件而不是其数据集。
有关更多信息,请参阅数据文件与数据集之间的区别。
添加数据文件的其他方法
您还可以通过许多其他方式将数据文件上传到 Qlik Cloud Analytics。例如,在构建特定的分析资源时,通常可以添加数据。
常见的方法包括:
-
管理空间时。
-
在构建应用程序和脚本时。您可以使用 数据加载编辑器、数据管理器 或 脚本 界面上传数据文件。
-
在应用程序和脚本开发期间使用 STORE 脚本语句。
-
作为数据流的输出。
-
当您在 ML 实验中添加训练数据时。
-
当在 ML 部署中创建预测配置时。
-
当使用 Qlik Answers 时。
管理空间中的数据文件
有关管理本地存储在 Qlik Cloud 中的数据文件的更多信息,请参阅 管理数据文件。
从现有连接添加数据集
从现有 ODBC 连接创建数据集。创建数据集时,从数据源中选择一个数据库,然后选择该数据库中的表。将为您选择的每个表创建一个数据集。以这种方式创建的数据集在每次打开数据集时都会刷新其数据。
通过连接创建数据集,您可以对来自外部数据源的数据使用编目和世系选项。
当您从数据连接创建数据集时,该数据集不包含任何可在空间内管理的底层数据文件。这是因为数据集存储在 Qlik Cloud 之外。
从连接创建的数据集必须与该数据源的连接位于同一空间。如果将数据集移动到没有该连接的空间,则数据集中只有数据集名称和有限的元数据可用。
执行以下操作:
-
转到 Analytics 活动中心的“创建”页面,然后选择数据集。
您还可以通过在目录中单击新建 > 数据集,从迷你主页添加数据集。
-
从可用连接中选择到数据源的连接,然后单击下一步。
-
在数据库下,选择包含要为其创建数据集的表的数据库。
-
在表下,选择要从中创建数据集的表。每个 表将创建新的数据集。
-
单击下一步。
-
从选择空间中选择数据集的目标空间。
如果空间无法访问您选择的连接,则需要在 <space name> 中选择新建连接。
-
单击创建数据集。
从新连接添加数据集
添加新的 ODBC 连接并从中创建数据集。
当您从数据连接创建数据集时,该数据集不包含任何可在空间内管理的底层数据文件。这是因为数据集存储在 Qlik Cloud 之外。
从连接创建的数据集必须与该数据源的连接位于同一空间。如果将数据集移动到没有该连接的空间,则数据集中只有数据集名称和有限的元数据可用。
执行以下操作:
-
转到 Analytics 活动中心的“创建”页面,然后选择数据集。
您还可以通过在目录中单击新建 > 数据集,从迷你主页添加数据集。
-
单击创建连接。
-
选择连接的目标空间。
-
在数据连接器下,选择数据源。
-
添加连接的详细信息。
-
输入数据源的连接设置。
有关支持的连接的信息,请参阅加载分析数据。
-
单击创建。
-
从可用连接中选择连接,然后单击下一步。
-
在数据库下,选择包含要为其创建数据集的表的数据库。
-
在表下,选择要从中创建数据集的表。每个 表将创建新的数据集。
-
单击下一步。
-
从选择空间中选择数据集的目标空间。
如果空间无法访问您选择的连接,则需要在 <space name> 中选择新建连接。
-
单击创建数据集。