教程 - 生成和可视化预测数据
本教程教授您如何使用 Qlik AutoML 来训练和部署用于进行预测的机器学习模型。它还教您如何在 Qlik Sense 应用程序中可视化预测数据。
我们将考虑客户流失的场景,这是二元分类问题的经典示例。其目标是能够可靠地预测客户是将取消其订阅,还是仍然是服务的订户。这类问题只有两种结果:真或假(已流失或未流失)。
为了解决这个机器学习问题,我们将首先处理一组我们已经知道结果的数据,然后将从该数据创建的统计模型应用于我们希望预测结果的新数据。
您将通过创建一个实验开始本教程。在该实验中,您将训练模型并将其中一个部署到 ML 部署中。此 ML 部署将用于创建预测,可以在 Qlik Sense 应用程序中将这些预测可视化。
您将学到的内容
完成本教程后,您将了解创建和配置实验所涉及的不同步骤。您还将学习如何解释模型分数。最后,您将能部署机器学习模型,并将了解如何使用预测数据在 Qlik Cloud 分析 中生成引人注目的 Qlik Sense 可视化效果。
本教程向您展示了如何通过识别数据集和训练结果的常见问题来手动迭代模型。默认情况下,Qlik AutoML 通过智能模型优化训练您的模型。通过智能优化,在训练过程中进行自动优化。这增加了您的模型在单个版本后准备好部署的可能性,只需要很少的进一步迭代。有关如何使用智能优化训练模型的示例,请参阅示例 - 使用自动机器学习训练模型。
谁应当完成该教程
本教程专为希望在 Qlik Cloud 分析 中介绍自动机器学习和数据可视化的用户设计。一些机器学习和 Qlik Sense 的基本知识是有帮助的,但不是必需的。
要完成本教程,您需要以下内容:
-
专业或 Full User 授权
-
Qlik Cloud 租户中的 Automl Experiment Contributor 和 Automl Deployment Contributor 安全角色
-
审批已部署模型的权限。具体来说,您需要以下项之一:
-
批准或拒绝您的 AutoML 模型(用户权限)
-
批准或拒绝 AutoML 模型(管理员权限)
-
-
您将要工作的空间中所需的空间角色。请参阅:管理共享空间中的权限 和 管理托管空间中的权限
如果您无法查看或创建 ML 资源,这可能意味着您没有所需的角色、权利或权限。请联系您的租户管理员以获取更多信息。
有关更多信息,请参阅谁可以使用 Qlik AutoML。
在开始之前需要做的工作
首先,您需要下载下面链接的教程材料。在 CSV 和 QVD 工作流之间进行选择。下载预配置的应用程序是可选的操作。
下载所需材料后,将其解压缩到桌面上。
-
AutoMLTutorialDatasetsCSV: Contains tutorial data in CSV format. This option is easier for getting started quickly.
-
AutoMLTutorialDatasetsQVF:包含 .qvf 脚本格式的教程数据,可以运行这些脚本来创建 QVD。此选项比 CSV 需要更长的时间,但有助于向您介绍如何使用 Qlik 数据格式和脚本。
-
AutoMLTutorialPreConfiguredApp:此项目是可选项目。它是您将在教程中构建的 Qlik Sense 应用程序的示例副本。这让您可以跳过训练和部署阶段,更快地获得预测性应用程序开发的实践经验。
有关更多信息,请参阅备选工作流程:上传预先配置的应用程序。
训练数据集包含有关客户的信息,这些客户的续订期限已过,并已决定放弃或继续订阅该服务。
应用数据集包含续订日期尚未过期的一组新客户的详细信息。尚未确定这些客户是否会取消服务。本教程的目标是预测这组客户会做什么,希望我们能够降低他们流失的可能性。
选项 ·1:AutoML 教程数据集 (CSV)
执行以下操作:
打开 Analytics 活动中心。
转到“创建”页面,选择数据集,然后选择上传数据文件。
将 AutoML Tutorial - Churn data - training.csv 文件拖到上传对话框。
接下来,将 AutoML Tutorial - Churn data - apply.csv 文件拖到上传对话框。
选择空间如果您希望其他用户能够访问此数据,它可以是您的个人空间或共享空间。
单击上传。
现在数据集已上传,您可以继续创建实验。
选项 ·2:AutoML 教程数据集 (QVD)
执行以下操作:
打开 Analytics 活动中心。
转到“创建”页面,选择上传,然后选择脚本。
将这些文件拖动到上传对话框:
AutoML Tutorial - Churn data - training.qvf
AutoML Tutorial - Churn data - apply.qvf
选择空间如果您希望其他用户能够访问此数据,它可以是您的个人空间或共享空间。
单击上传。
对于每个上传的脚本,请执行以下操作:
打开脚本并切换到编辑器标签。
在编辑器中,单击导出数据。
QVD 数据集是在您上传脚本的同一空间中创建的。
现在数据集已上传,您可以继续创建实验。
本教程中的课程
本教程中的主题设计为按顺序完成。但您也可以暂时离开,然后随时再回来继续学习。
延伸阅读和资源
- Qlik 提供了各种各样的资源帮助您进行深入学习。
- Qlik 在线帮助可用。
- 培训,包括免费的在线课程,可在 Qlik Continuous Classroom 获取。
- 讨论论坛、博客等可见于 Qlik Community。
您的意见很重要
我们感谢您的任何反馈。请使用下面的部分让我们了解我们做得怎样。