教程 – 使用 Qlik AutoML 创建预测应用程序
本教程教您如何使用 Qlik AutoML 分析数据并创建应用程序,以可视化使用该平台创建的预测数据。
我们将考虑客户流失的场景,这是二进制分类问题的经典示例。其目标是能够可靠地预测客户是将取消其订阅,还是仍然是服务的订户。这类问题只有两种结果:真或假(已流失或未流失)。
为了解决这个机器学习问题,我们将首先处理一组我们已经知道结果的数据,然后将从该数据创建的统计模型应用于我们希望预测结果的新数据。这是我们将在本教程中采用的方法。
为了创建可靠和准确的模型,您应该确保训练数据集不包含泄漏或“泄漏特征”。当训练数据中的一个或多个特征可用于导出您试图预测的目标变量时,或者当训练数据的一个或者多个特征包含预测时未知的信息时,就会发生数据泄漏。
您将通过创建一个实验开始本教程。从那里,您将改进实验并将其部署到机器学习模型中。该模型将用于创建预测,可以在 Qlik Sense 应用程序中以可视化的形式显示。
您将学到的内容
完成本教程后,您将了解创建和配置实验所涉及的不同步骤。您还将学习如何解释模型分数。最后,您将能部署机器学习模型,并将了解如何使用预测数据在 Qlik Cloud 中生成引人注目的可视化效果。
谁应当完成该教程
本教程专为希望在 Qlik Cloud 中介绍自动机器学习的用户设计。
在开始之前需要做的工作
下载该程序包并将其在您的桌面上解压:
该包含有完成本教程所需的两个数据文件。将数据文件上载到目录。
“训练”数据集包含有关客户的信息,这些客户的续订期限已过,并已决定放弃或继续订阅该服务。
“apply”数据集包含续订日期尚未过期的一组新客户的详细信息。尚未确定这些客户是否会取消服务。本教程的目标是预测这组客户会做什么,希望我们能够降低他们流失的可能性。
执行以下操作:
-
打开 Qlik Sense 应用中心。
-
单击新增 > 数据集,然后选择上载数据文件。
-
将 Customer churn data - training.csv 文件拖到上载对话框。
-
接下来,将 Customer churn data - apply.csv 文件拖到上传对话框。
-
选择空间如果您希望其他用户能够访问此数据,它可以是您的个人空间或共享空间。
-
单击上传。
现在数据集已上载,您可以继续创建实验。
本教程中的课程
本教程中的主题设计为按顺序完成。但您也可以暂时离开,然后随时再回来继续学习。
延伸阅读和资源
- Qlik 提供了各种各样的资源帮助您进行深入学习。
- Qlik 在线帮助可供使用。
- 培训,包括免费的在线课程,可在 Qlik Continuous Classroom 获取。
- 讨论论坛、博客等可见于 Qlik Community。
您的意见很重要
我们感谢您的任何反馈。请使用下面的部分让我们了解我们做得怎样。