Databricks MLflow 分析源
Databricks MLflow 是一个机器学习平台,用于自动化、保障和加速预测分析,帮助数据科学家和分析师建立和部署准确的预测模型。
要连接到 Databricks MLflow,您必须创建或访问模型并将其部署到 Databricks MLflow 平台上的端点。此外,此端点必须是 Qlik Cloud 可公开访问的。
限制
-
Databricks MLflow 有端点配额。有关更多信息,请参阅 Databricks 机器学习简介。
-
已部署模型的 Databricks MLflow 服务上的可用资源会影响并限制 Qlik Sense 中重新加载和图表响应的性能。
-
Databricks MLflow 连接器被限制为每个请求 200,000 行。这些将以 2,000 行为单位分批发送到端点服务。在必须处理更多行的场景中,在数据加载脚本中使用循环批量处理更多行。
-
当定期重新加载应用程序时,最佳实践是使用 QVD 文件缓存预测,而且只将新行发送到预测端点。这将提高 Qlik Sense 应用程序重新加载的性能,并减少 Databricks MLflow 端点上的负载。
-
在图表表达式中使用 Databricks MLflow 时,提供字段的数据类型非常重要,因为模型需要以正确的字符串/数字格式处理这些字段。在图表表达式中服务器端扩展的一个限制是数据类型不会像在加载脚本中那样被自动检测。
-
如果您正在使用相关连接名称,如果您决定将应用程序从一个共享空间移动到另一个共享空间,或者如果您将应用程序从共享空间移动到您的私人空间,那么会需要一些时间更新分析连接以反映新的空间位置。