Source analytique Databricks MLflow
Databricks MLflow est une plateforme d'apprentissage automatique qui permet d'automatiser, de garantir et d'accélérer les analyses prédictives. Elle permet aux scientifiques et aux analystes de données de créer et de déployer des modèles prédictifs précis.
Pour se connecter à Databricks MLflow, vous devez avoir créé un modèle ou y avoir accès et l'avoir déployé vers un point de terminaison sur la plateforme Databricks MLflow. Ce point de terminaison doit également être publiquement accessible par Qlik Cloud.
Limitations
-
Databricks MLflow applique un quota de points de terminaison. Pour plus d'informations, voir Introduction à l'apprentissage machine Databricks.
-
Les ressources disponibles sur les services Databricks MLflow sur lesquels le modèle a été déployé impacteront et limiteront les performances de chargement de Qlik Sense et de réactivité du graphique.
-
Le connecteur Databricks MLflow est limité à 200 000 lignes par requête. Celles-ci sont envoyées au service du point de terminaison par lots de 2,000 lignes. Dans des scénarios dans lesquels il convient de traiter plus de lignes, utilisez une Boucle dans le script de chargement de données pour traiter davantage de lignes par lots.
-
Lorsqu'une application est régulièrement chargée, la bonne pratique consiste à mettre en cache les prédictions via un fichier QVD et à envoyer uniquement les nouvelles lignes au point de terminaison de prédiction. Cela améliore les performances de chargement de l'application Qlik Sense et réduit la charge sur le point de terminaison Databricks MLflow.
-
Lors de l'utilisation de Databricks MLflow dans une expression de graphique, il est important de fournir les types de données des champs, car le modèle doit les traiter au format numérique/de chaîne correct. La syntaxe server-side extension (SSE) utilisée dans des expressions de graphique est limitée en ce sens que les types de données ne sont pas automatiquement détectés, alors qu'ils le sont automatiquement dans le script de chargement.
-
Si vous utilisez un nom de connexion relatif et si vous décidez de déplacer votre application d'un espace partagé vers un autre espace partagé, ou si vous la déplacez d'un espace partagé vers votre espace privé, il faudra du temps pour que la connexion analytique se mette à jour afin de refléter le nouvel emplacement d'espace.