Saltar al contenido principal
Databricks MLflow

EN ESTA PÁGINA

Databricks MLflow

Databricks MLflow es una plataforma de aprendizaje automático (machine learning) para automatizar, asegurar y acelerar el análisis predictivo, lo que ayuda a los expertos y analistas de datos a crear e implementar modelos predictivos muy precisos.

Para conectarse a Databricks MLflow, debe haber creado o tener acceso a un modelo e implementarlo en un punto de conexión de la plataforma Databricks MLflow. Este punto de conexión debe ser de acceso público para Qlik Cloud.

https://databricks.com/product/managed-mlflow.

Limitaciones

  • Databricks MLflow tiene una cuota máxima de puntos de conexión:

    Guía para el aprendizaje automático de Databricks.

  • Los recursos disponibles en los servicios de Databricks MLflow donde se ha implementado el modelo afectarán y limitarán el rendimiento en la carga de Qlik Sense y la capacidad de respuesta del gráfico.

  • El conector Databricks MLflow está limitado a 200.000 filas por solicitud. Estos se envían al servicio de puntos de conexión en lotes de 2 filas. En casos donde sea necesario procesar más filas, utilice un Bucle dentro del script de carga de datos para procesar más filas en lotes

  • En un escenario en el que una aplicación se recarga con regularidad, es una buena práctica almacenar en caché las predicciones mediante un archivo QVD y solo enviar las nuevas filas al punto de conexión de predicción. Esto mejorará el rendimiento de la recarga de la aplicación de Qlik Sense y reducirá la carga en el punto de conexión de Databricks MLflow.

  • Cuando se utiliza Databricks MLflow en una expresión de gráfico, es importante proporcionar los tipos de datos de los campos, ya que el modelo necesita procesarlos en el formato de cadena de texto/numérico correcto. Una limitación de las extensiones del lado del servidor en las expresiones de gráficos es que los tipos de datos no se detectan automáticamente como en el script de carga.

  • Si está utilizando un nombre de conexión relativo y si decide mover su app desde un espacio compartido a otro espacio compartido, o si mueve su app de un espacio compartido a su espacio privado, la conexión analítica tardará algún tiempo en actualizarse para reflejar la nueva ubicación del espacio.