Перейти к основному содержимому
Databricks MLflow

НА ЭТОЙ СТРАНИЦЕ

Databricks MLflow

Databricks MLflow — это платформа машинного обучения для автоматизации, обеспечения и ускорения обработки прогнозной аналитики, которая помогает специалистам по обработке и анализу данных создавать и разворачивать точные прогнозные модели.

Чтобы подключиться к Databricks MLflow, сначала необходимо создать модель (или получить доступ к модели) и развернуть ее в конечной точке на платформе Databricks MLflow. Эта конечная точка должна быть общедоступной для Qlik Cloud.

https://databricks.com/product/managed-mlflow.

Ограничения

  • Databricks MLflow устанавливает квоту конечных точек:

    Руководство по Databricks Machine Learning.

  • Ресурсы, доступные в службах Databricks MLflow, где развернута модель, будут обуславливать и ограничивать производительность при перезагрузке Qlik Sense, а также скорость отклика диаграмм.

  • Коннектор Databricks MLflow имеет ограничение: 200 000 строк на запрос. Запросы отправляются в службу конечной точки пакетами по 2000 строк. В сценариях, где требуется обработка большего количества строк, используйте цикл в скрипте загрузки данных, чтобы обрабатывать больше строк в пакетах.

  • В сценарии с регулярной перезагрузкой приложения лучше всего кэшировать прогнозы с использованием файла QVD и отправлять в конечную точку только новые строки. Это улучшит производительность при перезагрузке приложения Qlik Sense и уменьшит нагрузку на конечную точку Databricks MLflow.

  • При использовании Databricks MLflow в выражении диаграммы важно указывать типы данных полей, так как необходимо обрабатывать их в правильном формате «строка/числовое значение». Использование серверных расширений в выражениях диаграмм имеет ограничение: типы данных не обнаруживаются автоматически так, как это делается в скрипте загрузки.

  • Если используется относительное имя подключения и необходимо перенести приложение из одного общего пространства в другое или перенести приложение из общего пространства в личное, то может потребоваться время на обновление аналитического подключения с учетом нового расположения пространства.