Sorgente di analisi di Databricks MLflow
Databricks MLflow è una piattaforma di machine learning per l'automazione, la verifica e l'accelerazione di analisi predittive, destinata ad aiutare scienziati e analisti dei dati a creare e distribuire modelli predittivi accurati.
Per connettersi a Databricks MLflow, è necessario aver creato, oppure avere accesso, a un modello e averlo distribuito a un endpoint sulla piattaforma Databricks MLflow. Inoltre, questo endpoint deve essere accessibile pubblicamente per Qlik Cloud.
Limitazioni
-
Databricks MLflow presenta una quota endpoint. Per ulteriori informazioni, vedere Introduzione al machine learning Databricks.
-
Le risorse disponibili per i servizi Databricks MLflow in cui il modello è stato distribuito influiranno e limiteranno le prestazioni nel ricaricamento di Qlik Sense e nella reattività dei grafici.
-
Il connettore Databricks MLflow è limitato a 200,000 righe per richiesta. Tali righe vengono inviate al servizio endpoint in batch da 2,000 righe. Negli scenari in cui è necessario elaborare più righe, utilizzare un Ciclo all'interno dello script di caricamento dei dati per elaborare più righe in batch.
-
Se un'applicazione viene ricaricata regolarmente, si consiglia di memorizzare nella cache le previsioni usando un file QVD e inviare solo le nuove righe all'endpoint predittivo. Ciò migliorerà le prestazioni di ricaricamento dell'applicazione Qlik Sense e ridurrà il carico sull'endpoint Databricks MLflow.
-
Al momento di utilizzare Databricks MLflow in un'espressione del grafico, è importante fornire i tipi di dati dei campi, dato che il modello necessita di elaborarli nel formato stringa/numerico corretto. Un limite nelle estensioni lato server all'interno delle espressioni del grafico consiste nel fatto che i tipi di dati non vengono rilevati automaticamente, dato che si trovano nello script di caricamento.
-
Se si sta utilizzando un nome relativo per la connessione e si decide di spostare la propria app da uno spazio condiviso a un altro spazio condiviso, o se si sposta la propria app da uno spazio condiviso al proprio spazio privato, ci vorrà del tempo affinché la connessione di analisi venga aggiornata per riflettere la nuova posizione nello spazio.