Databricks MLflow-analyskällor
Databricks MLflow är en maskininlärningsplattform för att automatisera, säkerställa och accelerera prediktiv analys, som hjälper datavetare och -analytiker att bygga och utveckla korrekta förutsägelsemodeller.
Om du vill ansluta till Databricks MLflow måste du ha skapat, eller ha åtkomst till, en modell och ha driftsatt den till en slutpunkt på Databricks MLflow-plattformen. Slutpunkten måste dessutom vara allmänt tillgänglig för Qlik Cloud.
Begränsningar
-
Databricks MLflow har en slutpunktskvot. Mer information hittar du i introduktion för maskininlärning i Databricks.
-
Resurserna som är tillgängliga på Databricks MLflow-tjänsterna där modellen har driftsatts påverkar och begränsar prestanda i Qlik Sense-laddning och diagramrespons.
-
Databricks MLflow-kopplingen är begränsad till 200 000 rader per begäran. Dessa skickas till slutpunktstjänsten i batchar om 2,000 rader. I scenarier när fler rader måste bearbetas kan du använda Cirkulär referens inom datainläsningsskriptet för att batchvis bearbeta fler rader.
-
När ett program regelbundet läses in om är bästa praxis att cachelagra förutsägelser med en QVD-fil och endast skicka nya rader till förutsägelseslutpunkten. Det kommer att förbättra prestanda för Qlik Sense-programladdning och minska belastningen på Databricks MLflow-slutpunkten.
-
När Databricks MLflow används i ett diagramuttryck är det viktigt att tillhandahålla datatyper för fält eftersom modellen behöver behandla dessa i rätt sträng/numeriskt format. En begränsning med komplement på serversidan i diagramuttryck är att datatyperna inte automatiskt identifieras som i laddningsskriptet.
-
Om du använder ett relativt kopplingsnamn och bestämmer dig för att flytta din app från ett delat utrymme till ett annat delat utrymme eller om du flyttar din app från ett delat utrymme till ditt privata utrymme kommer det att ta ett tag innan den analytiska kopplingen uppdateras för att motsvara den nya utrymmesplatsen.