Databricks MLflow 분석 소스
Databricks MLflow은 예측 분석을 자동화, 보장 및 가속화하기 위한 기계 학습 플랫폼이며, 이를 통해 데이터 과학자와 분석가가 정확한 예측 모델을 구축 및 배포할 수 있습니다.
Databricks MLflow에 연결하려면 모델을 만들었거나 액세스할 수 있어야 하며 Databricks MLflow 플랫폼의 종료 지점에 배포해야 합니다. 또한 이 종료 지점은 Qlik Cloud에서 공개적으로 액세스할 수 있어야 합니다.
제한 사항
-
Databricks MLflow에 종료 지점 할당량이 있습니다. 자세한 내용은 Databricks 기계 학습 소개를 참조하십시오.
-
모델이 배포된 Databricks MLflow 서비스에서 사용할 수 있는 리소스는 Qlik Sense 다시 로드 및 차트 응답의 성능에 영향을 미치고 제한합니다.
-
Databricks MLflow 커넥터는 요청당 200,000행으로 제한됩니다. 이들은 2,000행의 배치로 종료 지점 서비스로 전송됩니다. 더 많은 행을 처리해야 하는 시나리오에서는 데이터 로드 스크립트 내의 루프를 사용하여 더 많은 행을 일괄 처리합니다.
-
응용 프로그램이 정기적으로 다시 로드되는 경우 QVD 파일을 사용하여 예측을 캐시하고 새 행만 예측 종료 지점으로 보내는 것이 가장 좋습니다. 이렇게 하면 Qlik Sense 응용 프로그램 다시 로드의 성능이 향상되고 Databricks MLflow 종료 지점의 로드가 줄어듭니다.
-
차트 표현식에서 Databricks MLflow를 사용할 때 모델이 올바른 문자열/숫자 형식으로 필드를 처리해야 하므로 필드의 데이터 유형을 제공하는 것이 중요합니다. 차트 표현식에서 서버 측 확장의 한계는 로드 스크립트에서와 같이 데이터 유형이 자동으로 감지되지 않는다는 것입니다.
-
상대 연결 이름을 사용 중이고 앱을 공유 공간에서 다른 공유 공간으로 이동하기로 결정하거나 앱을 공유 공간에서 개인 공간으로 이동하는 경우 분석 연결이 새 공간 위치를 반영하도록 업데이트되는 데 시간이 걸립니다.