Vai al contenuto principale

Amazon SageMaker

IN QUESTA PAGINA

Amazon SageMaker

Amazon SageMaker è una piattaforma di machine learning per l'automazione, la verifica e l'accelerazione di analisi predittive, destinata ad aiutare scienziati e analisti dei dati a creare e distribuire modelli predittivi accurati.

Per connettersi a Amazon SageMaker, è necessario aver creato, oppure avere accesso, a un modello e averlo distribuito a un endpoint sulla piattaforma AWS. Questo endpoint deve essere accessibile pubblicamente per Qlik Cloud.

https://aws.amazon.com/pm/sagemaker.

Limiti

  • Amazon Comprehend presenta quote per gli endpoint:

    https://docs.aws.amazon.com/general/latest/gr/sagemaker.html.

  • AWS offre la possibilità di distribuire un modello sui tipi di istanza, ad esempio i tipi di istanza medi e grandi. Le risorse disponibili sui servizi Amazon influiranno e limiteranno le prestazioni nel ricaricamento di Qlik Sense e nella reattività dei grafici.

  • Quando Qlik Sense invia i dati a Amazon SageMaker viene inviato in un formato CSV senza una riga di intestazione. Ciò significa che i campi devono essere inviati nell'ordine esatto in cui l'endpoint Amazon SageMaker si aspetta la loro presenza. È necessario specificare i campi nello stesso ordine in cui si trovavano quando il modello è stato generato.

  • Il connettore Amazon SageMaker è limitato a 200.000 righe per richiesta. Tali righe vengono inviate al servizio endpoint in batch da 2.000 righe. Negli scenari in cui è necessario elaborare più righe, utilizzare un Ciclo all'interno dello script di caricamento dei dati per elaborare più righe in batch.

  • In uno scenario in cui un'applicazione viene ricaricata regolarmente, si consiglia di memorizzare nella cache le predizioni usando un file QVD e inviare solo le nuove righe all'endpoint predittivo. Ciò migliorerà le prestazioni di ricaricamento dell'applicazione Qlik Sense e ridurrà il carico sull'endpoint Amazon SageMaker.

  • Al momento di utilizzare Amazon SageMaker in un'espressione del grafico, è importante fornire i tipi di dati dei campi, dato che il modello necessita di elaborarli nel formato stringa/numerico corretto. Un limite nelle estensioni lato server all'interno delle espressioni del grafico consiste nel fatto che i tipi di dati non vengono rilevati automaticamente, dato che si trovano nello script di caricamento.

  • Se si sta utilizzando un nome connessione relativo, e se si decide di spostare la propria app da uno spazio condiviso a un altro spazio condiviso, o se si sposta la propria app da uno spazio condiviso al proprio spazio privato, ci vorrà del tempo affinché la connessione di analisi venga aggiornata per riflettere la nuova posizione nello spazio.