Amazon SageMaker analytics source
Amazon SageMaker — это платформа машинного обучения для автоматизации, обеспечения и ускорения обработки прогнозной аналитики, которая помогает специалистам по обработке и анализу данных создавать и разворачивать точные прогнозные модели.
Чтобы подключиться к Amazon SageMaker, сначала необходимо создать модель (или получить доступ к модели) и развернуть ее в конечной точке на платформе AWS. Эта конечная точка должна быть общедоступной для Qlik Cloud.
Ограничения
-
Amazon Comprehend устанавливает квоты конечных точек:
-
AWS позволяет разворачивать модель на типах экземпляров, например на средних и больших типах экземпляров. Ресурсы, доступные в службах Amazon, где развернута модель, будут обуславливать и ограничивать производительность при перезагрузке Qlik Sense, а также скорость отклика диаграмм.
-
Когда Qlik Sense отправляет данные в Amazon SageMaker, они передаются в формате CSV без строки заголовка. Это означает, что поля должны отправляться точно в том порядке, в котором их ожидает конечная точка Amazon SageMaker. Необходимо указывать поля в том же порядке, что и при создании модели.
-
Коннектор Amazon SageMaker имеет ограничение: 200,000 строк на запрос. Запросы отправляются в службу конечной точки пакетами по 2000 строк. В сценариях, где требуется обработка большего количества строк, используйте Loop в скрипте загрузки данных, чтобы обрабатывать больше строк в пакетах.
-
В сценарии с регулярной перезагрузкой приложения лучше всего кэшировать прогнозы с использованием файла QVD и отправлять в конечную точку только новые строки. Это улучшит производительность при перезагрузке приложения Qlik Sense и уменьшит нагрузку на конечную точку Amazon SageMaker.
-
При использовании Amazon SageMaker в выражении диаграммы важно указывать типы данных полей, так как необходимо обрабатывать их в правильном формате «строка/числовое значение». Использование серверных расширений в выражениях диаграмм имеет ограничение: типы данных не обнаруживаются автоматически так, как это делается в скрипте загрузки.
-
Если используется относительное имя подключения и необходимо перенести приложение из одного общего пространства в другое или перенести приложение из общего пространства в личное, то может потребоваться время на обновление аналитического подключения с учетом нового расположения пространства.