Источник аналитики Amazon Comprehend
Amazon Comprehend — это управляемая служба для текстового анализа, предоставляемая пользователям платформы AWS.
Поддерживаются следующие службы Amazon Comprehend:
-
Sentiment Analysis (Анализ эмоциональной окраски)
-
Key phrase Extraction (Извлечение ключевых фраз)
-
Language Detection (Определение языка)
-
Entity Recognition (Выделение сущностей)
-
Syntax Analysis (Анализ синтаксиса)
-
Personally Identifiable Information (PII) Detection (Определение информации, позволяющей установить личность)
Для каждой из этих служб требуется создать отдельное подключение с использованием специфических параметров, применимых для конкретной службы.
Включение конечных точек машинного обучения в Qlik Cloud
Для работы с этим коннектором необходимо включить конечные точки машинного обучения в центре активности Администрирование. Переключатель находится в области Контроль функции раздела Параметры.
Для получения дополнительной информации см. раздел Включение аналитических коннекторов для конечных точек машинного обучения.
Ограничения
-
Amazon Comprehend имеет несколько квот и ограничений, которые можно увеличить, обратившись в отдел по квотам службы AWS и в центр поддержки AWS.
Например, размер документа (символы UTF-8) составляет 5000 байт, что означает, что ограничение на размер строки приложения в Qlik Sense составляет 5000 байт.
Использование конечной точки Amazon Comprehend со строками данных больше 5000 байт будет вызывать ошибку TextSizeLimitExceededException. При этом может появляться, к примеру, такое сообщение об ошибке: «Размер введенного текста превышает ограничение. Максимальная длина текста запроса составляет 5000 байт, а размер текста данного запроса — 5276 байт»
-
Коннектор Amazon Comprehend имеет ограничение: 1000 строк на запрос. Запросы отправляются в службу конечной точки пакетами по 25 строк. В сценариях, где требуется обработка большего количества строк, используйте Loop в скрипте загрузки данных, чтобы обрабатывать больше строк в пакетах.
-
Служба Amazon Comprehend Personally Identifiable Information (PII) Detection имеет ограничение: 100 строк на запрос. Запросы отправляются в службу конечной точки по одному.
-
В сценарии с регулярной перезагрузкой приложения лучше всего кэшировать прогноз с использованием файла QVD и отправлять в конечную точку только новые строки. Это улучшит производительность при перезагрузке приложения Qlik Sense и уменьшит нагрузку на конечную точку Amazon Comprehend.
-
Существует известное ограничение со стороны Amazon Comprehend, из-за которого отправка нулевых (null), или пустых, значений в Amazon Comprehend приводит к получению ошибки из Amazon Comprehend.
-
Если вы используете относительное имя подключения, и если вы решите перенести ваше приложение из общего пространства в другое общее пространство, или если вы перенесете ваше приложение из общего пространства в ваше личное пространство, то потребуется некоторое время для обновления аналитического подключения, чтобы оно отражало новое расположение пространства.
-
Вы не можете создавать и управлять подключениями к этому коннектору в Диспетчер данных в аналитическом приложении.