Accéder au contenu principal

Amazon Comprehend

SUR CETTE PAGE

Amazon Comprehend

Amazon Comprehend est un service géré pour l'analyse de texte accessible aux clients de la plate-forme AWS.

Les services Amazon Comprehend suivants sont pris en charge :

  • Analyse de sentiment

  • Extraction de phrase clé

  • Détection de langue

  • Reconnaissance d'entité

  • Analyse de syntaxe

  • Détection des Informations d'identification personnelle (PII)

Chacun de ces services nécessite la création d'une connexion distincte avec les paramètres spécifiques applicables au service en question.

https://aws.amazon.com/comprehend/.

Restrictions

  • Amazon Comprehend présente plusieurs quotas et restrictions qui peuvent être augmentés via les quotas de service AWS et le centre de support AWS.

    Par exemple, la taille de document (caractères UTF-8) est de 5 000 octets, ce qui signifie que la limite par taille de ligne d'application dans Qlik Sense est de 5 000 octets.

    L'utilisation du point de terminaison Amazon Comprehend avec des lignes de données supérieures à 5 K octets déclenchera une erreur TextSizeLimitExceededException. Un message d'erreur de ce type peut, par exemple, indiquer : "Input text size exceeds limit. ("La taille du texte d'entrée dépasse la limite.) Max length of request text allowed is 5000 bytes while in this request the text size is 5276 bytes." (La longueur maximale autorisée du texte de la requête est de 5 000 octets alors que la taille du texte de cette requête est de 5 276 octets.")

    https://docs.aws.amazon.com/comprehend/latest/dg/guidelines-and-limits.html.

  • Le connecteur Amazon Comprehend est limité à 1 000 lignes par requête. Celles-ci sont envoyées au service du point de terminaison par lots de 25 lignes. Dans des scénarios dans lesquels il faut traiter plus de lignes, utilisez une Boucle dans le script de chargement de données pour traiter davantage de lignes par lots.

  • Le service Amazon Comprehend Personally Identifiable Information (PII) Detection est limité à 100 lignes par requête. Elles sont envoyées au service de point de terminaison une par une.

  • Dans un scénario dans lequel une application est régulièrement chargée, la meilleure pratique consiste à mettre en cache les prédictions via un fichier QVD et à envoyer uniquement les nouvelles lignes au point de terminaison de prédiction. Cela améliore les performances de chargement de l'application Qlik Sense et réduit la charge sur le point de terminaison Amazon Comprehend.

  • Il existe une restriction connue côté Amazon Comprehend, dans laquelle l'envoi de valeurs nulles ou vides à Amazon Comprehend renverra une erreur de la part de Amazon Comprehend.

  • Si vous utilisez un nom de connexion relatif et si vous décidez de déplacer votre application d'un espace partagé vers un autre espace partagé, ou si vous la déplacez d'un espace partagé vers votre espace privé, il faudra du temps pour que la connexion analytique se mette à jour afin de refléter le nouvel emplacement d'espace.