Zu Hauptinhalt springen

Amazon Comprehend

AUF DIESER SEITE

Amazon Comprehend

Amazon Comprehend ist ein verwalteter Dienst für die Textanalyse, der Kunden der AWS-Plattform zur Verfügung steht.

Die folgenden Amazon Comprehend-Dienste werden unterstützt:

  • Sentiment Analysis

  • Key phrase Extraction

  • Language Detection

  • Entity Recognition

  • Syntax Analysis

  • Erkennung personenbezogener Daten

Jeder dieser Dienste erfordert eine getrennte Verbindung, die mit den spezifischen Parametern für den betreffenden Dienst erstellt werden muss.

https://aws.amazon.com/comprehend/.

Beschränkungen

  • Für Amazon Comprehend gelten mehrere Kontingente und Einschränkungen, die anhand der AWS-Dienstkontingenten und über das AWS-Supportcenter erhöht werden können.

    Beispielsweise beträgt die Dokumentgröße (UTF-8-Zeichen) 5000 Byte, was bedeutet, dass die Grenze pro App-Zeilengröße in Qlik Sense bei 5000 Byte liegt.

    Wenn Sie den Amazon Comprehend-Endpunkt mit Datenzeilen nutzen, die großer als 5000 Byte sind, tritt ein TextSizeLimitExceededException-Fehler auf. Eine derartige Fehlermeldung kann für einen Beispielzustand wie folgt lauten: „Eingabetextgröße überschreitet Limit. Die maximal zulässige Länge des Anforderungstexts beträgt 5000 Byte, aber die Textgröße dieser Anforderung beträgt 5276 Byte“

    https://docs.aws.amazon.com/comprehend/latest/dg/guidelines-and-limits.html.

  • Der Amazon Comprehend-Konnektor ist auf 1000 Zeilen pro Anforderung beschränkt. Diese werden Sätzen in von 25 Zeilen an den Endpunktdienst gesendet. In Szenarios, in denen mehr Zeilen verarbeitet werden müssen, verwenden Sie eine Schleife innerhalb des Datenladeskripts, um mehr Zeilen in Sätzen zu verarbeiten.

  • Der Amazon Comprehend Personally Identifiable Information (PII) Detection-Dienst ist auf 100 Zeilen pro Anforderung beschränkt. Diese werden einzeln an den Endpunktdienst gesendet.

  • In einem Szenario, in dem eine Anwendung regelmäßig geladen wird, besteht die Best Practice darin, die Prognosen anhand einer QVD-Datei zwischenzuspeichern und nur die neuen Zeilen an den Prognoseendpunkt zu senden. Dies verbessert die Leistung des Ladevorgangs der Qlik Sense Anwendung und reduziert die Last am Amazon Comprehend-Endpunkt.

  • Es besteht eine bekannte Beschränkung auf Amazon Comprehend-Seite, dass beim Senden von Nullwerten bzw. Leerwerten an Amazon Comprehend ein Fehler von Amazon Comprehend zurückgegeben wird.

  • Wenn Sie einen relativen Verbindungsnamen verwenden und entscheiden, Ihre App aus einem freigegebenen Bereich in einen anderen freigegebenen Bereich bzw. in Ihren privaten Bereich zu verschieben, dauert es eine bestimmte Zeit, bis die Analyseverbindung aktualisiert wird und den neuen Bereichsspeicherort angibt.