Amazon Comprehend 分析ソース
Amazon Comprehend は、AWS プラットフォームのお客様が利用できるテキスト分析用のマネージドサービスです。
次の Amazon Comprehend サービスがサポートされています:
-
感情分析
-
キーフレーズ抽出
-
言語検出
-
実体認識
-
構文分析
-
個人を特定できる情報 (PII) の検出
これらの各サービスには、問題のサービスに適用可能な特定のパラメーターを使用して、個別の接続を作成する必要があります。
制限事項
-
Amazon Comprehend には、AWS サービスクォータと AWS サポートセンターを使用して増加できるいくつかのクォータと制限があります。
たとえば、ドキュメントのサイズ (UTF-8 文字) が 5,000 バイトの場合、Qlik Sense でのアプリの行サイズの制限は 5,000 バイトになります。
5K バイトを超えるデータ行で Amazon Comprehend エンドポイントを使用すると、TextSizeLimitExceededException エラーが発生します。このようなエラー メッセージは、たとえば次のように表示されます。「入力テキストのサイズが制限を超えています。許可される要求テキストの最大長は 5,000 バイトですが、この要求のテキストサイズは 5,276 バイトです」
-
Amazon Comprehend コネクタは、リクエストごとに 1000 行に制限されます。これらは、25k 行のバッチ形式でエンドポイント サービスに送信されます。より多くの行を処理する必要があるシナリオでは、データ ロード スクリプト内の Loop を使用して、より多くの行をバッチ処理します。
-
Amazon Comprehend Personally Identifiable Information (PII) Detection サービスは、リクエストごとに 100 行に制限されます。これらは、一度に 1 つずつエンドポイント サービスに送信されます。
-
アプリケーションが定期的に再ロードされるシナリオでのベストプラクティスは、QVD ファイルを使用して推測をキャッシュし、新しい行のみを予測エンドポイントに送信することです。これにより、Qlik Sense アプリケーションの再ロードのパフォーマンスが向上し、Amazon Comprehend エンドポイントの負荷が軽減されます。
-
Amazon Comprehend 側には既知の制限があり、Amazon Comprehend に null 値またはブランクを送信すると、Amazon Comprehend からエラーが返されます。
-
相対接続名を使用していて、共有スペースから別の共有スペースにアプリを移動する場合、または共有スペースからプライベート スペースにアプリを移動する場合は、新しいスペースの場所を反映して更新されるまでに時間を要します。