跳到主要内容

Amazon Comprehend

在该页面上

Amazon Comprehend

Amazon Comprehend 是一种 AWS 平台的客户可以使用的文本分析托管服务。

支持以下 Amazon Comprehend 服务:

  • 情绪分析

  • 关键短语提取

  • 语言识别

  • 实体识别

  • 语法分析

  • 个人可识别信息 (PII) 检测

这些服务中的每一个都需要使用适用于相关服务的特定参数创建单独的连接。

https://aws.amazon.com/comprehend/.

限制

  • Amazon Comprehend 有几个配额和限制,可以使用 AWS 服务配额和 AWS 支持中心增加。这些配额和限制。

    例如,文档大小(UTF-8 字符)是 5000 字节,这意味着 Qlik Sense 中每个应用程序行大小的限制是 5000 字节。

    使用数据行大于 5000 字节的 Amazon Comprehend 端点将导致 TextSizeLimitExceededException 错误。例如,这样的错误消息可以声明:“输入文本大小超过限制。请求文本允许的最大长度是 5000 字节,而在这个请求中的文本大小是 5276 字节。”

    https://docs.aws.amazon.com/comprehend/latest/dg/guidelines-and-limits.html.

  • Amazon Comprehend 连接器被限制为每个请求 1000 行。这些将以 25 行为单位分批发送到端点服务。在需要处理更多行的场景中,在数据加载脚本中使用循环批量处理更多行。

  • Amazon Comprehend Personally Identifiable Information (PII) Detection 服务被限制为每个请求 100 行。它们一次发送到端点服务 1。

  • 在定期重新加载应用程序的场景中,最佳实践是使用 QVD 文件缓存预测,而且只将新行发送到预测端点。这将提高 Qlik Sense 应用程序重新加载的性能,并减少 Amazon Comprehend 端点上的负载。

  • 这里有一个已知的 Amazon Comprehend 侧限制,即发送空值或空格至 Amazon Comprehend 将导致由 Amazon Comprehend 返回的错误。

  • 如果您正在使用相关连接名称,如果您决定将应用程序从一个共享空间移动到另一个共享空间,或者如果您将应用程序从共享空间移动到您的私人空间,那么会需要一些时间更新分析连接以反映新的空间位置。