AI 处理器
使用第三方目标数据平台中的生成式 AI 函数来转换数据。
AI 处理器在第三方目标数据平台中使用原生的生成式 AI 模型功能。例如,您可以在转换中翻译、分类或汇总数据。
可用性
目前,AI 处理器功能仅适用于以 Databricks 作为目标数据平台的项目,并且该类项目使用 Databricks Foundation Model API。此 Databricks 功能位于公共预览版中,可能存在一些限制,例如,在 Databricks SQL Classic 上不受支持。有关特定于函数的限制的信息,请参阅每个函数的 Databricks 文档链接。
可使用以下功能:
-
分析情绪
-
分类
-
修正语法
-
屏蔽
-
相似度
-
总结
-
翻译
AI 属性
在函数名称中选择要使用的 AI 函数。
分析情绪
对输入文本进行情感分析。
情绪会以文本字符串的形式返回,值为 positive、negative、neutral 或 mixed。如果无法检测到情感,则返回 Null。
有关更多信息,请参阅 ai_analyze_sentiment function。
属性名称 | 配置 |
---|---|
内容 |
选择要对其执行情绪分析的列。您只能选择字符串类型的列。 |
输出列名称 |
输入生成的输出列的名称。 预期格式如下:
示例:ASDasd123_4564 |
分类
根据您提供的标签对输入文本进行分类。
有关更多信息,请参阅 ai_classify 函数。
属性名称 | 配置 |
---|---|
内容 |
选择要对文本进行分类的列。您只能选择字符串类型的列。 |
分类标签 |
添加标签,用于对数据进行分类。使用 添加更多标签。您可使用 2 到 20 个标签。 |
修正语法
更正文本列中的语法错误。
有关更多信息,请参阅 ai_fix_grammar function。
属性名称 | 配置 |
---|---|
内容 |
选择要在其中修正语法的列。您只能选择字符串类型的列。 |
输出列名称 |
如果选择创建新列,则可以为生成的输出列输入名称。 预期格式如下:
示例:ASDasd123_4564 |
屏蔽
屏蔽文本列中的指定实体。屏蔽实体替换为 [MASKED]。
有关更多信息,请参阅 ai_mask 函数。
属性名称 | 配置 |
---|---|
内容 |
选择要屏蔽文本实体的列。您只能选择字符串类型的列。 |
屏蔽标签 | 为要屏蔽的每个文本实体添加标签。使用 添加更多标签。 |
输出列名称 |
如果选择创建新列,则可以为生成的输出列输入名称。 预期格式如下:
示例:ASDasd123_4564 |
相似度
比较两个字符串并计算语义相似度得分。分数以 0 到 1.0 之间的浮点值返回,其中 1.0 表示字符串相等。
有关更多信息,请参阅 ai_similarity 函数。
属性名称 | 配置 |
---|---|
内容 |
选择要比较的列。您只能选择字符串类型的列。 |
与 |
您可以将内容中的文本与其他字符串列中的文本或您指定的值进行比较。
|
输出列名称 |
输入生成的输出列的名称。 预期格式如下:
示例:ASDasd123_4564 |
总结
在文本列中生成文本的摘要。
有关更多信息,请参阅 ai_summarize 函数。
属性名称 | 配置 |
---|---|
内容 |
选择要制作摘要的列。您只能选择字符串类型的列。 |
最大字数 |
设置文本摘要的最大字数。您只能设置整数值。 默认值为 50。如果将其留空或设置为零,则不会应用最大字数。 |
输出列名称 |
输入生成的输出列的名称。 预期格式如下:
示例:ASDasd123_4564 |
翻译
翻译列的文本内容。
有关更多信息,请参阅 ai translate 函数。
属性名称 | 配置 |
---|---|
内容 |
选择要制作摘要的列。您只能选择字符串类型的列。 |
翻译为 |
选择要翻译到哪个目标语言。 |
输出列名称 |
输入生成的输出列的名称。 预期格式如下:
示例:ASDasd123_4564 |
编辑处理器
要重命名处理器,请单击将鼠标悬停在处理器的默认名称上时显示的编辑图标。
要编辑其描述,请单击悬停在描述上时显示的编辑图标。