AI 處理器
從第三方目標資料平台使用生成式 AI 函數以轉換資料。
AI 處理器使用第三方目標資料平台中的原生生成式 AI 模型函數。例如,您可以在轉換中翻譯、分類或摘要資料。
可用性
AI 處理器功能可用於使用下列目標資料平台的專案。
-
Snowflake
-
Databricks
Snowflake
以 Snowflake 為目標資料平台的專案可以使用 Snowflake Cortex AI API 來獲得 AI 處理器功能。
提供以下函數:
-
分析情感
-
分類
-
摘要
-
翻譯
有關函數的更多資訊,請參閱 Snowflake 文件:可用函數。
Databricks
以 Databricks 為目標資料平台的專案可以使用 Databricks Foundation Model API 來獲得 AI 處理器功能。此 Databricks 函數處於公開預覽狀態,並且可能包含限制,例如在 Databricks SQL Classic 不受支援。有關函數特定限制的資訊,請參閱各自函數的 Databricks 文件連結。
另請參閱 Databricks 預覽支援與詳細資訊。
可以使用以下功能。在函數名稱中選取要使用的 AI 函數。
-
分析情感
-
分類
-
修正文法
-
遮罩
-
相似性
-
摘要
-
翻譯
有關函數的更多資訊,請參閱 Databricks 文件: 按字母順序排列的內建函數清單。
分析情感
對輸入文字進行情感分析。
可用平台:Databricks、Snowflake
輸入
屬性名稱 | 設定 |
---|---|
內容 | 選擇您要執行情感分析的欄。您只能選取字串類型的欄。 |
輸出欄名稱 | 輸入產生之輸出欄的名稱。 預期格式如下:
範例:ASDasd123_4564 |
預覽限制 | 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。 |
輸出
目標資料平台 | 設定 |
---|---|
Databricks | 情感以文字字串的形式傳回,其值為 positive (正面)、negative (負面)、neutral (中性) 或 mixed (混合)。如果無法偵測到情感,則傳回 null。 |
Snowflake | 對於給定的英語輸入文字,情緒將以 -1 到 1 之間的分數形式傳回。 -1 對應於最負面的情緒,1 對應於最正面的情緒。0 左右的數值對應於中性情緒。 |
分類
根據您提供的標籤對輸入文字進行分類。
可用平台:Databricks、Snowflake
輸入
屬性名稱 | 設定 |
---|---|
內容 | 選取要為其分類文字的欄。您只能選取字串類型的欄。 |
分類標籤 | 新增對資料進行分類時使用的標籤。使用 |
預覽限制 | 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。 |
輸出
目標資料平台 | 設定 |
---|---|
Databricks | 傳回一個文字字串,其中的分類標籤與內容中的輸入字串相符。 |
Snowflake | 傳回一個文字字串,其中的分類標籤與內容中的輸入字串相符。 |
修正文法
校正文字欄中的文法錯誤。
可用平台:Databricks
輸入
屬性名稱 | 設定 |
---|---|
內容 | 選取要修正文法的欄。您只能選取字串類型的欄。 |
輸出欄名稱 | 如果選取建立新欄,您可以為產生的輸出欄輸入名稱。 預期格式如下:
範例:ASDasd123_4564 |
預覽限制 | 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。 |
輸出
目標資料平台 | 設定 |
---|---|
Databricks | 傳回文法已更正的文字字串。 |
遮罩
遮罩文字欄中的指定實體。遮罩的實體替換為 [MASKED]。
可用平台:Databricks
輸入
屬性名稱 | 設定 |
---|---|
內容 | 選擇要在其中遮罩文字實體的欄。您只能選取字串類型的欄。 |
遮罩標籤 | 為每個要遮罩的文字實體新增標籤。使用 |
輸出欄名稱 | 如果選取建立新欄,您可以為產生的輸出欄輸入名稱。 預期格式如下:
範例:ASDasd123_4564 |
預覽限制 | 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。 |
輸出
目標資料平台 | 設定 |
---|---|
Databricks | 傳回一個文字字串,其中指定實體被遮罩。 |
相似性
比較兩個字串並運算語意相似性分數。
可用平台:Databricks
輸入
屬性名稱 | 設定 |
---|---|
內容 | 選取要比較的欄。您只能選取字串類型的欄。 |
與 | 您可以比較內容中的文字與另一個字串欄中的文字或您指定的值。
|
輸出欄名稱 | 輸入產生之輸出欄的名稱。 預期格式如下:
範例:ASDasd123_4564 |
預覽限制 | 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。 |
輸出
目標資料平台 | 設定 |
---|---|
Databricks | 分數以 0 到 1.0 之間的浮動值形式傳回,其中 1.0 表示字串相等。 |
摘要
產生文字欄中文字的摘要。
可用平台:Databricks、Snowflake
輸入
屬性名稱 | 設定 |
---|---|
內容 | 選取要摘要的欄。您只能選取字串類型的欄。 |
字數上限 | 設定文字摘要的字數上限。您只能設定整數值。 預設值為 50。如果留下空白或設為零,則不會套用字數上限。 資訊備註此選項僅可用於 Databricks。 |
輸出欄名稱 | 輸入產生之輸出欄的名稱。 預期格式如下:
範例:ASDasd123_4564 |
預覽限制 | 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。 |
輸出
目標資料平台 | 設定 |
---|---|
Databricks | 傳回一個文字字串,其中包含內容中輸入字串的摘要。 |
Snowflake | 傳回一個文字字串,其中包含內容中輸入字串的摘要。 |
翻譯
翻譯欄的文字內容。
可用平台:Databricks、Snowflake
有關所支援語言的資訊,請參閱資料平台的參考文件。
輸入
屬性名稱 | 設定 |
---|---|
內容 | 選取要摘要的欄。您只能選取字串類型的欄。 |
翻譯原語言 | 選取翻譯原語言。您也可以選取自動偵測語言。 可用平台:Snowflake |
翻譯目標語言 | 選取要翻譯為的語言。 |
輸出欄名稱 | 輸入產生之輸出欄的名稱。 預期格式如下:
範例:ASDasd123_4564 |
預覽限制 | 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。 |
輸出
目標資料平台 | 設定 |
---|---|
Databricks | 傳回一個文字字串,其中包含內容中輸入字串的翻譯。 |
Snowflake | 傳回一個文字字串,其中包含內容中輸入字串的翻譯。 |
編輯處理器
若要重新命名處理器,按一下游標暫留在預設處理器名稱上方時顯示的編輯圖示。
若要編輯其描述,按一下游標暫留在描述上方時顯示的編輯圖示。