跳到主要內容 跳至補充內容

AI 處理器

從第三方目標資料平台使用生成式 AI 函數以轉換資料。

AI 處理器使用第三方目標資料平台中的原生生成式 AI 模型函數。例如,您可以在轉換中翻譯、分類或摘要資料。

可用性

AI 處理器功能可用於使用下列目標資料平台的專案。

  • Snowflake

  • Databricks

資訊備註可用的處理器功能取決於目標資料平台的可用性。這意味著,如果您使用 AI 處理器,則無法匯出專案,然後將其匯入到使用不同資料平台的另一個專案。

Snowflake

以 Snowflake 為目標資料平台的專案可以使用 Snowflake Cortex AI API 來獲得 AI 處理器功能。

資訊備註有關使用 Snowflake Cortex 函數時的運算成本注意事項的更多資訊,請參閱大型語言模型 (LLM) 函數 (Snowflake Cortex)

提供以下函數:

  • 分析情感

  • 分類

  • 摘要

  • 翻譯

有關函數的更多資訊,請參閱 Snowflake 文件:可用函數

Databricks

以 Databricks 為目標資料平台的專案可以使用 Databricks Foundation Model API 來獲得 AI 處理器功能。此 Databricks 函數處於公開預覽狀態,並且可能包含限制,例如在 Databricks SQL Classic 不受支援。有關函數特定限制的資訊,請參閱各自函數的 Databricks 文件連結。

另請參閱 Databricks 預覽支援與詳細資訊

可以使用以下功能。在函數名稱中選取要使用的 AI 函數。

  • 分析情感

  • 分類

  • 修正文法

  • 遮罩

  • 相似性

  • 摘要

  • 翻譯

有關函數的更多資訊,請參閱 Databricks 文件: 按字母順序排列的內建函數清單

分析情感

對輸入文字進行情感分析。

可用平台:Databricks、Snowflake

輸入

分析情感的設定
屬性名稱 設定

內容

選擇您要執行情感分析的欄。您只能選取字串類型的欄。

輸出欄名稱

輸入產生之輸出欄的名稱。

預期格式如下:

  • 必須以 [A-Za-z_] 字元開始。
  • 只能包含 [A-Za-z0-9_] 字元。

範例:ASDasd123_4564

預覽限制 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。

輸出

分析情感的輸出
目標資料平台 設定

Databricks

情感以文字字串的形式傳回,其值為 positive (正面)、negative (負面)、neutral (中性) 或 mixed (混合)。如果無法偵測到情感,則傳回 null。

Snowflake

對於給定的英語輸入文字,情緒將以 -1 到 1 之間的分數形式傳回。

-1 對應於最負面的情緒,1 對應於最正面的情緒。0 左右的數值對應於中性情緒。

分類

根據您提供的標籤對輸入文字進行分類。

可用平台:Databricks、Snowflake

輸入

分類設定
屬性名稱 設定

內容

選取要為其分類文字的欄。您只能選取字串類型的欄。

分類標籤

新增對資料進行分類時使用的標籤。使用 加號 新增更多標籤。您可以使用 2 到 20 個標籤。

預覽限制 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。

輸出

分類的輸出
目標資料平台 設定

Databricks

傳回一個文字字串,其中的分類標籤與內容中的輸入字串相符。

Snowflake

傳回一個文字字串,其中的分類標籤與內容中的輸入字串相符。

修正文法

校正文字欄中的文法錯誤。

可用平台:Databricks

輸入

修正文法的設定
屬性名稱 設定

內容

選取要修正文法的欄。您只能選取字串類型的欄。

輸出欄名稱

如果選取建立新欄,您可以為產生的輸出欄輸入名稱。

預期格式如下:

  • 必須以 [A-Za-z_] 字元開始。
  • 只能包含 [A-Za-z0-9_] 字元。

範例:ASDasd123_4564

預覽限制 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。

輸出

分類的輸出
目標資料平台 設定

Databricks

傳回文法已更正的文字字串。

遮罩

遮罩文字欄中的指定實體。遮罩的實體替換為 [MASKED]

可用平台:Databricks

輸入

遮罩設定
屬性名稱 設定

內容

選擇要在其中遮罩文字實體的欄。您只能選取字串類型的欄。

遮罩標籤為每個要遮罩的文字實體新增標籤。使用 加號 新增更多標籤。

輸出欄名稱

如果選取建立新欄,您可以為產生的輸出欄輸入名稱。

預期格式如下:

  • 必須以 [A-Za-z_] 字元開始。
  • 只能包含 [A-Za-z0-9_] 字元。

範例:ASDasd123_4564

預覽限制 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。

輸出

分類的輸出
目標資料平台 設定

Databricks

傳回一個文字字串,其中指定實體被遮罩。

相似性

比較兩個字串並運算語意相似性分數。

可用平台:Databricks

輸入

相似性設定
屬性名稱 設定

內容

選取要比較的欄。您只能選取字串類型的欄。

您可以比較內容中的文字與另一個字串欄中的文字或您指定的值。

  • 資料行

    選擇要比較的欄。您只能選取字串類型的欄。

  • 輸入要比較的文字值。

輸出欄名稱

輸入產生之輸出欄的名稱。

預期格式如下:

  • 必須以 [A-Za-z_] 字元開始。
  • 只能包含 [A-Za-z0-9_] 字元。

範例:ASDasd123_4564

預覽限制 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。

輸出

分類的輸出
目標資料平台 設定

Databricks

分數以 0 到 1.0 之間的浮動值形式傳回,其中 1.0 表示字串相等。

摘要

產生文字欄中文字的摘要。

可用平台:Databricks、Snowflake

輸入

摘要設定
屬性名稱 設定

內容

選取要摘要的欄。您只能選取字串類型的欄。

字數上限

設定文字摘要的字數上限。您只能設定整數值。

預設值為 50。如果留下空白或設為零,則不會套用字數上限。

資訊備註此選項僅可用於 Databricks。

輸出欄名稱

輸入產生之輸出欄的名稱。

預期格式如下:

  • 必須以 [A-Za-z_] 字元開始。
  • 只能包含 [A-Za-z0-9_] 字元。

範例:ASDasd123_4564

預覽限制 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。

輸出

摘要輸出
目標資料平台 設定

Databricks

傳回一個文字字串,其中包含內容中輸入字串的摘要。

Snowflake

傳回一個文字字串,其中包含內容中輸入字串的摘要。

翻譯

翻譯欄的文字內容。

可用平台:Databricks、Snowflake

有關所支援語言的資訊,請參閱資料平台的參考文件。

輸入

翻譯設定
屬性名稱 設定

內容

選取要摘要的欄。您只能選取字串類型的欄。

翻譯原語言

選取翻譯原語言。您也可以選取自動偵測語言。

可用平台:Snowflake

翻譯目標語言

選取要翻譯為的語言。

輸出欄名稱

輸入產生之輸出欄的名稱。

預期格式如下:

  • 必須以 [A-Za-z_] 字元開始。
  • 只能包含 [A-Za-z0-9_] 字元。

範例:ASDasd123_4564

預覽限制 設定要在資料預覽中載入的列數。預設值為 10。如果將此設為 0,則沒有限制。

輸出

翻譯輸出
目標資料平台 設定

Databricks

傳回一個文字字串,其中包含內容中輸入字串的翻譯。

Snowflake

傳回一個文字字串,其中包含內容中輸入字串的翻譯。

編輯處理器

若要重新命名處理器,按一下游標暫留在預設處理器名稱上方時顯示的編輯編輯圖示。

若要編輯其描述,按一下游標暫留在描述上方時顯示的編輯編輯圖示。

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們可以如何改善!