AI プロセッサー
サードパーティのターゲット データ プラットフォームからの生成 AI 機能を使用してデータを変換します。
AIプロセッサーは、サードパーティのターゲットデータプラットフォームのネイティブ生成 AI モデル機能を使用します。たとえば、変換を使用してデータを翻訳、分類、または要約できます。
有無
AI プロセッサー機能は現在、Databricks Foundation Model API を使用して、Databricks をターゲット データ プラットフォームとして使用するプロジェクトでのみ利用できます。この Databricks 機能はパブリック プレビュー段階であり、Databricks SQL Classic ではサポートされないなど、制限が含まれる可能性があります。関数ごとの制限については、各関数の Databricks ドキュメントへのリンクを参照してください。
「Databricks プレビューのサポートと詳細」も参照してください。
次の関数を使用できます。
-
センチメントを分析
-
分類
-
文法を修正
-
マスク
-
類似性
-
要約
-
翻訳
AI プロパティ
[関数名] で使用する AI 関数を選択します。
センチメントを分析
入力テキストに対してセンチメント分析を実行します。
センチメントは、肯定的、否定的、中立、または混合の値を持つテキスト文字列として返されます。センチメントが検出できない場合は NULL が返されます。
詳細については、「ai_analyze_sentiment 関数」を参照してください。
プロパティ名 | 設定 |
---|---|
コンテンツ |
センチメント分析を実行する列を選択します。選択できるのは文字列タイプの列のみです。 |
出力列名 |
生成された出力列の名前を入力します。 想定される形式は次のとおりです。
例: ASDasd123_4564 |
分類
指定したラベルに従って入力テキストを分類します。
詳細については、「ai_classify 関数」を参照してください。
プロパティ名 | 設定 |
---|---|
コンテンツ |
テキストを分類する列を選択します。選択できるのは文字列タイプの列のみです。 |
分類ラベル |
データを分類するときに使用するラベルを追加します。 を使用してラベルを追加します。2 ~ 20 個のラベルを使用できます。 |
文法を修正
テキスト列内の文法エラーを修正します。
詳細については、「ai_fix_grammar 関数」を参照してください。
プロパティ名 | 設定 |
---|---|
コンテンツ |
文法を修正する列を選択します。選択できるのは文字列タイプの列のみです。 |
出力列名 |
[新しい列を作成] を選択した場合は、生成される出力列の名前を入力できます。 想定される形式は次のとおりです。
例: ASDasd123_4564 |
マスク
テキスト列内の指定されたエンティティをマスクします。マスクされたエンティティは [MASKED] に置き換えられます。
詳細については、「ai_mask 関数」を参照してください。
プロパティ名 | 設定 |
---|---|
コンテンツ |
テキスト エンティティをマスクする列を選択します。選択できるのは文字列タイプの列のみです。 |
ラベルをマスク | マスクするテキスト エンティティごとにラベルを追加します。 を使用してラベルを追加します。 |
出力列名 |
[新しい列を作成] を選択した場合は、生成される出力列の名前を入力できます。 想定される形式は次のとおりです。
例: ASDasd123_4564 |
類似性
2 つの文字列を比較し、意味的類似性スコアを計算します。スコアは 0 から 1.0 までの浮動小数点値として返されます。1.0 は文字列が等しいことを意味します。
詳細については、「ai_similarity 関数」を参照してください。
プロパティ名 | 設定 |
---|---|
コンテンツ |
比較する列を選択します。選択できるのは文字列タイプの列のみです。 |
対象 |
コンテンツ内のテキストを、別の文字列のテキストまたは指定した値と比較できます。
|
出力列名 |
生成された出力列の名前を入力します。 想定される形式は次のとおりです。
例: ASDasd123_4564 |
要約
テキスト列内のテキストの要約を生成します。
詳細については、「ai_summarize 関数」を参照してください。
プロパティ名 | 設定 |
---|---|
コンテンツ |
要約する列を選択します。選択できるのは文字列タイプの列のみです。 |
最大語数 |
テキスト要約の最大単語数を設定します。整数値のみ設定できます。 デフォルト値は 50 です。空のままにするかゼロに設定すると、最大単語数は適用されません。 |
出力列名 |
生成された出力列の名前を入力します。 想定される形式は次のとおりです。
例: ASDasd123_4564 |
翻訳
列のテキスト コンテンツを翻訳します。
詳細については、「ai translate 関数」を参照してください。
プロパティ名 | 設定 |
---|---|
コンテンツ |
要約する列を選択します。選択できるのは文字列タイプの列のみです。 |
翻訳 |
翻訳する言語を選択します。 |
出力列名 |
生成された出力列の名前を入力します。 想定される形式は次のとおりです。
例: ASDasd123_4564 |
プロセッサーの編集
プロセッサー名を変更する場合は、プロセッサーのデフォルト名にカーソルを合わせたときに表示される [編集] アイコンをクリックします。
説明を編集する場合は、 [説明] にカーソルを合わせたときに表示される [編集] アイコンをクリックします。