メイン コンテンツをスキップする 補完的コンテンツへスキップ

AI プロセッサー

サードパーティのターゲット データ プラットフォームからの生成 AI 機能を使用してデータを変換します。

AIプロセッサーは、サードパーティのターゲットデータプラットフォームのネイティブ生成 AI モデル機能を使用します。たとえば、変換を使用してデータを翻訳、分類、または要約できます。

有無

AI プロセッサー機能は現在、Databricks Foundation Model API を使用して、Databricks をターゲット データ プラットフォームとして使用するプロジェクトでのみ利用できます。この Databricks 機能はパブリック プレビュー段階であり、Databricks SQL Classic ではサポートされないなど、制限が含まれる可能性があります。関数ごとの制限については、各関数の Databricks ドキュメントへのリンクを参照してください。

Databricks プレビューのサポートと詳細」も参照してください。

次の関数を使用できます。

  • センチメントを分析

  • 分類

  • 文法を修正

  • マスク

  • 類似性

  • 要約

  • 翻訳

AI プロパティ

[関数名] で使用する AI 関数を選択します。

センチメントを分析

入力テキストに対してセンチメント分析を実行します。

センチメントは、肯定的否定的中立、または混合の値を持つテキスト文字列として返されます。センチメントが検出できない場合は NULL が返されます。

詳細については、「ai_analyze_sentiment 関数」を参照してください。

センチメント分析の構成
プロパティ名 設定

コンテンツ

センチメント分析を実行する列を選択します。選択できるのは文字列タイプの列のみです。

出力列名

生成された出力列の名前を入力します。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

分類

指定したラベルに従って入力テキストを分類します。

詳細については、「ai_classify 関数」を参照してください。

分類の構成
プロパティ名 設定

コンテンツ

テキストを分類する列を選択します。選択できるのは文字列タイプの列のみです。

分類ラベル

データを分類するときに使用するラベルを追加します。加算 を使用してラベルを追加します。2 ~ 20 個のラベルを使用できます。

文法を修正

テキスト列内の文法エラーを修正します。

詳細については、「ai_fix_grammar 関数」を参照してください。

文法を修正の構成
プロパティ名 設定

コンテンツ

文法を修正する列を選択します。選択できるのは文字列タイプの列のみです。

出力列名

[新しい列を作成] を選択した場合は、生成される出力列の名前を入力できます。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

マスク

テキスト列内の指定されたエンティティをマスクします。マスクされたエンティティは [MASKED] に置き換えられます。

詳細については、「ai_mask 関数」を参照してください。

マスクの構成
プロパティ名 設定

コンテンツ

テキスト エンティティをマスクする列を選択します。選択できるのは文字列タイプの列のみです。

ラベルをマスク マスクするテキスト エンティティごとにラベルを追加します。加算 を使用してラベルを追加します。

出力列名

[新しい列を作成] を選択した場合は、生成される出力列の名前を入力できます。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

類似性

2 つの文字列を比較し、意味的類似性スコアを計算します。スコアは 0 から 1.0 までの浮動小数点値として返されます。1.0 は文字列が等しいことを意味します。

詳細については、「ai_similarity 関数」を参照してください。

類似性の構成
プロパティ名 設定

コンテンツ

比較する列を選択します。選択できるのは文字列タイプの列のみです。

対象

コンテンツ内のテキストを、別の文字列のテキストまたは指定した値と比較できます。

  • 比較する列を選択します。選択できるのは文字列タイプの列のみです。

  • [Value] (値)

    比較するテキスト値を入力します。

出力列名

生成された出力列の名前を入力します。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

要約

テキスト列内のテキストの要約を生成します。

詳細については、「ai_summarize 関数」を参照してください。

要約の構成
プロパティ名 設定

コンテンツ

要約する列を選択します。選択できるのは文字列タイプの列のみです。

最大語数

テキスト要約の最大単語数を設定します。整数値のみ設定できます。

デフォルト値は 50 です。空のままにするかゼロに設定すると、最大単語数は適用されません。

出力列名

生成された出力列の名前を入力します。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

翻訳

列のテキスト コンテンツを翻訳します。

詳細については、「ai translate 関数」を参照してください。

ai_translate の構成
プロパティ名 設定

コンテンツ

要約する列を選択します。選択できるのは文字列タイプの列のみです。

翻訳

翻訳する言語を選択します。

出力列名

生成された出力列の名前を入力します。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

プロセッサーの編集

プロセッサー名を変更する場合は、プロセッサーのデフォルト名にカーソルを合わせたときに表示される [編集編集] アイコンをクリックします。

説明を編集する場合は、 [説明] にカーソルを合わせたときに表示される [編集編集] アイコンをクリックします。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。