メイン コンテンツをスキップする 補完的コンテンツへスキップ

AI プロセッサー

サードパーティのターゲット データ プラットフォームからの生成 AI 機能を使用してデータを変換します。

AIプロセッサーは、サードパーティのターゲットデータプラットフォームのネイティブ生成 AI モデル機能を使用します。たとえば、変換を使用してデータを翻訳、分類、または要約できます。

有無

AI プロセッサー機能は、次のターゲットデータプラットフォームを使用するプロジェクトで利用できます。

  • Snowflake

  • Databricks

情報メモ利用可能なプロセッサー機能は、ターゲット データ プラットフォームでの可用性に応じて異なります。つまり、AI プロセッサーを使用する場合、プロジェクトをエクスポートしてから、別のデータ プラットフォームを使用する別のプロジェクトにインポートすることはできません。

Snowflake

AI プロセッサー機能は、Snowflake Cortex AI API を使用して、Snowflake をターゲット データ プラットフォームとするプロジェクトで利用できます。

情報メモSnowflake Cortex 関数を使用する際の計算コストの考慮事項の詳細については、「大規模言語モデル (LLM) 関数 (Snowflake Cortex)」を参照してください。

次の関数を使用できます。

  • センチメントを分析

  • 分類

  • 要約

  • 翻訳

関数の詳細については、Snowflake ドキュメントの「利用可能な関数」を参照してください。

Databricks

AI プロセッサー機能は、Databricks Foundation Model API を使用して、Databricks をターゲット データ プラットフォームとして使用するプロジェクトで利用できます。この Databricks 機能はパブリック プレビュー段階であり、Databricks SQL Classic ではサポートされないなど、制限が含まれる可能性があります。関数ごとの制限については、各関数の Databricks ドキュメントへのリンクを参照してください。

Databricks プレビューのサポートと詳細」も参照してください。

次の関数を使用できます。[関数名] で使用する AI 関数を選択します。

  • センチメントを分析

  • 分類

  • 文法を修正

  • マスク

  • 類似性

  • 要約

  • 翻訳

関数の詳細については、Databricks ドキュメントの「組み込み関数のアルファベット順リスト」を参照してください。

センチメントを分析

入力テキストに対してセンチメント分析を実行します。

利用可能: Databricks、Snowflake

インプット

センチメント分析の構成
プロパティ名 設定

コンテンツ

センチメント分析を実行する列を選択します。選択できるのは文字列タイプの列のみです。

出力列名

生成された出力列の名前を入力します。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

プレビュー用に制限 データ プレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

センチメント分析の出力
ターゲット データ プラットフォーム 構成

Databricks

センチメントは、肯定的否定的中立、または混合の値を持つテキスト文字列として返されます。センチメントが検出できない場合は NULL が返されます。

Snowflake

センチメントは、指定された英語の入力テキストに対して -1 から 1 までのスコアとして返されます。

-1 がもっとも否定的なセンチメントで、1 がもっとも肯定的なセンチメントです。0 付近の値は中立的なセンチメントに相当します。

分類

指定したラベルに従って入力テキストを分類します。

利用可能: Databricks、Snowflake

インプット

分類の構成
プロパティ名 設定

コンテンツ

テキストを分類する列を選択します。選択できるのは文字列タイプの列のみです。

分類ラベル

データを分類するときに使用するラベルを追加します。加算 を使用してラベルを追加します。2 ~ 20 個のラベルを使用できます。

プレビュー用に制限 データ プレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Classify の出力
ターゲット データ プラットフォーム 構成

Databricks

[コンテンツ] の入力文字列と一致する分類ラベルを含むテキスト文字列が返されます。

Snowflake

[コンテンツ] の入力文字列と一致する分類ラベルを含むテキスト文字列が返されます。

文法を修正

テキスト列内の文法エラーを修正します。

利用可能: Databricks

インプット

文法を修正の構成
プロパティ名 設定

コンテンツ

文法を修正する列を選択します。選択できるのは文字列タイプの列のみです。

出力列名

[新しい列を作成] を選択した場合は、生成される出力列の名前を入力できます。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

プレビュー用に制限 データ プレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Classify の出力
ターゲット データ プラットフォーム 構成

Databricks

文法が修正されたテキスト文字列が返されます。

マスク

テキスト列内の指定されたエンティティをマスクします。マスクされたエンティティは [MASKED] に置き換えられます。

利用可能: Databricks

インプット

マスクの構成
プロパティ名 設定

コンテンツ

テキスト エンティティをマスクする列を選択します。選択できるのは文字列タイプの列のみです。

ラベルをマスクマスクするテキスト エンティティごとにラベルを追加します。加算 を使用してラベルを追加します。

出力列名

[新しい列を作成] を選択した場合は、生成される出力列の名前を入力できます。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

プレビュー用に制限 データ プレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Classify の出力
ターゲット データ プラットフォーム 構成

Databricks

指定されたエンティティがマスクされたテキスト文字列が返されます。

類似性

2 つの文字列を比較し、意味的類似性スコアを計算します。

利用可能: Databricks

インプット

類似性の構成
プロパティ名 設定

コンテンツ

比較する列を選択します。選択できるのは文字列タイプの列のみです。

対象

コンテンツ内のテキストを、別の文字列のテキストまたは指定した値と比較できます。

  • 比較する列を選択します。選択できるのは文字列タイプの列のみです。

  • [Value] (値)

    比較するテキスト値を入力します。

出力列名

生成された出力列の名前を入力します。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

プレビュー用に制限 データ プレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Classify の出力
ターゲット データ プラットフォーム 構成

Databricks

スコアは 0 から 1.0 までの浮動小数点値として返されます。1.0 は文字列が等しいことを意味します。

要約

テキスト列内のテキストの要約を生成します。

利用可能: Databricks、Snowflake

インプット

要約の構成
プロパティ名 設定

コンテンツ

要約する列を選択します。選択できるのは文字列タイプの列のみです。

最大語数

テキスト要約の最大単語数を設定します。整数値のみ設定できます。

デフォルト値は 50 です。空のままにするかゼロに設定すると、最大単語数は適用されません。

情報メモこのオプションは Databricks でのみ使用できます。

出力列名

生成された出力列の名前を入力します。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

プレビュー用に制限 データ プレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Summarize の出力
ターゲット データ プラットフォーム 構成

Databricks

[コンテンツ] に入力文字列のサマリーを含むテキスト文字列が返されます。

Snowflake

[コンテンツ] に入力文字列のサマリーを含むテキスト文字列が返されます。

翻訳

列のテキスト コンテンツを翻訳します。

利用可能: Databricks、Snowflake

サポートされている言語の詳細については、データ プラットフォームのリファレンス ドキュメントを参照してください。

インプット

翻訳の構成
プロパティ名 設定

コンテンツ

要約する列を選択します。選択できるのは文字列タイプの列のみです。

翻訳元

翻訳元の言語を選択します。言語を自動検出するように選択することもできます。

利用可能: Snowflake

翻訳先

翻訳先の言語を選択します。

出力列名

生成された出力列の名前を入力します。

想定される形式は次のとおりです。

  • [A-Za-z_]で始まることが必要です。
  • [A-Za-z0-9_]のみ含めることができます。

例: ASDasd123_4564

プレビュー用に制限 データ プレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Translate の出力
ターゲット データ プラットフォーム 構成

Databricks

[コンテンツ] に入力文字列のサマリーを含むテキスト文字列が返されます。

Snowflake

[コンテンツ] に入力文字列のサマリーを含むテキスト文字列が返されます。

プロセッサーの編集

プロセッサー名を変更する場合は、プロセッサーのデフォルト名にカーソルを合わせたときに表示される [編集編集] アイコンをクリックします。

説明を編集する場合は、 [説明] にカーソルを合わせたときに表示される [編集編集] アイコンをクリックします。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。