AI プロセッサー

サードパーティのターゲットデータプラットフォームからの生成 AI 機能を使用してデータを変換します。

AIプロセッサーは、サードパーティのターゲットデータプラットフォームのネイティブ生成 AI モデル機能を使用します。たとえば、変換を使用してデータを翻訳、分類、または要約できます。

有無

AI プロセッサー機能は、次のターゲットデータプラットフォームを使用するプロジェクトで利用できます。

Snowflake
Databricks

利用可能なプロセッサー機能は、ターゲットデータプラットフォームでの可用性に応じて異なります。つまり、AI プロセッサーを使用する場合、プロジェクトをエクスポートしてから、別のデータプラットフォームを使用する別のプロジェクトにインポートすることはできません。

Snowflake

AI プロセッサー機能は、Snowflake Cortex AI API を使用して、Snowflake をターゲットデータプラットフォームとするプロジェクトで利用できます。

Snowflake Cortex 関数を使用する際の計算コストの考慮事項の詳細については、「大規模言語モデル (LLM) 関数 (Snowflake Cortex)」を参照してください。

次の関数を使用できます。

センチメントを分析
分類
要約
翻訳

関数の詳細については、Snowflake ドキュメントの「利用可能な関数」を参照してください。

Databricks

AI プロセッサー機能は、Databricks Foundation Model API を使用して、Databricks をターゲットデータプラットフォームとして使用するプロジェクトで利用できます。この Databricks 機能はパブリックプレビュー段階であり、Databricks SQL Classic ではサポートされないなど、制限が含まれる可能性があります。関数ごとの制限については、各関数の Databricks ドキュメントへのリンクを参照してください。

「Databricks プレビューのサポートと詳細」も参照してください。

次の関数を使用できます。[関数名] で使用する AI 関数を選択します。

センチメントを分析
分類
文法を修正
マスク
類似性
要約
Translate

関数の詳細については、Databricks ドキュメントの「組み込み関数のアルファベット順リスト」を参照してください。

センチメントを分析

入力テキストに対してセンチメント分析を実行します。

利用可能: Databricks、Snowflake

[Input] (入力)

センチメント分析の構成
プロパティ名	設定
コンテンツ	センチメント分析を実行する列を選択します。選択できるのは文字列タイプの列のみです。
出力列名	生成された出力列の名前を入力します。想定される形式は次のとおりです。 [A-Za-z_]で始まることが必要です。 [A-Za-z0-9_]のみ含めることができます。例: ASDasd123_4564
プレビュー用に制限	データプレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

センチメント分析の出力
ターゲットデータプラットフォーム	設定
Databricks	センチメントは、肯定的、否定的、中立、または混合の値を持つテキスト文字列として返されます。センチメントが検出できない場合は NULL が返されます。
Snowflake	センチメントは、指定された英語の入力テキストに対して -1 から 1 までのスコアとして返されます。 -1 がもっとも否定的なセンチメントで、1 がもっとも肯定的なセンチメントです。0 付近の値は中立的なセンチメントに相当します。

分類

指定したラベルに従って入力テキストを分類します。

利用可能: Databricks、Snowflake

[Input] (入力)

分類の構成
プロパティ名	設定
コンテンツ	テキストを分類する列を選択します。選択できるのは文字列タイプの列のみです。
分類ラベル	データを分類するときに使用するラベルを追加します。を使用してラベルを追加します。2 ～ 20 個のラベルを使用できます。
プレビュー用に制限	データプレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Classify の出力
ターゲットデータプラットフォーム	設定
Databricks	[コンテンツ] の入力文字列と一致する分類ラベルを含むテキスト文字列が返されます。
Snowflake	[コンテンツ] の入力文字列と一致する分類ラベルを含むテキスト文字列が返されます。

文法を修正

テキスト列内の文法エラーを修正します。

利用可能: Databricks

[Input] (入力)

文法を修正の構成
プロパティ名	設定
コンテンツ	文法を修正する列を選択します。選択できるのは文字列タイプの列のみです。
出力列名	[新しい列を作成] を選択した場合は、生成される出力列の名前を入力できます。想定される形式は次のとおりです。 [A-Za-z_]で始まることが必要です。 [A-Za-z0-9_]のみ含めることができます。例: ASDasd123_4564
プレビュー用に制限	データプレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Classify の出力
ターゲットデータプラットフォーム	設定
Databricks	文法が修正されたテキスト文字列が返されます。

マスク

テキスト列内の指定されたエンティティをマスクします。マスクされたエンティティは [MASKED] に置き換えられます。

利用可能: Databricks

[Input] (入力)

マスクの構成
プロパティ名	設定
コンテンツ	テキストエンティティをマスクする列を選択します。選択できるのは文字列タイプの列のみです。
ラベルをマスク	マスクするテキストエンティティごとにラベルを追加します。を使用してラベルを追加します。
出力列名	[新しい列を作成] を選択した場合は、生成される出力列の名前を入力できます。想定される形式は次のとおりです。 [A-Za-z_]で始まることが必要です。 [A-Za-z0-9_]のみ含めることができます。例: ASDasd123_4564
プレビュー用に制限	データプレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Classify の出力
ターゲットデータプラットフォーム	設定
Databricks	指定されたエンティティがマスクされたテキスト文字列が返されます。

類似性

2 つの文字列を比較し、意味的類似性スコアを計算します。

利用可能: Databricks

[Input] (入力)

類似性の構成
プロパティ名	設定
コンテンツ	比較する列を選択します。選択できるのは文字列タイプの列のみです。
対象	コンテンツ内のテキストを、別の文字列のテキストまたは指定した値と比較できます。 [Column] (カラム) 比較する列を選択します。選択できるのは文字列タイプの列のみです。値比較するテキスト値を入力します。
出力列名	生成された出力列の名前を入力します。想定される形式は次のとおりです。 [A-Za-z_]で始まることが必要です。 [A-Za-z0-9_]のみ含めることができます。例: ASDasd123_4564
プレビュー用に制限	データプレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Classify の出力
ターゲットデータプラットフォーム	設定
Databricks	スコアは 0 から 1.0 までの浮動小数点値として返されます。1.0 は文字列が等しいことを意味します。

要約

テキスト列内のテキストの要約を生成します。

利用可能: Databricks、Snowflake

[Input] (入力)

要約の構成
プロパティ名	設定
コンテンツ	要約する列を選択します。選択できるのは文字列タイプの列のみです。
最大語数	テキスト要約の最大単語数を設定します。整数値のみ設定できます。デフォルト値は 50 です。空のままにするかゼロに設定すると、最大単語数は適用されません。情報メモこのオプションは Databricks でのみ使用できます。
出力列名	生成された出力列の名前を入力します。想定される形式は次のとおりです。 [A-Za-z_]で始まることが必要です。 [A-Za-z0-9_]のみ含めることができます。例: ASDasd123_4564
プレビュー用に制限	データプレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Summarize の出力
ターゲットデータプラットフォーム	設定
Databricks	[コンテンツ] に入力文字列のサマリーを含むテキスト文字列が返されます。
Snowflake	[コンテンツ] に入力文字列のサマリーを含むテキスト文字列が返されます。

Translate

列のテキストコンテンツを翻訳します。

利用可能: Databricks、Snowflake

サポートされている言語の詳細については、データプラットフォームのリファレンスドキュメントを参照してください。

[Input] (入力)

翻訳の構成
プロパティ名	設定
コンテンツ	要約する列を選択します。選択できるのは文字列タイプの列のみです。
翻訳元	翻訳元の言語を選択します。言語を自動検出するように選択することもできます。利用可能: Snowflake
翻訳先	翻訳先の言語を選択します。
出力列名	生成された出力列の名前を入力します。想定される形式は次のとおりです。 [A-Za-z_]で始まることが必要です。 [A-Za-z0-9_]のみ含めることができます。例: ASDasd123_4564
プレビュー用に制限	データプレビューでロードする行数を設定します。デフォルト値は10です。この値を 0 に設定すると制限はありません。

出力

Translate の出力
ターゲットデータプラットフォーム	設定
Databricks	[コンテンツ] に入力文字列のサマリーを含むテキスト文字列が返されます。
Snowflake	[コンテンツ] に入力文字列のサマリーを含むテキスト文字列が返されます。

プロセッサーの編集

プロセッサー名を変更する場合は、プロセッサーのデフォルト名にカーソルを合わせたときに表示される [編集] アイコンをクリックします。

説明を編集する場合は、 [説明] にカーソルを合わせたときに表示される [編集] アイコンをクリックします。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。

こちらにフィードバックをお寄せください