AI 프로세서
타사 대상 데이터 플랫폼의 생성형 AI 함수를 사용하여 데이터를 변환합니다.
AI 프로세서는 타사 대상 데이터 플랫폼의 기본 생성형 AI 모델 기능을 사용합니다. 예를 들어, 변환 과정에서 데이터를 번역, 분류 또는 요약할 수 있습니다.
가용성
다음 대상 데이터 플랫폼을 사용하는 프로젝트에서는 AI 프로세서 기능을 사용할 수 있습니다.
-
Snowflake
-
Databricks
Snowflake
Snowflake Cortex AI API를 사용하면 Snowflake를 대상 데이터 플랫폼으로 사용하는 프로젝트에서 AI 프로세서 기능을 사용할 수 있습니다.
다음과 같은 함수를 사용할 수 있습니다.
-
감정 분석
-
분류
-
요약
-
번역
해당 함수에 대한 자세한 내용은 Snowflake 설명서: 사용할 수 있는 함수를 참조하십시오.
Databricks
Databricks 기반 모델 API를 사용하면 Databricks를 대상 데이터 플랫폼으로 사용하는 프로젝트에서 AI 프로세서 기능을 사용할 수 있습니다. 이 Databricks 기능은 공개 미리 보기 상태이며 제한이 있을 수 있습니다. 예를 들어, Databricks SQL Classic에서는 지원되지 않습니다. 각 함수의 제한 사항에 대한 자세한 내용은 각 함수에 대한 Databricks 설명서 링크를 참조하십시오.
Databricks 미리 보기 지원 및 세부 정보도 참조하십시오.
다음과 같은 함수를 사용할 수 있습니다. 함수 이름에서 사용할 AI 함수를 선택합니다.
-
감정 분석
-
분류
-
문법 수정
-
마스크
-
유사
-
요약
-
번역
함수에 대한 자세한 내용은 Databricks 설명서: 기본 제공 함수의 사전순 목록을 참조하십시오.
감정 분석
입력 텍스트에 대한 감정 분석을 수행합니다.
사용 가능: Databricks, Snowflake
입력
속성 이름 | 구성 |
---|---|
콘텐츠 | 감정 분석을 수행할 열을 선택합니다. 문자열 유형의 열만 선택할 수 있습니다. |
출력 열 이름 | 생성된 출력 열의 이름을 입력합니다. 예상되는 형식은 다음과 같습니다.
예: ASDasd123_4564 |
미리 보기 제한 | 데이터 미리 보기에 로드할 행의 수를 설정합니다. 기본값은 10입니다. 이 값을 0으로 설정하면 제한이 없습니다. |
출력
대상 데이터 플랫폼 | 구성 |
---|---|
Databricks | 감정은 긍정적, 부정적, 중립적 또는 혼합적 값을 갖는 텍스트 문자열로 반환됩니다. 감정을 감지할 수 없으면 null이 반환됩니다. |
Snowflake | 감정은 영어 입력 텍스트에 대해 -1에서 1 사이의 점수로 반환됩니다. -1은 가장 낮은 음수 감정이고, 1은 가장 높은 양수 감정입니다. 0에 가까운 값은 중립 감정을 나타냅니다. |
분류
제공한 레이블에 따라 입력 텍스트를 분류합니다.
사용 가능: Databricks, Snowflake
입력
속성 이름 | 구성 |
---|---|
콘텐츠 | 텍스트를 분류할 열을 선택합니다. 문자열 유형의 열만 선택할 수 있습니다. |
분류 레이블 | 데이터를 분류할 때 사용할 레이블을 추가합니다. 더 많은 레이블을 추가하려면 |
미리 보기 제한 | 데이터 미리 보기에 로드할 행의 수를 설정합니다. 기본값은 10입니다. 이 값을 0으로 설정하면 제한이 없습니다. |
출력
대상 데이터 플랫폼 | 구성 |
---|---|
Databricks | 콘텐츠의 입력 문자열과 일치하는 분류 레이블이 포함된 텍스트 문자열이 반환됩니다. |
Snowflake | 콘텐츠의 입력 문자열과 일치하는 분류 레이블이 포함된 텍스트 문자열이 반환됩니다. |
문법 수정
텍스트 열의 문법 오류를 수정합니다.
사용 가능: Databricks
입력
속성 이름 | 구성 |
---|---|
콘텐츠 | 문법을 수정하려는 열을 선택합니다. 문자열 유형의 열만 선택할 수 있습니다. |
출력 열 이름 | 새 열 만들기를 선택하면 만들어진 출력 열의 이름을 입력할 수 있습니다. 예상되는 형식은 다음과 같습니다.
예: ASDasd123_4564 |
미리 보기 제한 | 데이터 미리 보기에 로드할 행의 수를 설정합니다. 기본값은 10입니다. 이 값을 0으로 설정하면 제한이 없습니다. |
출력
대상 데이터 플랫폼 | 구성 |
---|---|
Databricks | 문법이 수정된 텍스트 문자열이 반환됩니다. |
마스크
텍스트 열의 지정된 엔터티를 마스킹합니다. 마스킹된 엔터티는 [MASKED]로 바뀝니다.
사용 가능: Databricks
입력
속성 이름 | 구성 |
---|---|
콘텐츠 | 텍스트 엔터티를 마스킹할 열을 선택합니다. 문자열 유형의 열만 선택할 수 있습니다. |
마스크 레이블 | 마스킹하려는 각 텍스트 엔터티에 대한 레이블을 추가합니다. 더 많은 레이블을 추가하려면 |
출력 열 이름 | 새 열 만들기를 선택하면 만들어진 출력 열의 이름을 입력할 수 있습니다. 예상되는 형식은 다음과 같습니다.
예: ASDasd123_4564 |
미리 보기 제한 | 데이터 미리 보기에 로드할 행의 수를 설정합니다. 기본값은 10입니다. 이 값을 0으로 설정하면 제한이 없습니다. |
출력
대상 데이터 플랫폼 | 구성 |
---|---|
Databricks | 지정된 엔터티가 마스킹된 텍스트 문자열이 반환됩니다. |
유사
두 개의 문자열을 비교하여 의미 체계 유사도 점수를 계산합니다.
사용 가능: Databricks
입력
속성 이름 | 구성 |
---|---|
콘텐츠 | 비교할 열을 선택합니다. 문자열 유형의 열만 선택할 수 있습니다. |
With | 콘텐츠의 텍스트를 다른 문자열 열의 텍스트나 지정한 값과 비교할 수 있습니다.
|
출력 열 이름 | 생성된 출력 열의 이름을 입력합니다. 예상되는 형식은 다음과 같습니다.
예: ASDasd123_4564 |
미리 보기 제한 | 데이터 미리 보기에 로드할 행의 수를 설정합니다. 기본값은 10입니다. 이 값을 0으로 설정하면 제한이 없습니다. |
출력
대상 데이터 플랫폼 | 구성 |
---|---|
Databricks | 점수는 0과 1.0 사이의 부동 소수점 값으로 반환되며, 1.0은 문자열이 동일하다는 것을 의미합니다. |
요약
텍스트 열의 텍스트 요약을 생성합니다.
사용 가능: Databricks, Snowflake
입력
속성 이름 | 구성 |
---|---|
콘텐츠 | 요약하려는 열을 선택합니다. 문자열 유형의 열만 선택할 수 있습니다. |
최대 단어 수 | 텍스트 요약의 최대 단어 수를 설정합니다. 정수 값만 설정할 수 있습니다. 기본값은 50입니다. 비워두거나 0으로 설정하면 최대 단어 수가 적용되지 않습니다. 정보 메모이 옵션은 Databricks에서만 사용할 수 있습니다. |
출력 열 이름 | 생성된 출력 열의 이름을 입력합니다. 예상되는 형식은 다음과 같습니다.
예: ASDasd123_4564 |
미리 보기 제한 | 데이터 미리 보기에 로드할 행의 수를 설정합니다. 기본값은 10입니다. 이 값을 0으로 설정하면 제한이 없습니다. |
출력
대상 데이터 플랫폼 | 구성 |
---|---|
Databricks | 콘텐츠에 입력된 문자열의 요약이 포함된 텍스트 문자열이 반환됩니다. |
Snowflake | 콘텐츠에 입력된 문자열의 요약이 포함된 텍스트 문자열이 반환됩니다. |
번역
열의 텍스트 콘텐츠를 번역합니다.
사용 가능: Databricks, Snowflake
지원되는 언어에 대한 자세한 내용은 데이터 플랫폼에 대한 참조 문서를 확인합니다.
입력
속성 이름 | 구성 |
---|---|
콘텐츠 | 요약하려는 열을 선택합니다. 문자열 유형의 열만 선택할 수 있습니다. |
다음에서 번역 | 번역할 언어를 선택합니다. 언어가 자동으로 감지되도록 선택할 수도 있습니다. 사용 가능: Snowflake |
번역 대상 | 번역할 언어를 선택합니다. |
출력 열 이름 | 생성된 출력 열의 이름을 입력합니다. 예상되는 형식은 다음과 같습니다.
예: ASDasd123_4564 |
미리 보기 제한 | 데이터 미리 보기에 로드할 행의 수를 설정합니다. 기본값은 10입니다. 이 값을 0으로 설정하면 제한이 없습니다. |
출력
대상 데이터 플랫폼 | 구성 |
---|---|
Databricks | 콘텐츠에 입력된 문자열의 번역을 포함한 텍스트 문자열이 반환됩니다. |
Snowflake | 콘텐츠에 입력된 문자열의 번역을 포함한 텍스트 문자열이 반환됩니다. |
프로세서 편집
프로세서 이름을 바꾸려면 프로세서의 기본 이름 위로 마우스를 가져가면 표시되는 편집 아이콘을 클릭합니다.
설명을 편집하려면 설명 위로 마우스를 가져가면 표시되는 편집 아이콘을 클릭합니다.