AI-processor
Använder generativa AI-funktioner från din tredje parts måldataplattform för att omvandla data.
AI-processorn använder interna generativa AI-modellfunktioner i din tredje parts måldataplattform. Du kan exempelvis översätta, klassificera eller sammanfatta data i din transformering.
Tillgänglighet
AI-processorkapacitet är tillgänglig för projekt som använder följande plattformar för måldata.
-
Snowflake
-
Databricks
Snowflake
AI-processorfunktion är för närvarande endast tillgängligt för projekt med Snowflake som måldataplattform, med hjälp av Snowflake Cortex AI-API:er.
Följande funktioner finns tillgängliga:
-
Analysera attityd
-
Klassificera
-
Sammanfatta
-
Översätt
Mer information om funktionerna finns i dokumentationen för Snowflake: Tillgängliga funktioner.
Databricks
AI-processorfunktion är för närvarande endast tillgängligt för projekt med Databricks som måldataplattform, med hjälp av Databricks grundmodells-API:er. Denna Databricks-funktion finns i Offentlig förhandsgranskning och kan innehålla begränsningar, till exempel stöds den inte på Databricks SQL Klassisk. För information om funktionsspecifika begränsningar, se länken till Databricks dokumentation för respektive funktion.
Se även Support och detaljer för Databricks förhandsgranskningar.
Följande funktioner finns tillgängliga. Välj vilken AI-funktion som ska användas i Funktionsnamn.
-
Analysera attityd
-
Klassificera
-
Rätta till grammatik
-
Maskera
-
Likhet
-
Sammanfatta
-
Översätt
Mer information om funktionerna finns i dokumentationen för Databricks: Alfabetisk lista över inbyggda funktioner.
Analysera attityd
Kör sentimentsanalys på inmatad text.
Tillgängligt i: Databricks, Snowflake
Indata
Egenskapsnamn | Konfiguration |
---|---|
Innehåll | Välj den kolumn som du vill utföra sentimentsanalys på. Du kan bara välja kolumner av typen sträng. |
Utdatanamn | Ange ett namn för den genererade kolumnen med utdata. Det förväntade formatet är som följer:
Exempel: ASDasd123_4564 |
Gräns för förhandsgranskning | Ställ in antalet rader som ska laddas i förhandsgranskningen av data. Standardvärdet är 10. Om du ställer in detta på 0 finns det ingen gräns. |
Utdata
Måldataplattform | Konfiguration |
---|---|
Databricks | Sentimentet returneras som en textsträng med värdet positiv, negativ, neutral eller blandad. Om sentimentet inte kan upptäckas returneras Null. |
Snowflake | Åsikten returneras som en poäng mellan -1 och 1 för den angivna engelskspråkiga indatatexten. -1 motsvarar den mest negativa åsikten och 1 den mest positiva åsikten. Värden runt 0 motsvarar en neutral åsikt. |
Klassificera
Klassificera inmatad text enligt de etiketter du tillhandahåller.
Tillgängligt i: Databricks, Snowflake
Indata
Egenskapsnamn | Konfiguration |
---|---|
Innehåll | Välj den kolumn som du vill klassificera texten för. Du kan bara välja kolumner av typen sträng. |
Klassificeringsetiketter | Lägg till etiketter som ska användas när du klassificerar data. Använd |
Gräns för förhandsgranskning | Ställ in antalet rader som ska laddas i förhandsgranskningen av data. Standardvärdet är 10. Om du ställer in detta på 0 finns det ingen gräns. |
Utdata
Måldataplattform | Konfiguration |
---|---|
Databricks | En textsträng returneras med den klassificeringsetikett som matchar indatasträngen i Innehåll. |
Snowflake | En textsträng returneras med den klassificeringsetikett som matchar indatasträngen i Innehåll. |
Rätta till grammatik
Korrigera grammatiska fel i en textkolumn.
Tillgängligt i: Databricks
Indata
Egenskapsnamn | Konfiguration |
---|---|
Innehåll | Välj den kolumn som du vill fixa grammatiken i. Du kan bara välja kolumner av typen sträng. |
Utdatanamn | Om du väljer Skapa en ny kolumn kan du ange ett namn för den genererade utdatakolumnen. Det förväntade formatet är som följer:
Exempel: ASDasd123_4564 |
Gräns för förhandsgranskning | Ställ in antalet rader som ska laddas i förhandsgranskningen av data. Standardvärdet är 10. Om du ställer in detta på 0 finns det ingen gräns. |
Utdata
Måldataplattform | Konfiguration |
---|---|
Databricks | En textsträng returneras med grammatiken korrigerad. |
Maskera
Maskera specifika enheter i en textkolumn. Maskerade enheter ersätts med [MASKED].
Tillgängligt i: Databricks
Indata
Egenskapsnamn | Konfiguration |
---|---|
Innehåll | Välj den kolumn där du vill maskera textenheter. Du kan bara välja kolumner av typen sträng. |
Maskera etiketter | Lägg till en etikett för varje textenhet som du vill maskera. Använd |
Utdatanamn | Om du väljer Skapa en ny kolumn kan du ange ett namn för den genererade utdatakolumnen. Det förväntade formatet är som följer:
Exempel: ASDasd123_4564 |
Gräns för förhandsgranskning | Ställ in antalet rader som ska laddas i förhandsgranskningen av data. Standardvärdet är 10. Om du ställer in detta på 0 finns det ingen gräns. |
Utdata
Måldataplattform | Konfiguration |
---|---|
Databricks | En textsträng returneras med de angivna elementen maskerade. |
Likhet
Jämför två strängar och beräkna den semantiska likhetspoängen.
Tillgängligt i: Databricks
Indata
Egenskapsnamn | Konfiguration |
---|---|
Innehåll | Välj den kolumn som du vill jämföra. Du kan bara välja kolumner av typen sträng. |
Med | Du kan jämföra texten i Innehåll med text från en annan strängkolumn eller ett värde som du anger.
|
Utdatanamn | Ange ett namn för den genererade kolumnen med utdata. Det förväntade formatet är som följer:
Exempel: ASDasd123_4564 |
Gräns för förhandsgranskning | Ställ in antalet rader som ska laddas i förhandsgranskningen av data. Standardvärdet är 10. Om du ställer in detta på 0 finns det ingen gräns. |
Utdata
Måldataplattform | Konfiguration |
---|---|
Databricks | Poängen returneras som ett floatvärde mellan 0 och 1,0, där 1,0 innebär att strängarna är lika. |
Sammanfatta
Generera en sammanfattning av texten i en textkolumn.
Tillgängligt i: Databricks, Snowflake
Indata
Egenskapsnamn | Konfiguration |
---|---|
Innehåll | Välj den kolumn som du vill sammanfatta. Du kan bara välja kolumner av typen sträng. |
Maximalt antal ord | Ställ in max antal ord för textsammanfattningen. Du kan bara ställa in heltalsvärden. Standardvärdet är 50. Om du lämnar den tom eller ställer in den på noll tillämpas inte max antal ord. Anteckning om informationDetta alternativ finns endast tillgängligt i Databricks. |
Utdatanamn | Ange ett namn för den genererade kolumnen med utdata. Det förväntade formatet är som följer:
Exempel: ASDasd123_4564 |
Gräns för förhandsgranskning | Ställ in antalet rader som ska laddas i förhandsgranskningen av data. Standardvärdet är 10. Om du ställer in detta på 0 finns det ingen gräns. |
Utdata
Måldataplattform | Konfiguration |
---|---|
Databricks | En textsträng returneras med en sammanfattning av indatasträngen i Innehåll. |
Snowflake | En textsträng returneras med en sammanfattning av indatasträngen i Innehåll. |
Översätt
Översätter textinnehållet i en kolumn.
Tillgängligt i: Databricks, Snowflake
För information om språk som stöds, se referensdokumentationen för dataplattformen.
Indata
Egenskapsnamn | Konfiguration |
---|---|
Innehåll | Välj den kolumn som du vill sammanfatta. Du kan bara välja kolumner av typen sträng. |
Översätt från | Välj det språk som du vill översätta från. Du kan också välja att språket ska identifieras automatiskt. Tillgängligt i: Snowflake |
Översätt till | Välj det språk som du vill översätta till. |
Utdatanamn | Ange ett namn för den genererade kolumnen med utdata. Det förväntade formatet är som följer:
Exempel: ASDasd123_4564 |
Gräns för förhandsgranskning | Ställ in antalet rader som ska laddas i förhandsgranskningen av data. Standardvärdet är 10. Om du ställer in detta på 0 finns det ingen gräns. |
Utdata
Måldataplattform | Konfiguration |
---|---|
Databricks | En textsträng returneras med en översättning av indatasträngen i Innehåll. |
Snowflake | En textsträng returneras med en översättning av indatasträngen i Innehåll. |
Redigera processorn
Vill du byta namn på processorn klickar du på Redigera-ikonen som visas när du hovrar över standardnamnet på processorn.
För att redigera beskrivningen klickar du på Redigera-ikonen som visas när du hovrar över Beskrivning.