AI-processor
Gebruikt functies van generatieve AI van uw externe doelgegevensplatform om de gegevens te transformeren.
De AI-processor gebruikt eigen generatieve AI-modelfuncties in uw externe doelgegevensplatform. U kunt bijvoorbeeld gegevens vertalen, classificeren of samenvatten in uw transformatie.
Beschikbaarheid
AI-processor is beschikbaar voor projecten die gebruikmaken van de volgende doelgegevensplatformen.
-
Snowflake
-
Databricks
Snowflake
De AI-processor is beschikbaar voor projecten met Snowflake als doelgegevensplatform, waarbij Snowflake Cortex AI API's worden gebruikt.
De volgende functies zijn beschikbaar:
-
Sentiment analyseren
-
Classificeren
-
Samenvatten
-
Vertalen
Zie de Snowflake-documentatie voor meer informatie over de functies: Beschikbare functies.
Databricks
De AI-processor is beschikbaar voor projecten met Databricks als doelgegevensplatform, waarbij Databricks Foundation Model API's worden gebruikt. Deze Databricks-functie staat in openbaar voorbeeld en kan beperkingen bevatten, zo wordt het bijvoorbeeld niet ondersteund in Databricks SQL Classic. Voor informatie over functiespecifieke beperkingen, raadpleegt u de koppeling naar de Databricks-documentatie voor elke respectievelijke functie.
Zie ook Ondersteuning en details van Databricks voorbeelden.
De volgende functies zijn beschikbaar. Selecteer welke AI-functie u wilt gebruiken in Functienaam.
-
Sentiment analyseren
-
Classificeren
-
Grammatica corrigeren
-
Maskeren
-
Overeenkomstigheid
-
Samenvatten
-
Vertalen
Raadpleeg de Databricks-documentatie voor meer informatie over de functies: Alfabetische lijst van ingebouwde functies.
Sentiment analyseren
Voer een sentimentanalyse uit op ingevoerde tekst.
Beschikbaar in: Databricks, Snowflake
Invoer
Eigenschapnaam | Configuratie |
---|---|
Inhoud | Selecteer de kolom waarop u een sentimentanalyse wilt uitvoeren. U kunt alleen kolommen selecteren van het type tekenreeks. |
Naam uitvoerkolom | Geef een naam op voor de gegenereerde uitvoerkolom. De verwachte indeling is als volgt:
Voorbeeld: ASDasd123_4564 |
Limiet voor voorbeeld | Stel het aantal rijen in dat in het gegevensvoorbeeld moet worden geladen. De standaardwaarde is 10. Als u dit op 0 zet, is er geen limiet. |
Uitvoer
Doelgegevensplatform | Configuratie |
---|---|
Databricks | Het sentiment wordt geretourneerd als een tekenreeks door de waarde positief, negatief, neutraal of gemengd. Als het sentiment niet kan worden gedetecteerd, wordt null geretourneerd. |
Snowflake | Het sentiment wordt geretourneerd als een score tussen -1 en 1 voor de gegeven Engelstalige invoertekst. -1 komt overeen met het meest negatieve sentiment en 1 met het meest positieve sentiment. Waarden rond 0 komen overeen met een neutraal sentiment. |
Classificeren
Classificeer invoertekst aan de hand van labels die u opgeeft.
Beschikbaar in: Databricks, Snowflake
Invoer
Eigenschapnaam | Configuratie |
---|---|
Inhoud | Selecteer de kolom waarvoor u tekst wilt classificeren. U kunt alleen kolommen selecteren van het type tekenreeks. |
Classificatielabel | Voeg labels toe om te gebruiken bij het classificeren van de gegevens. Gebruik |
Limiet voor voorbeeld | Stel het aantal rijen in dat in het gegevensvoorbeeld moet worden geladen. De standaardwaarde is 10. Als u dit op 0 zet, is er geen limiet. |
Uitvoer
Doelgegevensplatform | Configuratie |
---|---|
Databricks | Er wordt een teksttekenreeks geretourneerd met het classificatielabel dat overeenkomt met de invoertekenreeks in Inhoud. |
Snowflake | Er wordt een teksttekenreeks geretourneerd met het classificatielabel dat overeenkomt met de invoertekenreeks in Inhoud. |
Grammatica corrigeren
Corrigeer grammaticale fouten in een tekstkolom.
Beschikbaar in: Databricks
Invoer
Eigenschapnaam | Configuratie |
---|---|
Inhoud | Selecteer de kolom waarvan u de grammatica wilt corrigeren. U kunt alleen kolommen selecteren van het type tekenreeks. |
Naam uitvoerkolom | Als u Nieuwe kolom maken selecteert, kunt u een naam invoeren voor de gegenereerde uitvoerkolom. De verwachte indeling is als volgt:
Voorbeeld: ASDasd123_4564 |
Limiet voor voorbeeld | Stel het aantal rijen in dat in het gegevensvoorbeeld moet worden geladen. De standaardwaarde is 10. Als u dit op 0 zet, is er geen limiet. |
Uitvoer
Doelgegevensplatform | Configuratie |
---|---|
Databricks | Er wordt een teksttekenreeks geretourneerd met de grammatica gecorrigeerd. |
Maskeren
Maskeer opgegeven entiteiten in een tekstkolom. Gemaskeerde entiteiten worden vervangen door [MASKED].
Beschikbaar in: Databricks
Invoer
Eigenschapnaam | Configuratie |
---|---|
Inhoud | Selecteer de kolom waarin u tekstentiteiten wilt maskeren. U kunt alleen kolommen selecteren van het type tekenreeks. |
Labels maskeren | Voeg een label toe voor elke tekstentiteit die u wilt maskeren. Gebruik |
Naam uitvoerkolom | Als u Nieuwe kolom maken selecteert, kunt u een naam invoeren voor de gegenereerde uitvoerkolom. De verwachte indeling is als volgt:
Voorbeeld: ASDasd123_4564 |
Limiet voor voorbeeld | Stel het aantal rijen in dat in het gegevensvoorbeeld moet worden geladen. De standaardwaarde is 10. Als u dit op 0 zet, is er geen limiet. |
Uitvoer
Doelgegevensplatform | Configuratie |
---|---|
Databricks | Er wordt een teksttekenreeks geretourneerd met de opgegeven entiteiten gemaskeerd. |
Overeenkomstigheid
Vergelijk twee tekenreeksen en bereken de semantische gelijkenisscore.
Beschikbaar in: Databricks
Invoer
Eigenschapnaam | Configuratie |
---|---|
Inhoud | Selecteer de kolom die u wilt vergelijken. U kunt alleen kolommen selecteren van het type tekenreeks. |
Met | U kunt de tekst in Inhoud vergelijken met tekst uit een andere tekenreekskolom of een waarde die u opgeeft.
|
Naam uitvoerkolom | Geef een naam op voor de gegenereerde uitvoerkolom. De verwachte indeling is als volgt:
Voorbeeld: ASDasd123_4564 |
Limiet voor voorbeeld | Stel het aantal rijen in dat in het gegevensvoorbeeld moet worden geladen. De standaardwaarde is 10. Als u dit op 0 zet, is er geen limiet. |
Uitvoer
Doelgegevensplatform | Configuratie |
---|---|
Databricks | De score wordt geretourneerd als een variabele waarde tussen 0 en 1,0, waarbij 1,0 betekent dat de tekenreeksen gelijk zijn aan elkaar. |
Samenvatten
Genereer een samenvatting van de tekst in een tekstkolom.
Beschikbaar in: Databricks, Snowflake
Invoer
Eigenschapnaam | Configuratie |
---|---|
Inhoud | Selecteer de kolom die u wilt samenvatten. U kunt alleen kolommen selecteren van het type tekenreeks. |
Max. aantal woorden | Stel het maximumaantal woorden in van de tekstsamenvatting. U kunt alleen gehele getallen instellen. De standaardwaarde is 50. Als u deze leeg laat of op nul zet, wordt het maximumaantal woorden niet toegepast. InformatieDeze optie is alleen beschikbaar in Databricks. |
Naam uitvoerkolom | Geef een naam op voor de gegenereerde uitvoerkolom. De verwachte indeling is als volgt:
Voorbeeld: ASDasd123_4564 |
Limiet voor voorbeeld | Stel het aantal rijen in dat in het gegevensvoorbeeld moet worden geladen. De standaardwaarde is 10. Als u dit op 0 zet, is er geen limiet. |
Uitvoer
Doelgegevensplatform | Configuratie |
---|---|
Databricks | Er wordt een teksttekenreeks geretourneerd met een samenvatting van de invoertekenreeks in Inhoud. |
Snowflake | Er wordt een teksttekenreeks geretourneerd met een samenvatting van de invoertekenreeks in Inhoud. |
Vertalen
Vertaalt de tekstinhoud van een kolom.
Beschikbaar in: Databricks, Snowflake
Raadpleeg de referentiedocumentatie voor het gegevensplatform voor informatie over ondersteunde talen.
Invoer
Eigenschapnaam | Configuratie |
---|---|
Inhoud | Selecteer de kolom die u wilt samenvatten. U kunt alleen kolommen selecteren van het type tekenreeks. |
Vertalen vanuit | Selecteer de taal waaruit u wilt vertalen. U kunt er ook voor kiezen om de taal automatisch te laten detecteren. Beschikbaar in: Snowflake |
Vertalen naar | Selecteer de taal waarnaar u wilt vertalen. |
Naam uitvoerkolom | Geef een naam op voor de gegenereerde uitvoerkolom. De verwachte indeling is als volgt:
Voorbeeld: ASDasd123_4564 |
Limiet voor voorbeeld | Stel het aantal rijen in dat in het gegevensvoorbeeld moet worden geladen. De standaardwaarde is 10. Als u dit op 0 zet, is er geen limiet. |
Uitvoer
Doelgegevensplatform | Configuratie |
---|---|
Databricks | Er wordt een teksttekenreeks geretourneerd met een vertaling van de invoertekenreeks in Inhoud. |
Snowflake | Er wordt een teksttekenreeks geretourneerd met een vertaling van de invoertekenreeks in Inhoud. |
De processor bewerken
Om de naam van de processor te wijzigen, klikt u op het pictogram Bewerken dat wordt weergegeven als de muisaanwijzer op de standaardnaam van de processor is geplaatst.
Om de beschrijving te wijzigen, klikt u op het pictogram Bewerken dat wordt weergegeven als de muisaanwijzer op Beschrijving is geplaatst.