Ga naar hoofdinhoud Ga naar aanvullende inhoud

ExtractRegExGroup - script- en diagramfunctie

ExtractRegExGroup() extraheert tekst uit een tekenreeksuitdrukking met behulp van het samengestelde reguliere expressiepatroon dat is opgegeven. Geef bij het gebruik van de functie de groep op die binnen de samengestelde regex moet worden gebruikt. De functie retourneert een nulwaarde als er geen overeenkomsten worden gevonden.

Als u de functie ExtractRegExGroup() in een LOAD-instructie gebruikt en field_no is weggelaten, dan zal de functie meerdere records retourneren. Als meerdere velden worden geladen met ExtractRegExGroup(), worden de cartesische producten van alle combinaties gemaakt.

Deze functie voert regexbewerkingen uit die hoofdlettergevoelig zijn. U kunt eventueel ook de variant ExtractRegExGroupI() gebruiken om hoofdletteronafhankelijke regexbewerkingen uit te voeren.

Syntaxis:  

ExtractRegExGroup (text, regex, group [, field_no])

Retourgegevenstypen: tekenreeks

Argumenten
Argument Beschrijving
text Tekenreeksuitdrukking die de tekst bevat die in de retourwaarde moet worden geëxtraheerd.
regex De reguliere expressie om te gebruiken voor het extraheren van tekst.
group

Het nummer van de groep, in het geval van een samengestelde reguliere expressie.

Als de reguliere expressie slechts één groep bevat, gebruik dan in plaats daarvan de functie ExtractRegEx(). Als alternatief kunt u ExtractRegExGroup() gebruiken met een group waarde van 0.

U kunt een negatieve group waarde opgeven om van rechts naar links naar overeenkomsten te zoeken.

field_no

Het nummer van de overeenkomst die moet worden uitgepakt. Dit is handig als er meerdere overeenkomsten voor de reguliere expressie in de tekst kunnen worden gevonden. Geef bijvoorbeeld de waarde 4 op om de vierde overeenkomst te extraheren.

Dit is een optioneel argument. De standaardinstelling is 1 als deze niet is opgegeven.

Voorbeelden van functies
Voorbeeld Resultaat
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',1) Retourneert abc (eerste groep van eerste overeenkomst).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',1,2) Retourneert def (eerste groep van tweede overeenkomst).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',2) Retourneert 123 (tweede groep van eerste overeenkomst).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',2,2) Retourneert 456 (tweede groep van tweede overeenkomst).

Wanneer gebruiken

U kunt Extract RegEx() gebruiken om informatie te extraheren die u wilt isoleren uit gegevens die mogelijk ook andere informatie bevatten (bijvoorbeeld vrije tekst of JSON-tekenreeksen). Bijvoorbeeld:

  • Extraheer e-mailadressen, telefoonnummers, rekeningnummers en andere informatie uit tekst.

  • Extraheer numerieke waarden uit tekst (bijvoorbeeld valuta).

  • Standaardiseer de opmaak van tekst of numerieke gegevens.

Voorbeeld 1 - load-script om transactiecodes te parseren

Voorbeeld 2 - load-script om zakelijke contactgegevens te extraheren

Voorbeeld 3 - load-script om componenten uit ISBN-codes te extraheren

Voorbeeld 4 - diagramuitdrukkingen om zakelijke contactgegevens te extraheren (met vergelijking ExtractRegEx() )

Voorbeeld 5 - URL-parseren (met ExtractRegEx() vergelijking)

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een typfout, een ontbrekende stap of een technische fout – laat het ons weten zodat we dit kunnen verbeteren!