Ga naar hoofdinhoud Ga naar aanvullende inhoud

ExtractRegEx - script- en diagramfunctie

ExtractRegEx() extraheert tekst uit een tekenreeksuitdrukking met behulp van het opgegeven reguliere expressiepatroon. De functie retourneert een nulwaarde als er geen overeenkomsten worden gevonden.

Deze functie voert regexbewerkingen uit die hoofdlettergevoelig zijn. U kunt eventueel ook de variant ExtractRegExI() gebruiken om hoofdletteronafhankelijke regexbewerkingen uit te voeren.

Syntaxis:  

ExtractRegEx (text, regex [, field_no])

Retourgegevenstypen: tekenreeks

Argumenten
Argument Beschrijving
text Tekenreeksuitdrukking die de tekst bevat die in de retourwaarde moet worden geëxtraheerd.
regex De reguliere expressie om te gebruiken voor het extraheren van tekst.
field_no

Het nummer van de overeenkomst die moet worden uitgepakt. Dit is handig als er meerdere overeenkomsten voor de reguliere expressie in de tekst kunnen worden gevonden. Geef bijvoorbeeld de waarde 4 op om de vierde overeenkomst te extraheren. Dit is een optioneel argument. Geef een negatieve waarde op om de volgorde van de overeenkomsten om te keren.

Het volgende is van toepassing ongeacht of de functie wordt gebruikt in een load-script of diagramuitdrukking:

  • Als field_no positief is, zal de functie één waarde retourneren, die de overeenkomsten van links naar rechts identificeert.

  • Als field_no negatief is, zal de functie één waarde retourneren, die de overeenkomsten van rechts naar links identificeert.

Wanneer u de functie in een load-script gebruikt:

  • Als u de functie ExtractRegEx() in een LOAD-instructie gebruikt en field_no is weggelaten, genereert de functie evenveel records als er overeenkomsten zijn.

  • Als meerdere velden worden geladen met ExtractRegEx() en bij geen darvan een field_no argument is opgegeven, worden de cartesische producten van alle combinaties gemaakt.

Wanneer u de functie in een diagramuitdrukking gebruikt:

  • Als field_no is weggelaten, is de standaardwaarde 1.

Voorbeelden van functies
Voorbeeld Resultaat
ExtractRegEx('a,b c;1 2,3','[a-z]|[0-9]', 1) Retourneert a wat de eerste gevonden overeenkomst is.
ExtractRegEx('a,b c;1 2,3','[a-z]|[0-9]', 2) Retourneert b wat de tweede gevonden overeenkomst is.
ExtractRegEx('a,b c;1 2,3','[a-z]|[0-9]', 4) Retourneert 1 wat de vierde gevonden overeenkomst is.
ExtractRegEx('abc','a|b',-1) Retourneert b. Als er een negatieve waarde wordt opgegeven, worden de overeenkomsten in omgekeerde volgorde geteld.
ExtractRegEx('A,B C;1 2,3','[a-c]|[4-9]') Retourneert een nulwaarde, omdat ExtractRegEx() hoofdlettergevoelig is, en de hoofdletterongevoelige variant niet is gebruikt.
ExtractRegExI('A,B C;1 2,3','[a-c]|[4-9]') Retourneert A, omdat de hoofdletterongevoelige variant ExtractRegExI() is gebruikt.

Wanneer gebruiken

U kunt Extract RegEx() gebruiken om informatie te extraheren die u wilt isoleren uit gegevens die mogelijk ook andere informatie bevatten (bijvoorbeeld vrije tekst of JSON-tekenreeksen). Bijvoorbeeld:

  • Extraheer e-mailadressen, telefoonnummers, rekeningnummers en andere informatie uit tekst.

  • Extraheer numerieke waarden uit tekst (bijvoorbeeld valuta).

  • Standaardiseer de opmaak van tekst of numerieke gegevens.

Voorbeeld 1 - load-script om e-mailadressen uit JSON te extraheren

Voorbeeld 2 - load-script om numerieke waarden uit valutabedragen te extraheren

Voorbeeld 3 - diagramuitdrukkingen om e-mailadressen uit JSON te extraheren

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een typfout, een ontbrekende stap of een technische fout – laat het ons weten zodat we dit kunnen verbeteren!