Gå till huvudinnehåll Gå till ytterligare innehåll

ExtractRegExGroup - skript- och diagramfunktion

ExtractRegExGroup() extraherar text från ett indatastränguttryck med hjälp av det sammansatta reguljära uttrycksmönster som anges. När du använder funktionen anger du den grupp som ska användas i den sammansatta regexen. Funktionen returnerar ett nullvärde om inga matchningar hittas.

Om du använder funktionen ExtractRegExGroup() i en LOAD-sats och field_no utelämnas, kommer funktionen att returnera flera poster. Om flera fält läses in med hjälp av ExtractRegExGroup() skapas de kartesiska produkterna för alla kombinationer.

Den här funktionen utför regexoperationer som är skiftlägeskänsliga. Alternativt kan du använda varianten ExtractRegExGroupI() för att utföra skiftlägesokänsliga regexoperationer.

Syntax:  

ExtractRegExGroup (text, regex, group [, field_no])

Returnerad datatyp: sträng

Argument
Argument Beskrivning
text Stränguttryck som innehåller den text som ska extraheras i returvärdet.
regex Det reguljära uttryck som ska användas för att extrahera text.
group

Gruppens nummer, om det rör sig om ett sammansatt reguljärt uttryck.

Om det reguljära uttrycket bara innehåller en grupp använder du istället funktionen ExtractRegEx(). Alternativt kan du använda ExtractRegExGroup() med ett group-värde på 0.

Du kan ange ett negativt värde för group för att söka efter matchningar från höger till vänster.

field_no

Numret på den matchning som ska extraheras. Detta är användbart när flera träffar för det reguljära uttrycket kan finnas i texten. Ange t.ex. värdet 4 för att få fram den fjärde matchningen.

Det här är ett valfritt argument. Standard är 1 om det inte anges.

Exempel på funktioner
Exempel Resultat
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',1) Returnerar abc (första gruppen i första matchningen).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',1,2) Returnerar def (första gruppen i andra matchningen).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',2) Returnerar 123 (andra gruppen i första matchningen).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',2,2) Returnerar 456 (andra gruppen i andra matchningen).

Användning

Du kan använda Extract RegEx() för att extrahera information som du vill isolera från data som också kan innehålla annan information (t.ex. fritext eller JSON-strängar). Exempel:

  • Extrahera e-postadresser, telefonnummer, kontonummer och annan information från text.

  • Extrahera numeriska värden från text (t.ex. valuta).

  • Standardisera formateringen av text eller numeriska data.

Exempel 1 – laddningsskript för att analysera transaktionskoder

Exempel 2 – laddningsskript för att extrahera kontaktinformation för företag

Exempel 3 – laddningsskript för att extrahera komponenter från ISBN-koder

Exempel 4 – diagramuttryck för att extrahera kontaktinformation för företag (med jämförelse med ExtractRegEx() )

Exempel 5 – URL-parsning (med jämförelse på ExtractRegEx())

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!