Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

ExtractRegEx - Skript- und Diagrammfunktion

ExtractRegEx() extrahiert Text aus einem Eingabestringausdruck unter Verwendung des Musters für den angegebenen regulären Ausdruck. Die Funktion gibt einen Nullwert zurück, wenn keine Übereinstimmungen gefunden werden.

Diese Funktion führt Regex-Vorgänge durch, bei denen die Groß- und Kleinschreibung beachtet wird. Sie können alternativ die Variante ExtractRegExI() verwenden, um Regex-Vorgänge ohne Berücksichtigung der Groß-/Kleinschreibung durchzuführen.

Syntax:  

ExtractRegEx (text, regex [, field_no])

Rückgabe Datentyp: String

Argumente
Argument Beschreibung
text Stringformel, die den Text enthält, der im Rückgabewert extrahiert werden soll.
regex Der reguläre Ausdruck, der zum Extrahieren von Text verwendet wird.
field_no

Die Nummer der zu extrahierenden Übereinstimmung. Dies ist nützlich, wenn im Text mehrere Übereinstimmungen mit dem regulären Ausdruck gefunden werden können. Geben Sie zum Beispiel den Wert 4 an, um die vierte Übereinstimmung zu extrahieren. Dies ist ein optionales Argument. Geben Sie einen negativen Wert an, um die Reihenfolge der Übereinstimmungen umzukehren.

Das Folgende gilt unabhängig davon, ob die Funktion in einem Ladeskript oder einer Diagrammformel verwendet wird:

  • Wenn field_no positiv ist, gibt die Funktion einen Wert zurück, wobei die Übereinstimmungen von links nach rechts identifiziert werden.

  • Wenn field_no negativ ist, gibt die Funktion einen Wert zurück, wobei die Übereinstimmungen von rechts nach links identifiziert werden.

Wenn Sie die Funktion in einem Ladeskript verwenden:

  • Wenn Sie die Funktion ExtractRegEx() in einem LOAD-Befehl verwenden und field_no weglassen, generiert die Funktion so viele Datensätze, wie es Übereinstimmungen gibt.

  • Wenn mehrere Felder mit ExtractRegEx() geladen werden und keines von ihnen ein Argument field_no angibt, werden die kartesischen Produkte aller Kombinationen erstellt.

Bei Verwendung der Funktion in einer Diagrammformel:

  • Wenn field_no weggelassen wird, lautet der Standardwert 1.

Funktionsbeispiele
Beispiel Ergebnis
ExtractRegEx('a,b c;1 2,3','[a-z]|[0-9]', 1) Gibt a zurück, was der ersten gefundenen Übereinstimmung entspricht.
ExtractRegEx('a,b c;1 2,3','[a-z]|[0-9]', 2) Gibt b zurück, was der zweiten gefundenen Übereinstimmung entspricht.
ExtractRegEx('a,b c;1 2,3','[a-z]|[0-9]', 4) Gibt 1 zurück, was der vierten gefundenen Übereinstimmung entspricht.
ExtractRegEx('abc','a|b',-1) Gibt b zurück. Wenn ein negativer Wert angegeben wird, werden die Übereinstimmungen in umgekehrter Reihenfolge gezählt.
ExtractRegEx('A,B C;1 2,3','[a-c]|[4-9]') Gibt einen Nullwert zurück, da ExtractRegEx() zwischen Groß- und Kleinschreibung unterscheidet und die nicht die Variante ohne Berücksichtigung der Groß- und Kleinschreibung verwendet wurde.
ExtractRegExI('A,B C;1 2,3','[a-c]|[4-9]') Gibt A zurück, da die Variante ExtractRegExI() verwendet wurde, die Groß- und Kleinschreibung nicht berücksichtigt.

Verwendung

Sie können Extract RegEx() verwenden, um Informationen zu extrahieren, die Sie von Daten isolieren möchten, die auch andere Informationen enthalten könnten (z. B. freien Text oder JSON-Strings). Hier ein Beispiel:

  • Extrahieren Sie E-Mail-Adressen, Telefonnummern, Kontonummern und andere Informationen aus Text.

  • Extrahieren Sie numerische Werte aus Text (z. B. Währung).

  • Standardisieren Sie die Formatierung von Text oder numerischen Daten.

Beispiel 1 – Ladeskript zum Extrahieren von E-Mail-Adressen aus JSON

Beispiel 2 – Ladeskript zum Extrahieren numerischer Werte aus Währungsbeträgen

Beispiel 3 – Diagrammformeln zum Extrahieren von E-Mail-Adressen aus JSON

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!