MatchRegEx() vergleicht den Eingabestring mit einem oder mehreren Mustern für den angegebenen regulären Ausdruck und gibt den numerischen Speicherort der übereinstimmenden Muster für den regulären Ausdruck zurück. Wenn keine Übereinstimmungen gefunden werden, gibt die Funktion 0 zurück. Diese Funktion sucht nur nach genauen Übereinstimmungen.
Diese Funktion führt Regex-Vorgänge durch, bei denen die Groß- und Kleinschreibung beachtet wird. Sie können alternativ die Variante MatchRegExI() verwenden, um Regex-Vorgänge ohne Berücksichtigung der Groß-/Kleinschreibung durchzuführen.
Syntax:
MatchRegEx
(text, regex1 [ , regex2,...regexN])
Rückgabe Datentyp: ganze Zahl
Argumente
Argument
Beschreibung
text
Der Text des Eingabestrings, den Sie mit einem oder mehreren regulären Ausdrücken abgleichen möchten.
regex
Der reguläre Ausdruck, der mit dem Eingabestring abgeglichen werden soll. Sie können mehr als einen regulären Ausdruck in einer einzigen Formel angeben, getrennt als nachfolgende Argumente.
Gibt 3 zurück. Das dritte Regex-Muster ist das erste, das mit den Daten übereinstimmt.
MatchRegEx('ABC','[abc]+','[123]')
Gibt 0 zurück, da MatchRegEx() zwischen Groß- und Kleinschreibung unterscheidet.
MatchRegExI('ABC','[abc]+','[123]')
Gibt 1 zurück. Die Variante der Funktion ohne Berücksichtigung von Groß- und Kleinschreibung (MatchRegExI()) wird verwendet.
Verwendung
Zu den Anwendungsfällen für diese Funktion gehören:
Validierung von Text, um Formatierungs- und Konformitätsstandards zu erfüllen und um Fehler in Daten zu erkennen.
Erkennen von Unterschieden bei der Formatierung von Text. Sie können zum Beispiel feststellen, wie viele Telefonnummern Format A, Format B usw. verwenden.
Beispiel 1 – Ladeskript zur Analyse von Telefonnummernformaten
Übersicht
Öffnen Sie den Dateneditor und fügen Sie das Ladeskript unten in eine neue Registerkarte ein.
Das Ladeskript umfasst:
Eine Tabelle BusinessContactInfo mit Kontakttelefonnummern für verschiedene Unternehmen. Die Telefonnummern sind 10-stellige NANP-Telefonnummern.
Ein berechnetes Feld (PhoneNumberFormat), um zu beurteilen, ob die einzelnen Telefonnummern einem bestimmten Satz von Telefonnummernformaten entsprechen.
Es gibt drei verschiedene Formate, auf die wir prüfen wollen: (###) ###-####, ###-###-#### und ##########.
Ladeskript
BusinessContactInfo:
Load MatchRegEx(ContactInfo,'\({0,1}[0-9]{3}\) [0-9]{3}-[0-9]{4}', '[0-9]{3}-[0-9]{3}-[0-9]{4}', '[0-9]{10}') as PhoneNumberFormat,
* Inline `
ID CompanyName ContactInfo
1 Company A (123) 456-7890
2 Company B 0123456790
3 Company C 234-567-8901
4 Company D (024) 680-2456
5 Company E (135) 791-3579
6 Company F 8901234567
7 Company G 235-235-2352
8 Company H (555) (555) (5555)
9 Company I 2342342343
10 Company J 444-444-4444
` (delimiter is '\t');
Ergebnisse
Laden Sie die Daten und öffnen Sie ein Arbeitsblatt. Erstellen Sie eine neue Tabelle und fügen Sie die folgenden Felder als Dimensionen hinzu:
CompanyName
ContactInfo
PhoneNumberFormat
Ergebnistabelle
CompanyName
ContactInfo
PhoneNumberFormat
Company A
(123) 456-7890
1
Company B
0123456790
3
Company C
234-567-8901
2
Company D
(024) 680-2456
1
Company E
(135) 791-3579
1
Company F
8901234567
3
Company G
235-235-2352
2
Company H
(555) (555) (5555)
0
Company I
2342342343
3
Company J
444-444-4444
2
Von hier aus könnten Sie zum Beispiel KPIs erstellen, um die Gesamtzahl der Vorkommen der einzelnen Telefonnummernformate sowie die Anzahl der Telefonnummern zu berechnen, die kein erkanntes Format haben:
Beispiele für Aggregierungsformeln zum Zählen der Vorkommen der einzelnen Formate
Beispiel 2 – Diagrammformel zur Identifizierung des ISBN-Formats
Übersicht
Öffnen Sie den Dateneditor und fügen Sie das Ladeskript unten in eine neue Registerkarte ein.
Das Ladeskript umfasst:
Eine Tabelle Books mit den ISBN-Codes für verschiedene Bücher.
Anhand dieser Daten möchten wir feststellen, ob jeder ISBN-Code ein gültiger 10- oder 13-stelliger Code ist, basierend auf der in einem Regex-Muster angegebenen Syntax.
Ladeskript
Books:
Load * Inline [
Book
ISBN 123-3-1234-1234-0
ISBN 012-2-0123-0123-4
ISBN 000-1-0123-0123-2
ISBN 0-111-23456-7
ISBN 555-2-5555-5555-3
ISBN 222-4-2222-2222-2
ISBN 1-901-23456-8
ISBN 333-3-3333-3333-3
ISBN 555-1-5151-5151-3
ISBN 232-1-2323-2323-1
ISBN 2-444-44444-4
ISBN 888-0-9999-0000-0
];
Ergebnisse
Laden Sie die Daten und öffnen Sie ein Arbeitsblatt. Erstellen Sie eine neue Tabelle und fügen Sie dieses Feld als Dimension hinzu:
Book
Fügen Sie die folgende dynamische Dimension hinzu, und geben Sie ihr die Bezeichnung ISBN Format:
Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!