MatchRegEx() vergleicht einen Eingabe-String (text) mit einem oder mehreren regulären Ausdrücken (regex). Sie gibt den numerischen Ort der Muster regulärer Ausdrücke zurück, die übereinstimmen. Gibt nur eine Übereinstimmungsantwort zurück, wenn die Auswertung des regulären Ausdrucks mit der gesamten Texteingabe übereinstimmt. Wenn keine Übereinstimmungen gefunden werden, gibt die Funktion 0 zurück.
Diese Funktion führt Regex-Vorgänge durch, bei denen die Groß- und Kleinschreibung beachtet wird. Sie können alternativ die Variante MatchRegExI() verwenden, um Regex-Vorgänge ohne Berücksichtigung der Groß-/Kleinschreibung durchzuführen.
Syntax:
MatchRegEx
(text, regex1 [ , regex2,...regexN])
Rückgabe Datentyp: ganze Zahl
Argumente
Argument
Beschreibung
text
Der Text des Eingabestrings, den Sie mit einem oder mehreren regulären Ausdrücken abgleichen möchten. Damit eine Übereinstimmung erfolgt, muss dieser Eingabe-String exakt mit dem regex-Muster übereinstimmen.
regex
Der reguläre Ausdruck, der mit dem Eingabestring abgeglichen werden soll. Sie können mehr als einen regulären Ausdruck in einer einzigen Formel angeben, getrennt als nachfolgende Argumente.
Funktionsbeispiele
Beispiel
Ergebnis
MatchRegEx('testSample','test')
Gibt 0 zurück. Die Funktion gibt nur dann eine Übereinstimmungsantwort zurück, wenn eine exakte Übereinstimmung zwischen text und dem regex-Muster besteht. Obwohl testSampletest enthält, enthält es auch anderen Text (Sample), was eine exakte Übereinstimmung verhindert.
Gibt 3 zurück. Das dritte Regex-Muster ist das erste, das mit den Daten übereinstimmt.
MatchRegEx('ABC','[abc]+','[123]')
Gibt 0 zurück, da MatchRegEx() zwischen Groß- und Kleinschreibung unterscheidet.
MatchRegExI('ABC','[abc]+','[123]')
Gibt 1 zurück. Die Variante der Funktion ohne Berücksichtigung von Groß- und Kleinschreibung (MatchRegExI()) wird verwendet.
Verwendung von MatchRegEx
Zu den Anwendungsfällen für diese Funktion gehören:
Validierung von Text, um Formatierungs- und Konformitätsstandards zu erfüllen und um Fehler in Daten zu erkennen.
Erkennen von Unterschieden bei der Formatierung von Text. Sie können zum Beispiel feststellen, wie viele Telefonnummern Format A, Format B usw. verwenden.
Beispiel 1 – Ladeskript zur Analyse von Telefonnummernformaten
Übersicht
Öffnen Sie den Dateneditor und fügen Sie das Ladeskript unten in einen neuen Abschnitt ein.
Das Ladeskript umfasst:
Eine Tabelle BusinessContactInfo mit Kontakttelefonnummern für verschiedene Unternehmen. Die Telefonnummern sind 10-stellige NANP-Telefonnummern.
Ein berechnetes Feld (PhoneNumberFormat), um zu beurteilen, ob die einzelnen Telefonnummern einem bestimmten Satz von Telefonnummernformaten entsprechen.
Es gibt drei verschiedene Formate, auf die wir prüfen wollen: (###) ###-####, ###-###-#### und ##########.
Ladeskript
BusinessContactInfo:
Load MatchRegEx(ContactInfo,'\({0,1}[0-9]{3}\) [0-9]{3}-[0-9]{4}', '[0-9]{3}-[0-9]{3}-[0-9]{4}', '[0-9]{10}') as PhoneNumberFormat,
* Inline `
ID CompanyName ContactInfo
1 Company A (123) 456-7890
2 Company B 0123456790
3 Company C 234-567-8901
4 Company D (024) 680-2456
5 Company E (135) 791-3579
6 Company F 8901234567
7 Company G 235-235-2352
8 Company H (555) (555) (5555)
9 Company I 2342342343
10 Company J 444-444-4444
` (delimiter is '\t');
Ergebnisse
Laden Sie die Daten und öffnen Sie ein Arbeitsblatt. Erstellen Sie eine neue Tabelle und fügen Sie die folgenden Felder als Dimensionen hinzu:
CompanyName
ContactInfo
PhoneNumberFormat
Ergebnistabelle
CompanyName
ContactInfo
PhoneNumberFormat
Company A
(123) 456-7890
1
Company B
0123456790
3
Company C
234-567-8901
2
Company D
(024) 680-2456
1
Company E
(135) 791-3579
1
Company F
8901234567
3
Company G
235-235-2352
2
Company H
(555) (555) (5555)
0
Company I
2342342343
3
Company J
444-444-4444
2
Von hier aus könnten Sie zum Beispiel KPIs erstellen, um die Gesamtzahl der Vorkommen der einzelnen Telefonnummernformate sowie die Anzahl der Telefonnummern zu berechnen, die kein erkanntes Format haben:
Beispiele für Aggregierungsformeln zum Zählen der Vorkommen der einzelnen Formate
Beispiel 2 – Diagrammformel zur Identifizierung des ISBN-Formats
Übersicht
Öffnen Sie den Dateneditor und fügen Sie das Ladeskript unten in einen neuen Abschnitt ein.
Das Ladeskript umfasst:
Eine Tabelle Books mit den ISBN-Codes für verschiedene Bücher.
Anhand dieser Daten möchten wir feststellen, ob jeder ISBN-Code ein gültiger 10- oder 13-stelliger Code ist, basierend auf der in einem Regex-Muster angegebenen Syntax.
Ladeskript
Books:
Load * Inline [
Book
ISBN 123-3-1234-1234-0
ISBN 012-2-0123-0123-4
ISBN 000-1-0123-0123-2
ISBN 0-111-23456-7
ISBN 555-2-5555-5555-3
ISBN 222-4-2222-2222-2
ISBN 1-901-23456-8
ISBN 333-3-3333-3333-3
ISBN 555-1-5151-5151-3
ISBN 232-1-2323-2323-1
ISBN 2-444-44444-4
ISBN 888-0-9999-0000-0
];
Ergebnisse
Laden Sie die Daten und öffnen Sie ein Arbeitsblatt. Erstellen Sie eine neue Tabelle und fügen Sie dieses Feld als Dimension hinzu:
Book
Fügen Sie die folgende dynamische Dimension hinzu, und geben Sie ihr die Bezeichnung ISBN Format:
Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!