MatchRegEx Skript- und Diagrammfunktion

MatchRegEx() vergleicht einen Eingabe-String (text) mit einem oder mehreren regulären Ausdrücken (regex). Sie gibt den numerischen Ort der Muster regulärer Ausdrücke zurück, die übereinstimmen. Gibt nur eine Übereinstimmungsantwort zurück, wenn die Auswertung des regulären Ausdrucks mit der gesamten Texteingabe übereinstimmt. Wenn keine Übereinstimmungen gefunden werden, gibt die Funktion 0 zurück.

Diese Funktion führt Regex-Vorgänge durch, bei denen die Groß- und Kleinschreibung beachtet wird. Sie können alternativ die Variante MatchRegExI() verwenden, um Regex-Vorgänge ohne Berücksichtigung der Groß-/Kleinschreibung durchzuführen.

Syntax:

MatchRegEx (text, regex1 [ , regex2,...regexN])

Rückgabe Datentyp: ganze Zahl

Argumente
Argument	Beschreibung
text	Der Text des Eingabestrings, den Sie mit einem oder mehreren regulären Ausdrücken abgleichen möchten. Damit eine Übereinstimmung erfolgt, muss dieser Eingabe-String exakt mit dem regex-Muster übereinstimmen.
regex	Der reguläre Ausdruck, der mit dem Eingabestring abgeglichen werden soll. Sie können mehr als einen regulären Ausdruck in einer einzigen Formel angeben, getrennt als nachfolgende Argumente.

Funktionsbeispiele
Beispiel	Ergebnis
MatchRegEx('testSample','test')	Gibt 0 zurück. Die Funktion gibt nur dann eine Übereinstimmungsantwort zurück, wenn eine exakte Übereinstimmung zwischen text und dem regex-Muster besteht. Obwohl testSample test enthält, enthält es auch anderen Text (Sample), was eine exakte Übereinstimmung verhindert.
MatchRegEx('abc123','[a-z]','[0-9]','[a-z]+[0-9]+','.+')	Gibt 3 zurück. Das dritte Regex-Muster ist das erste, das mit den Daten übereinstimmt.
MatchRegEx('ABC','[abc]+','[123]')	Gibt 0 zurück, da MatchRegEx() zwischen Groß- und Kleinschreibung unterscheidet.
MatchRegExI('ABC','[abc]+','[123]')	Gibt 1 zurück. Die Variante der Funktion ohne Berücksichtigung von Groß- und Kleinschreibung (MatchRegExI()) wird verwendet.

Verwendung von MatchRegEx

Zu den Anwendungsfällen für diese Funktion gehören:

Validierung von Text, um Formatierungs- und Konformitätsstandards zu erfüllen und um Fehler in Daten zu erkennen.
Erkennen von Unterschieden bei der Formatierung von Text. Sie können zum Beispiel feststellen, wie viele Telefonnummern Format A, Format B usw. verwenden.

Beispiel 1 – Ladeskript zur Analyse von Telefonnummernformaten

Übersicht

Öffnen Sie den Dateneditor und fügen Sie das Ladeskript unten in einen neuen Abschnitt ein.

Das Ladeskript umfasst:

Eine Tabelle BusinessContactInfo mit Kontakttelefonnummern für verschiedene Unternehmen. Die Telefonnummern sind 10-stellige NANP-Telefonnummern.
Ein berechnetes Feld (PhoneNumberFormat), um zu beurteilen, ob die einzelnen Telefonnummern einem bestimmten Satz von Telefonnummernformaten entsprechen.

Es gibt drei verschiedene Formate, auf die wir prüfen wollen: (###) ###-####, ###-###-#### und ##########.

Ladeskript

BusinessContactInfo:

Load MatchRegEx(ContactInfo,'\({0,1}[0-9]{3}\) [0-9]{3}-[0-9]{4}', '[0-9]{3}-[0-9]{3}-[0-9]{4}', '[0-9]{10}') as PhoneNumberFormat,
* Inline `
ID	CompanyName	ContactInfo
1	Company A	(123) 456-7890
2	Company B	0123456790
3	Company C	234-567-8901
4	Company D	(024) 680-2456
5	Company E	(135) 791-3579
6	Company F	8901234567
7	Company G	235-235-2352
8	Company H	(555) (555) (5555)
9	Company I	2342342343
10	Company J	444-444-4444
` (delimiter is '\t');

Ergebnisse

Laden Sie die Daten und öffnen Sie ein Arbeitsblatt. Erstellen Sie eine neue Tabelle und fügen Sie die folgenden Felder als Dimensionen hinzu:

CompanyName
ContactInfo
PhoneNumberFormat

Ergebnistabelle
CompanyName	ContactInfo	PhoneNumberFormat
Company A	(123) 456-7890	1
Company B	0123456790	3
Company C	234-567-8901	2
Company D	(024) 680-2456	1
Company E	(135) 791-3579	1
Company F	8901234567	3
Company G	235-235-2352	2
Company H	(555) (555) (5555)	0
Company I	2342342343	3
Company J	444-444-4444	2

Von hier aus könnten Sie zum Beispiel KPIs erstellen, um die Gesamtzahl der Vorkommen der einzelnen Telefonnummernformate sowie die Anzahl der Telefonnummern zu berechnen, die kein erkanntes Format haben:

Beispiele für Aggregierungsformeln zum Zählen der Vorkommen der einzelnen Formate
Format	Anzahl der Vorkommen	Diagrammformel
(###) ###-####	3	=Count({<PhoneNumberFormat={'1'}>} PhoneNumberFormat)
###-###-####	3	=Count({<PhoneNumberFormat={'2'}>} PhoneNumberFormat)
##########	3	=Count({<PhoneNumberFormat={'3'}>} PhoneNumberFormat)
Unrecognized format	1	=Count({<PhoneNumberFormat={'0'}>} PhoneNumberFormat)

Beispiel 2 – Diagrammformel zur Identifizierung des ISBN-Formats

Übersicht

Öffnen Sie den Dateneditor und fügen Sie das Ladeskript unten in einen neuen Abschnitt ein.

Das Ladeskript umfasst:

Eine Tabelle Books mit den ISBN-Codes für verschiedene Bücher.

Anhand dieser Daten möchten wir feststellen, ob jeder ISBN-Code ein gültiger 10- oder 13-stelliger Code ist, basierend auf der in einem Regex-Muster angegebenen Syntax.

Ladeskript

Books:

Load * Inline [
Book
ISBN 123-3-1234-1234-0
ISBN 012-2-0123-0123-4
ISBN 000-1-0123-0123-2
ISBN 0-111-23456-7
ISBN 555-2-5555-5555-3
ISBN 222-4-2222-2222-2
ISBN 1-901-23456-8
ISBN 333-3-3333-3333-3
ISBN 555-1-5151-5151-3
ISBN 232-1-2323-2323-1
ISBN 2-444-44444-4
ISBN 888-0-9999-0000-0
];

Ergebnisse

Laden Sie die Daten und öffnen Sie ein Arbeitsblatt. Erstellen Sie eine neue Tabelle und fügen Sie dieses Feld als Dimension hinzu:

Book

Fügen Sie die folgende dynamische Dimension hinzu, und geben Sie ihr die Bezeichnung ISBN Format:

=if(MatchRegEx(Book, 'ISBN[ ]*([0-9]{3})-([0-9]{1})-([0-9]{4})-([0-9]{4})-([0-9]{1})', 'ISBN[ ]*([0-9]{1})-([0-9]{3})-([0-9]{5})-([0-9]{1})')=1, '13-digit', 
	if(MatchRegEx(Book, 'ISBN[ ]*([0-9]{3})-([0-9]{1})-([0-9]{4})-([0-9]{4})-([0-9]{1})', 'ISBN[ ]*([0-9]{1})-([0-9]{3})-([0-9]{5})-([0-9]{1})')=2, '10-digit',
		'Invalid ISBN'))

Ergebnistabelle
Book	ISBN Format
ISBN 000-1-0123-0123-2	13-digit
ISBN 0-111-23456-7	10-digit
ISBN 1-901-23456-8	10-digit
ISBN 2-444-44444-4	10-digit
ISBN 012-2-0123-0123-4	13-digit
ISBN 123-3-1234-1234-0	13-digit
ISBN 222-4-2222-2222-2	13-digit
ISBN 232-1-2323-2323-1	13-digit
ISBN 333-3-3333-3333-3	13-digit
ISBN 555-1-5151-5151-3	13-digit
ISBN 555-2-5555-5555-3	13-digit
ISBN 888-0-9999-0000-0	13-digit

Weitere Informationen

Arbeiten mit regulären Ausdrücken in Ladeskripten und Diagrammformeln

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!

Geben Sie hier Ihr Feedback ab