Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

ExtractRegExGroup — funkcja skryptu i funkcja wykresu

ExtractRegEx() wyodrębnia tekst z wejściowego wyrażenia ciągu przy użyciu określonego złożonego wzorca wyrażenia regularnego. Podczas korzystania z tej funkcji należy określić grupę do użycia w złożonym wyrażeniu regularnym. Funkcja zwraca wartość null, jeśli nie znaleziono żadnych dopasowań.

W przypadku użycia funkcji ExtractRegExGroup() w instrukcji LOAD i pominięcia field_no funkcja zwróci wiele rekordów. Jeśli przy użyciu funkcji ExtractRegExGroup() załadowano kilka pól, wówczas zostanie wygenerowany iloczyn kartezjański wszystkich kombinacji.

Funkcja ta wykonuje operacje z wyrażeniami regularnymi, w których rozróżniana jest wielkość liter. Zamiast tego można użyć wariantu ExtractRegExGroupI(), aby wykonywać operacje z wyrażeniami regularnymi bez rozróżniania wielkości liter.

Składnia:  

ExtractRegExGroup (text, regex, group [, field_no])

Typ zwracanych danych: ciąg znaków

Argumenty
Argument Opis
text Wyrażenie ciągu zawierające tekst, który ma zostać wyodrębniony w wartości zwracanej.
regex Wyrażenie regularne używane do wyodrębniania tekstu.
group

Numer grupy w przypadku złożonego wyrażenia regularnego.

Jeśli wyrażenie regularne zawiera tylko jedną grupę, użyj zamiast tego funkcji ExtractRegEx(). Zamiast tego można użyć ExtractRegExGroup() z wartością group równą 0.

Można określić ujemną wartość group, aby wyszukiwać dopasowania od prawej do lewej.

field_no

Numer dopasowania do wyodrębnienia. Jest to przydatne, gdy w tekście można znaleźć wiele dopasowań do wyrażenia regularnego. Na przykład określ wartość 4, aby wyodrębnić czwarte dopasowanie.

Ten argument jest opcjonalny. Domyślnie 1, jeśli nie określono.

Przykłady funkcji
Przykład Wynik
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',1) Zwraca abc (pierwsza grupa pierwszego dopasowania).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',1,2) Zwraca def (pierwsza grupa drugiego dopasowania).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',2) Zwraca 123 (druga grupa pierwszego dopasowania).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',2,2) Zwraca 456 (druga grupa drugiego dopasowania).

Kiedy używać

Możesz użyć Extract RegEx(), aby wyodrębnić informacje do wyodrębnienia z danych, które mogą również zawierać inne informacje (na przykład dowolny tekst lub ciągi JSON). Na przykład:

  • Wyodrębnij adresy e-mail, numery telefonów, numery kont i inne informacje z tekstu.

  • Wyodrębnij wartości liczbowe z tekstu (na przykład waluty).

  • Ustandaryzuj formatowanie danych tekstowych lub liczbowych.

Przykład 1 — skrypt ładowania do analizowania kodów transakcji

Przykład 2 — skrypt ładowania w celu wyodrębnienia biznesowych informacji kontaktowych

Przykład 3 — skrypt ładowania do wyodrębniania składników z kodów ISBN

Przykład 4 — wyrażenia wykresu do wyodrębniania informacji o kontaktach biznesowych (z porównaniem ExtractRegEx())

Przykład 5 — analizowanie adresów URL (z porównaniem ExtractRegEx())

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!