Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

ExtractRegEx — funkcja skryptu i funkcja wykresu

ExtractRegEx() wyodrębnia tekst z wejściowego wyrażenia ciągu przy użyciu określonego wzorca wyrażenia regularnego. Funkcja zwraca wartość null, jeśli nie znaleziono żadnych dopasowań.

Funkcja ta wykonuje operacje z wyrażeniami regularnymi, w których rozróżniana jest wielkość liter. Zamiast tego można użyć wariantu ExtractRegExI(), aby wykonywać operacje z wyrażeniami regularnymi bez rozróżniania wielkości liter.

Składnia:  

ExtractRegEx (text, regex [, field_no])

Typ zwracanych danych: ciąg znaków

Argumenty
Argument Opis
text Wyrażenie ciągu zawierające tekst, który ma zostać wyodrębniony w wartości zwracanej.
regex Wyrażenie regularne używane do wyodrębniania tekstu.
field_no

Numer dopasowania do wyodrębnienia. Jest to przydatne, gdy w tekście można znaleźć wiele dopasowań do wyrażenia regularnego. Na przykład określ wartość 4, aby wyodrębnić czwarte dopasowanie. Ten argument jest opcjonalny. Podaj wartość ujemną, aby odwrócić kolejność dopasowań.

Poniższe informacje mają zastosowanie niezależnie od tego, czy funkcja jest używana w skrypcie ładowania czy wyrażeniu wykresu:

  • Jeśli wartość field_no jest dodatnia, funkcja zwróci jedną wartość, identyfikując dopasowania od lewej do prawej.

  • Jeśli wartość field_no jest ujemna, funkcja zwróci jedną wartość, identyfikując dopasowania od lewej do prawej.

W przypadku użycia funkcji w skrypcie ładowania:

  • W przypadku użycia funkcji ExtractRegEx() w instrukcji LOAD i pominięcia field_no funkcja generuje tyle rekordów, ile jest dopasowań.

  • Jeśli przy użyciu funkcji ExtractRegEx() załadowano kilka pól i nie określono argumentu field_no, wówczas zostanie wygenerowany iloczyn kartezjański wszystkich kombinacji.

Podczas używania funkcji w wyrażeniu wykresu:

  • W przypadku pominięcia field_no wartością domyślną jest 1.

Przykłady funkcji
Przykład Wynik
ExtractRegEx('a,b c;1 2,3','[a-z]|[0-9]', 1) Zwraca a, co jest pierwszym znalezionym dopasowaniem.
ExtractRegEx('a,b c;1 2,3','[a-z]|[0-9]', 2) Zwraca b, co jest drugim znalezionym dopasowaniem.
ExtractRegEx('a,b c;1 2,3','[a-z]|[0-9]', 4) Zwraca 1, co jest czwartym znalezionym dopasowaniem.
ExtractRegEx('abc','a|b',-1) Zwraca wartość b. Gdy jest podana wartość ujemna, dopasowania są liczone w odwrotnej kolejności.
ExtractRegEx('A,B C;1 2,3','[a-c]|[4-9]') Zwraca wartość null, ponieważ ExtractRegEx() uwzględnia wielkość liter, a wariant nieuwzględniający wielkości liter nie został użyty.
ExtractRegExI('A,B C;1 2,3','[a-c]|[4-9]') Zwraca A, ponieważ użyto wariantu ExtractRegExI() nieuwzględniającego wielkości liter.

Kiedy używać

Możesz użyć Extract RegEx(), aby wyodrębnić informacje do wyodrębnienia z danych, które mogą również zawierać inne informacje (na przykład dowolny tekst lub ciągi JSON). Na przykład:

  • Wyodrębnij adresy e-mail, numery telefonów, numery kont i inne informacje z tekstu.

  • Wyodrębnij wartości liczbowe z tekstu (na przykład waluty).

  • Ustandaryzuj formatowanie danych tekstowych lub liczbowych.

Przykład 1 — skrypt ładowania do wyodrębniania adresów e-mail z JSON

Przykład 2 — skrypt ładowania do wyodrębniania wartości liczbowych z kwot w walucie

Przykład 3 — wyrażenia wykresu do wyodrębniania adresów e-mail z JSON

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!