Praca z wyrażeniami regularnymi w skryptach ładowania i wyrażeniach wykresu
Rozszerz swoje analizy i przygotowanie danych, używając wyrażeń regularnych (regex) w skryptach ładowania danych i w wyrażeniach wykresu. Wyrażenia regularne oferują zaawansowane, elastyczne i potężne opcje wyszukiwania i zastępowania danych tekstowych. Aby pracować z wyrażeniami regularnymi w Qlik Sense i interfejsie Skrypt, użyj dostępnych funkcji skryptu i wykresu.
Jak pracować z wyrażeniami regularnymi
Wyrażenia regularne (regex) oferują szerokie możliwości zaawansowanego dopasowywania wzorców. Napisz wyrażenie regularne, aby określić konkretny wzorzec tekstu, który chcesz zidentyfikować. Na przykład możesz chcieć znaleźć wystąpienia adresów e-mail lub adresów URL w większych fragmentach języka naturalnego.
Istnieje wiele różnych formatów, w których można zapisywać wyrażenia regularne, a każdy z nich ma własne reguły składni. Dostępne funkcje wyrażeń regularnych używają składni wyrażeń regularnych języka Perl.
Aby pracować z wyrażeniami regularnymi w Qlik Sense i interfejsie Skrypt, użyj dostępnych funkcji skryptu i wykresu regex. Korzystanie z tych funkcji zakłada podstawową wiedzę na temat działania wyrażeń regularnych. Więcej informacji, w tym przykłady, zawiera sekcja Dostępne funkcje i przykłady.
Przypadki użycia
Wyrażeń regularnych można używać do:
-
Wyodrębniania i oddzielania informacji z tekstu zawierającego wiele różnych składników. Na przykład adresów e-mail, numerów telefonów, adresów URL i innych.
-
Standaryzacji formatowania danych.
-
Wyszukiwania i/lub zastępowania tekstu.
Dzięki dostępnym funkcjom regex w skryptach ładowania można wykonywać następujące czynności:
-
Transformować dane i ładować je do wykorzystania w analizach.
-
Weryfikować dane, aby upewnić się, że są zgodne z formatowaniem i innymi standardami zgodności.
-
Identyfikować, maskować lub zmieniać dane osobowe (PII) w formę odpowiednią dla odbiorców treści analitycznych.
-
Selektywnie ładować dane do aplikacji w zależności od tego, czy pasują do określonych wzorców tekstowych.
Przypadki użycia funkcji regex w wyrażeniach wykresu są podobne do tych dla skryptów ładowania. Użycie tych funkcji w wyrażeniach wykresu pozwala również na:
-
Transformować dane w locie, warunkowo lub statycznie, w zależności od potrzeb i interakcji użytkownika.
-
Używać funkcji do definiowania etykiet, ustawień kolorów i innych właściwości specyficznych dla wykresu.
Kwestie dotyczące wydajności
Funkcje wyrażeń regularnych dostępne w skryptach ładowania i wyrażeniach wykresu najlepiej sprawdzają się w zaawansowanych transformacjach ciągów znaków, gdzie wymagana jest elastyczność. Używanie funkcji regex jest bardziej zasobochłonne niż alternatywy bez użycia regex. W przypadku prostszych transformacji danych rozważ użycie innych dostępnych funkcji skryptu i wykresu, w tym funkcji ciągów znaków. Listę dostępnych funkcji ciągów znaków można znaleźć w sekcji Funkcje ciągów znaków.
Podczas pracy z dużymi wolumenami danych operacje regex polegające na wyszukiwaniu dopasowań dużych lub ujemnych wartości n mogą powodować spadek wydajności. W kontekście dostępnych funkcji regex wartość n odpowiada argumentom funkcji, takim jak occurrence, count i field_no.