로드 스크립트 및 차트 표현식에서 정규 표현식 사용
데이터 로드 스크립트와 차트 표현식에서 정규 표현식(regex)을 사용하여 분석 및 데이터 준비를 강화합니다. 정규 표현식은 텍스트 기반 데이터를 찾고 바꾸기 위한 고급스럽고 유연하며 강력한 옵션을 제공합니다. Qlik Sense 및 스크립트 인터페이스에서 정규 표현식을 사용하려면 사용할 수 있는 스크립트 및 차트 함수를 사용합니다.
정규 표현식 사용 방법
정규 표현식(regex)은 고급 패턴 일치를 위한 광범위한 옵션을 제공합니다. 식별하려는 특정 텍스트 패턴을 지정하려면 정규 표현식을 작성합니다. 예를 들어, 자연어로 이루어진 대규모 텍스트에서 이메일 주소 또는 웹 URL이 나타나는 위치를 찾으려고 할 수 있습니다.
정규 표현식을 작성할 수 있는 다양한 형식이 있으며, 각각 고유한 구문 규칙이 있습니다. 사용할 수 있는 정규 표현식 함수는 Perl 정규 표현식 구문을 사용합니다.
Qlik Sense 및 스크립트 인터페이스에서 정규 표현식을 사용하려면 사용할 수 있는 정규 표현식 스크립트 및 차트 함수를 사용합니다. 이러한 함수를 사용하려면 정규 표현식의 작동 방식을 기본적으로 이해하고 있어야 합니다. 예를 포함한 자세한 내용은 사용할 수 있는 함수 및 예를 참조하십시오.
사용 사례
정규 표현식은 다음과 같은 경우에 사용할 수 있습니다.
-
여러 개의 고유 구성 요소가 포함된 텍스트에서 정보를 추출하고 분리합니다. 예를 들어, 이메일 주소, 전화번호, 웹 URL 등이 있습니다.
-
데이터 서식 표준화.
-
텍스트 검색 및/또는 바꾸기.
사용할 수 있는 정규식 함수를 사용하면 로드 스크립트에서 다음을 수행할 수 있습니다.
-
데이터를 변환하여 분석에 사용할 수 있도록 로드합니다.
-
데이터가 서식 및 기타 규정 표준을 따르는지 확인하기 위해 데이터의 유효성을 검사합니다.
-
분석 콘텐츠 소비자에게 적합한 형태로 PII(개인 식별 정보)를 식별하거나, 마스킹하거나, 변경합니다.
-
특정 텍스트 패턴과 일치하는지 여부에 따라 앱에 데이터를 선택적으로 로드합니다.
차트 표현식에서 정규식 함수를 사용하는 사례는 로드 스크립트와 유사합니다. 차트 표현식에서 함수를 사용하면 다음 작업도 수행할 수 있습니다.
-
사용자의 요구 사항과 상호 작용에 따라 조건부 또는 정적으로 데이터를 즉시 변환합니다.
-
함수를 사용하여 레이블, 색 설정 및 기타 차트 관련 속성을 정의합니다.
성능 고려 사항
로드 스크립트와 차트 표현식에서 사용할 수 있는 정규 표현식 함수는 유연성이 필요한 고급 문자열 변환에 가장 적합합니다. 정규식 함수를 사용하는 것은 정규식을 사용하지 않는 다른 방법보다 리소스를 많이 사용합니다. 간단한 데이터 변환의 경우 문자열 함수를 포함한 다른 사용할 수 있는 스크립트 및 차트 함수를 사용하는 것이 좋습니다. 사용할 수 있는 문자열 함수 목록은 문자열 함수를 참조하십시오.
대용량 데이터를 처리하는 경우 크거나 음수 n 값과 일치하는 항목을 검색하는 정규식 연산으로 인해 성능이 저하될 수 있습니다. 사용할 수 있는 정규식 함수의 컨텍스트에서 n 값은 occurrence, count, field_no와 같은 함수 인수에 해당합니다.