기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

ExtractRegExGroup - 스크립트 및 차트 함수

ExtractRegExGroup()은 지정된 복합 정규 표현식 패턴을 사용하여 입력 문자열 표현식에서 텍스트를 추출합니다. 함수를 사용할 때, 복합 정규식 내에서 사용할 그룹을 지정합니다. 일치하는 항목이 없으면 함수는 null 값을 반환합니다.

LOAD 문에서 ExtractRegExGroup() 함수를 사용하고 field_no를 생략하면 함수는 여러 레코드를 반환합니다. ExtractRegExGroup()을 사용하여 여러 필드를 로드하는 경우 모든 조합의 데카르트 곱이 만들어집니다.

이 함수는 대/소문자를 구분하는 정규식 연산을 수행합니다. 또는 ExtractRegExGroupI() 변형을 사용하여 대/소문자를 구분하지 않는 정규식 작업을 수행할 수 있습니다.

구문:  

ExtractRegExGroup (text, regex, group [, field_no])

반환 데이터 유형: 문자열

인수
인수 설명
text 반환 값에서 추출할 텍스트를 포함하는 문자열 표현식.
regex 텍스트를 추출하는 데 사용하는 정규 표현식.
group

합성 정규 표현식의 경우 그룹의 번호.

정규 표현식에 그룹이 하나만 포함되어 있는 경우 대신 ExtractRegEx() 함수를 사용합니다. 또는 group 값을 0으로 ExtractRegExGroup()을 사용합니다.

오른쪽에서 왼쪽으로 일치 항목을 검색하려면 음수 group 값을 지정할 수 있습니다.

field_no

추출할 일치 항목의 번호. 이 기능은 정규 표현식과 일치하는 항목이 텍스트에서 여러 개 발견될 때 유용합니다. 예를 들어, 네 번째 일치 항목을 추출하려면 4 값을 지정합니다.

이는 선택적인 인수입니다. 지정하지 않으면 기본값은 1입니다.

함수 예
결과
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',1) abc를 반환합니다(첫 번째 일치 항목의 첫 번째 그룹).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',1,2) def를 반환합니다(두 번째 일치 항목의 첫 번째 그룹).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',2) 123을 반환합니다(첫 번째 일치 항목의 두 번째 그룹).
ExtractRegExGroup('abc123 def456','([a-z]+)([0-9]+)',2,2) 456을 반환합니다(두 번째 일치 항목의 두 번째 그룹).

사용 시기

Extract RegEx()를 사용하면 다른 정보(예: 무료 문자 또는 JSON 문자열)를 포함할 수 있는 데이터에서 격리하려는 정보를 추출할 수 있습니다. 예:

  • 텍스트에서 이메일 주소, 전화번호, 계좌 번호 및 기타 정보를 추출합니다.

  • 텍스트에서 숫자 값을 추출합니다(예: 통화).

  • 텍스트나 숫자형 데이터의 서식을 표준화합니다.

예 1 – 트랜잭션 코드를 구문 분석하기 위한 스크립트 로드

예 2 – 비즈니스 연락처 정보를 추출하기 위한 스크립트 로드

예 3 – ISBN 코드에서 구성 요소를 추출하는 스크립트 로드

예 4 – 비즈니스 연락처 정보 추출을 위한 차트 표현식(ExtractRegEx() 비교 포함)

예 5 – URL 구문 분석(ExtractRegEx() 비교 포함)

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!