Qlik Talend Cloud 시작 구독을 사용하여 데이터 복제

작업 설정 마법사를 사용하면 몇 번의 클릭만으로 쉽게 복제 작업을 설정할 수 있습니다.

마법사에 표시되는 설정은 선택한 대상 유형을 반영합니다. 예를 들어, Amazon S3과 같은 저장소 대상에 복제하는 경우 저장소 위치를 묻는 메시지가 표시됩니다. 그러나 스테이징 영역이 필요한 Amazon Redshift와 같은 대상에 복제하는 경우 스테이징 영역을 정의하거나 선택하라는 메시지가 표시됩니다.

다음 표는 의도한 대상에 따라 이 항목을 탐색하는 데 도움이 될 것입니다.

스테이징 없이 데이터베이스 및 데이터 웨어하우스에 복제

준비가 필요하지 않은 데이터베이스 또는 데이터 웨어하우스에 대한 복제 작업을 다음과 같이 설정합니다.

Google BigQuery
Snowflake

스테이징을 통해 데이터 웨어하우스에 복제

준비가 필요한 데이터 웨어하우스에 대한 복제 작업을 다음과 같이 설정합니다.

Amazon Redshift
Microsoft Fabric
Databricks

클라우드 저장소에 복제

클라우드 저장소에 대한 복제 작업을 설정합니다.

스테이징 없이 데이터베이스 및 데이터 웨어하우스에 복제

이 섹션에서는 별도의 스테이징 영역이 필요하지 않은 데이터베이스 및 데이터 웨어하우스에 대한 복제 작업을 설정하는 방법을 설명합니다.

수행할 작업:

데이터 통합 > 홈에서 데이터 복제를 클릭합니다.

데이터 복제 마법사가 열립니다.
일반 탭에서 다음을 수행합니다.
- 작업 이름
  
  작업 이름을 지정합니다.
- 설명
  
  선택적으로 작업에 대한 설명을 입력합니다.
- 프로젝트
  
  다음 중 하나를 수행합니다.
  - 기존 프로젝트 선택
  - 새 프로젝트의 이름을 지정한 다음 프로젝트 필드 아래에 있는 새 프로젝트 추가: <프로젝트 이름>을 클릭합니다.
    
    프로젝트 이름이 프로젝트 필드에 추가됩니다.
- 공간
  
  복제 프로젝트를 위한 데이터 공간을 선택합니다. 데이터 공간을 만들지 않은 경우 다음 중 하나를 수행합니다.
  - Data-Space(기본 테넌트 데이터 공간)를 선택합니다.
    
    정보 메모Data-Space는 모든 구성원에 대해 모든 권한을 갖습니다. 데이터 공간 역할 및 권한에 설명된 대로 나중에 각 구성원의 역할과 권한을 편집할 수 있습니다.
  - 마법사를 취소하고 데이터 공간 만들기에 설명된 대로 고유한 데이터 공간을 만든 다음 마법사를 다시 실행합니다.
  데이터 공간에 대한 자세한 내용은 Qlik Talend Data Integration의 공간에서 작업을 참조하십시오.
다음을 클릭합니다. 소스 연결 선택 탭에서 소스 데이터에 대한 연결을 선택합니다. 선택적으로 작업 열의 메뉴에서 편집을 선택하여 연결 설정을 편집할 수 있습니다.

아직 데이터 소스에 대한 연결을 만들지 않은 경우 탭 오른쪽 위에 있는 연결 만들기를 클릭하여 연결을 만들어야 합니다.

왼쪽의 필터를 사용하여 연결 목록을 필터링할 수 있습니다. 소스 유형, 게이트웨이, 공간 및 소유자에 따라 연결을 필터링할 수 있습니다. 연결 목록 위의 모든 필터 버튼은 현재 필터의 수를 표시합니다. 이 버튼을 사용하여 왼쪽의 필터 패널을 닫거나 열 수 있습니다. 현재 활성 필터도 사용할 수 있는 연결 목록 위에 표시됩니다.

오른쪽 드롭다운 목록에서 마지막으로 수정한 날짜, 마지막으로 만든 날짜, 또는 사전순을 선택하여 목록을 정렬할 수도 있습니다. 정렬 순서를 변경하려면 목록 오른쪽에 있는 화살표를 클릭합니다.

데이터 소스 연결을 선택한 후 선택적으로 탭 오른쪽 위에 있는 연결 테스트를 클릭하고(권장), 다음을 클릭합니다.
데이터 집합 선택 탭에서 복제 작업에 포함할 테이블 및/또는 뷰를 선택합니다. 또한 데이터베이스에서 데이터 선택에 설명된 대로 와일드카드를 사용하고 선택 규칙을 만들 수도 있습니다.
대상 연결 선택 탭의 사용할 수 있는 연결 목록에서 대상을 선택한 후 다음을 클릭합니다. 기능적인 측면에서는 앞서 설명한 소스 연결 선택 탭과 동일합니다.
설정 탭에서 선택적으로 다음 설정을 변경한 후 다음을 클릭합니다.

복제 모드

정보 메모SaaS 응용 프로그램 소스에서 복제할 때 전체 로드 복제 모드는 기본적으로 활성화되며 비활성화할 수 없습니다.
- 전체 로드: 선택한 소스 테이블의 데이터를 대상 플랫폼으로 로드하고 필요한 경우 대상 테이블을 만듭니다. 전체 로드는 작업이 시작될 때 자동으로 발생하지만 필요한 경우 수동으로 수행할 수도 있습니다.
  
  정보 메모SaaS 응용 프로그램 미리 보기 커넥터를 사용하는 경우 이 설정을 사용할 수 없습니다. 미리 보기 커넥터는 연결 만들기 대화 상자와 온라인 도움말 모두에서 버튼으로 표시됩니다.
- 변경 내용 적용: 소스 테이블에 대한 변경 내용으로 대상 테이블을 최신 상태로 유지합니다.
- 변경 내용 저장: 변경 테이블(소스 테이블당 하나)에 소스 테이블에 대한 변경 내용을 저장합니다.
  
  자세한 내용은 변경 내용 저장을 참조하십시오.
데이터 변경 내용 캡처 빈도는 스케줄러 설정에 따라 결정됩니다. 기본 변경 내용 캡처 간격은 6시간입니다. 자세한 내용은 데이터 복제 작업 설정을 참조하십시오.

사용자 지정 스키마
- 대상 데이터 집합 스키마: 선택적으로 대상에서 데이터 집합을 만들 스키마를 선택합니다.
- 제어 테이블 스키마: 선택적으로 대상에서 제어 테이블을 만들 스키마를 선택합니다.
복제 스케줄러
- 데이터 복제 간격: 데이터 소스의 변경 내용을 캡처하는 빈도를 예약하고 시작 시간 및 시작 날짜를 설정할 수 있습니다. 소스 데이터 집합이 CDC(Change data Capture)를 지원하는 경우 소스 데이터의 변경 내용만 해당 대상 테이블에 복제되고 적용됩니다. 소스 데이터 집합이 CDC(예: 뷰)를 지원하지 않는 경우 모든 소스 데이터를 해당 대상 테이블에 다시 로드하여 변경 내용이 적용됩니다. 소스 데이터 집합 중 일부가 CDC를 지원하고 일부는 지원하지 않는 경우 두 개의 별도 하위 작업이 만들어집니다( 변경 내용 적용 또는 변경 내용 저장 복제 옵션이 선택되었다고 가정). 하나는 CDC를 지원하지 않는 데이터 집합을 다시 로드하기 위한 것이고, 다른 하나는 CDC를 지원하는 데이터 집합에 대한 변경 내용을 캡처하기 위한 것입니다.
  
  작업 설정 마법사를 사용하면 시간별 간격을 예약할 수 있습니다. 작업 설정을 완료한 후에는 데이터 복제 작업 설정에 설명된 대로 다양한 예약 옵션을 탐색할 수 있습니다.
데이터 소스 유형 및 구독 계층에 따른 최소 예약 간격에 대한 자세한 내용은 허용되는 최소 예약 간격을 참조하십시오.

데이터 복제 작업 설정에 설명된 대로 나중에 설정을 변경할 수 있습니다.
요약 탭에는 데이터 파이프라인이 시각적으로 표시됩니다. 다음 파이프라인이 만들어진 후 작업 중 하나를 선택합니다.
- <이름> 프로젝트 열기(기본값)
- <이름> 데이터 작업 열기
  
  정보 메모선택한 데이터 집합 중 일부가 CDC를 지원하지 않는 경우 두 개의 파이프라인이 표시됩니다. 하나는 CDC 작업용이고 다른 하나는 다시 로드 작업용입니다.
그런 다음 만들기 및 실행(기본값) 또는 만들기를 클릭하여 작업을 실행하지 않고 만듭니다.

만들기 및 실행을 클릭하면 작업이 만들어지고 실행이 시작됩니다(몇 분 정도 걸릴 수 있음).
만들기를 클릭하면 이전에 선택한 파이프라인이 만들어진 후 작업에 따라 다음 중 하나가 발생합니다.
- 프로젝트가 열리고 새로 만들어진 작업이 표시됩니다.
- 작업이 데이터 집합 탭에서 열립니다. 데이터 집합 탭에는 선택한 소스 테이블의 구조와 메타데이터가 표시됩니다. 여기에는 명시적으로 나열된 모든 테이블과 선택 규칙과 일치하는 테이블이 포함됩니다.
  
  데이터 소스에서 더 많은 테이블을 추가하려면 소스 데이터 선택을 클릭합니다.
데이터 집합에서 변환을 수행하거나 데이터를 필터링하거나 열을 추가할 수 있습니다.

자세한 내용은 데이터 집합 관리을 참조하십시오.
원하는 변환을 추가했으면 데이터 집합 유효성 검사를 클릭하여 데이터 집합의 유효성을 검사할 수 있습니다. 유효성 검사에 실패하면 계속 진행하기 전에 오류를 해결합니다.

자세한 내용은 데이터 집합 유효성 검사 및 조정을 참조하십시오.
준비가 되면 준비 및 실행을 클릭하여 데이터 작업을 준비하고 실행합니다.

작업 복구 및 기타 작업 실행 방법에 대한 자세한 내용은 고급 실행 옵션을 참조하십시오.
이제 복제 작업이 시작되고 모니터링에서 진행률을 볼 수 있습니다. 자세한 내용은 개별 데이터 작업 모니터링를 참조하십시오.

스테이징을 통해 데이터 웨어하우스에 복제

이 섹션에서는 별도의 스테이징 영역이 필요한 데이터 웨어하우스에 복제 작업을 설정하는 방법을 설명합니다.

수행할 작업:

데이터 통합> 홈에서 데이터 복제를 클릭합니다.

데이터 복제 마법사가 열립니다.
일반 탭에서 다음을 수행합니다.
- 작업 이름
  
  작업 이름을 지정합니다.
- 설명
  
  선택적으로 작업에 대한 설명을 입력합니다.
- 프로젝트
  
  다음 중 하나를 수행합니다.
  - 기존 프로젝트 선택
  - 새 프로젝트의 이름을 지정한 다음 프로젝트 필드 아래에 있는 새 프로젝트 추가: <프로젝트 이름>을 클릭합니다.
    
    프로젝트 이름이 프로젝트 필드에 추가됩니다.
- 공간
  
  복제 프로젝트를 위한 데이터 공간을 선택합니다. 데이터 공간을 만들지 않은 경우 다음 중 하나를 수행합니다.
  - Data-Space(기본 테넌트 데이터 공간)를 선택합니다.
    
    정보 메모Data-Space는 모든 구성원에 대해 모든 권한을 갖습니다. 데이터 공간 역할 및 권한에 설명된 대로 나중에 각 구성원의 역할과 권한을 편집할 수 있습니다.
  - 마법사를 취소하고 데이터 공간 만들기에 설명된 대로 고유한 데이터 공간을 만든 다음 마법사를 다시 실행합니다.
  데이터 공간에 대한 자세한 내용은 Qlik Talend Data Integration의 공간에서 작업을 참조하십시오.
다음을 클릭합니다. 소스 연결 선택 탭에서 소스 데이터에 대한 연결을 선택합니다. 선택적으로 작업 열의 메뉴에서 편집을 선택하여 연결 설정을 편집할 수 있습니다.

아직 데이터 소스에 대한 연결을 만들지 않은 경우 탭 오른쪽 위에 있는 연결 만들기를 클릭하여 연결을 만들어야 합니다.

왼쪽의 필터를 사용하여 연결 목록을 필터링할 수 있습니다. 소스 유형, 게이트웨이, 공간 및 소유자에 따라 연결을 필터링할 수 있습니다. 연결 목록 위의 모든 필터 버튼은 현재 필터의 수를 표시합니다. 이 버튼을 사용하여 왼쪽의 필터 패널을 닫거나 열 수 있습니다. 현재 활성 필터도 사용할 수 있는 연결 목록 위에 표시됩니다.

오른쪽 드롭다운 목록에서 마지막으로 수정한 날짜, 마지막으로 만든 날짜, 또는 사전순을 선택하여 목록을 정렬할 수도 있습니다. 정렬 순서를 변경하려면 목록 오른쪽에 있는 화살표를 클릭합니다.

데이터 소스 연결을 선택한 후 선택적으로 탭 오른쪽 위에 있는 연결 테스트를 클릭하고(권장), 다음을 클릭합니다.
데이터 집합 선택 탭에서 복제 작업에 포함할 테이블 및/또는 뷰를 선택합니다. 또한 데이터베이스에서 데이터 선택에 설명된 대로 와일드카드를 사용하고 선택 규칙을 만들 수도 있습니다.
대상 연결 선택 탭의 사용할 수 있는 연결 목록에서 대상을 선택한 후 다음을 클릭합니다. 기능적인 측면에서는 앞서 설명한 소스 연결 선택 탭과 동일합니다.
설정 탭에서 선택적으로 다음 설정을 변경한 후 다음을 클릭합니다.

복제 모드

정보 메모SaaS 응용 프로그램 소스에서 복제할 때 전체 로드 복제 모드는 기본적으로 활성화되며 비활성화할 수 없습니다.
- 전체 로드: 선택한 소스 테이블의 데이터를 대상 플랫폼으로 로드하고 필요한 경우 대상 테이블을 만듭니다. 전체 로드는 작업이 시작될 때 자동으로 발생하지만 필요한 경우 수동으로 수행할 수도 있습니다.
  
  정보 메모SaaS 응용 프로그램 미리 보기 커넥터를 사용하는 경우 이 설정을 사용할 수 없습니다. 미리 보기 커넥터는 연결 만들기 대화 상자와 온라인 도움말 모두에서 버튼으로 표시됩니다.
- 변경 내용 적용: 소스 테이블에 대한 변경 내용으로 대상 테이블을 최신 상태로 유지합니다.
- 변경 내용 저장: 변경 테이블(소스 테이블당 하나)에 소스 테이블에 대한 변경 내용을 저장합니다.
  
  자세한 내용은 변경 내용 저장을 참조하십시오.
데이터 변경 내용 캡처 빈도는 스케줄러 설정에 따라 결정됩니다. 기본 변경 내용 캡처 간격은 6시간입니다. 자세한 내용은 데이터 복제 작업 설정을 참조하십시오.

스테이징 영역에 연결

아래 나열된 데이터 웨어하우스에 복제하는 경우 스테이징 영역을 설정해야 합니다. 데이터는 웨어하우스로 전송되기 전에 스테이징 영역에서 처리 및 준비됩니다.
기존 스테이징 영역을 선택하거나 새로 만들기를 클릭하여 새 스테이징 영역을 정의하고 클라우드 저장소에 연결 중의 지침을 따르십시오.

연결 설정을 편집하려면 편집을 클릭합니다. 연결을 테스트하려면(권장) 연결 테스트를 클릭합니다.

어떤 데이터 웨어하우스에서 어떤 스테이징 영역이 지원되는지에 대한 자세한 내용은 대상 플랫폼 사용 사례 및 지원되는 버전의 스테이징 영역으로 지원됨 열을 참조하십시오.

사용자 지정 스키마
- 대상 데이터 집합 스키마: 선택적으로 대상에서 데이터 집합을 만들 스키마를 선택합니다.
- 제어 테이블 스키마: 선택적으로 대상에서 제어 테이블을 만들 스키마를 선택합니다.
복제 스케줄러
- 데이터 복제 간격: 데이터 소스의 변경 내용을 캡처하는 빈도를 예약하고 시작 시간 및 시작 날짜를 설정할 수 있습니다. 소스 데이터 집합이 CDC(Change data Capture)를 지원하는 경우 소스 데이터의 변경 내용만 해당 대상 테이블에 복제되고 적용됩니다. 소스 데이터 집합이 CDC(예: 뷰)를 지원하지 않는 경우 모든 소스 데이터를 해당 대상 테이블에 다시 로드하여 변경 내용이 적용됩니다. 소스 데이터 집합 중 일부가 CDC를 지원하고 일부는 지원하지 않는 경우 두 개의 별도 하위 작업이 만들어집니다( 변경 내용 적용 또는 변경 내용 저장 복제 옵션이 선택되었다고 가정). 하나는 CDC를 지원하지 않는 데이터 집합을 다시 로드하기 위한 것이고, 다른 하나는 CDC를 지원하는 데이터 집합에 대한 변경 내용을 캡처하기 위한 것입니다.
  
  작업 설정 마법사를 사용하면 시간별 간격을 예약할 수 있습니다. 작업 설정을 완료한 후에는 데이터 복제 작업 설정에 설명된 대로 다양한 예약 옵션을 탐색할 수 있습니다.
데이터 복제 작업 설정에 설명된 대로 나중에 설정을 변경할 수 있습니다.
요약 탭에는 데이터 파이프라인이 시각적으로 표시됩니다. 다음 파이프라인이 만들어진 후 작업 중 하나를 선택합니다.
- <이름> 프로젝트 열기(기본값)
- <이름> 데이터 작업 열기
  
  정보 메모선택한 데이터 집합 중 일부가 CDC를 지원하지 않는 경우 두 개의 파이프라인이 표시됩니다. 하나는 CDC 작업용이고 다른 하나는 다시 로드 작업용입니다.
그런 다음 만들기 및 실행(기본값) 또는 만들기를 클릭하여 작업을 실행하지 않고 만듭니다.

만들기 및 실행을 클릭하면 작업이 만들어지고 실행이 시작됩니다(몇 분 정도 걸릴 수 있음).
만들기를 클릭하면 이전에 선택한 파이프라인이 만들어진 후 작업에 따라 다음 중 하나가 발생합니다.
- 프로젝트가 열리고 새로 만들어진 작업이 표시됩니다.
- 작업이 데이터 집합 탭에서 열립니다. 데이터 집합 탭에는 선택한 소스 테이블의 구조와 메타데이터가 표시됩니다. 여기에는 명시적으로 나열된 모든 테이블과 선택 규칙과 일치하는 테이블이 포함됩니다.
  
  데이터 소스에서 더 많은 테이블을 추가하려면 소스 데이터 선택을 클릭합니다.
데이터 집합에서 변환을 수행하거나 데이터를 필터링하거나 열을 추가할 수 있습니다.

자세한 내용은 데이터 집합 관리을 참조하십시오.
원하는 변환을 추가했으면 데이터 집합 유효성 검사를 클릭하여 데이터 집합의 유효성을 검사할 수 있습니다. 유효성 검사에 실패하면 계속 진행하기 전에 오류를 해결합니다.

자세한 내용은 데이터 집합 유효성 검사 및 조정을 참조하십시오.
준비가 되면 준비 및 실행을 클릭하여 데이터 작업을 준비하고 실행합니다.

작업 복구 및 기타 작업 실행 방법에 대한 자세한 내용은 고급 실행 옵션을 참조하십시오.
이제 복제 작업이 시작되고 모니터링에서 진행률을 볼 수 있습니다. 자세한 내용은 개별 데이터 작업 모니터링를 참조하십시오.

클라우드 저장소에 복제

이 섹션에서는 클라우드 저장소에 대한 복제 작업을 설정하는 방법을 설명합니다.

수행할 작업:

데이터 통합> 홈에서 데이터 복제를 클릭합니다.

데이터 복제 마법사가 열립니다.
일반 탭에서 다음을 수행합니다.
- 작업 이름
  
  작업 이름을 지정합니다.
- 설명
  
  선택적으로 작업에 대한 설명을 입력합니다.
- 프로젝트
  
  다음 중 하나를 수행합니다.
  - 기존 프로젝트 선택
  - 새 프로젝트의 이름을 지정한 다음 프로젝트 필드 아래에 있는 새 프로젝트 추가: <프로젝트 이름>을 클릭합니다.
    
    프로젝트 이름이 프로젝트 필드에 추가됩니다.
- 공간
  
  복제 프로젝트를 위한 데이터 공간을 선택합니다. 데이터 공간을 만들지 않은 경우 다음 중 하나를 수행합니다.
  - Data-Space(기본 테넌트 데이터 공간)를 선택합니다.
    
    정보 메모Data-Space는 모든 구성원에 대해 모든 권한을 갖습니다. 데이터 공간 역할 및 권한에 설명된 대로 나중에 각 구성원의 역할과 권한을 편집할 수 있습니다.
  - 마법사를 취소하고 데이터 공간 만들기에 설명된 대로 고유한 데이터 공간을 만든 다음 마법사를 다시 실행합니다.
  데이터 공간에 대한 자세한 내용은 Qlik Talend Data Integration의 공간에서 작업을 참조하십시오.
다음을 클릭합니다. 소스 연결 선택 탭에서 소스 데이터에 대한 연결을 선택합니다. 선택적으로 작업 열의 메뉴에서 편집을 선택하여 연결 설정을 편집할 수 있습니다.

아직 데이터 소스에 대한 연결을 만들지 않은 경우 탭 오른쪽 위에 있는 연결 만들기를 클릭하여 연결을 만들어야 합니다.

왼쪽의 필터를 사용하여 연결 목록을 필터링할 수 있습니다. 소스 유형, 게이트웨이, 공간 및 소유자에 따라 연결을 필터링할 수 있습니다. 연결 목록 위의 모든 필터 버튼은 현재 필터의 수를 표시합니다. 이 버튼을 사용하여 왼쪽의 필터 패널을 닫거나 열 수 있습니다. 현재 활성 필터도 사용할 수 있는 연결 목록 위에 표시됩니다.

오른쪽 드롭다운 목록에서 마지막으로 수정한 날짜, 마지막으로 만든 날짜, 또는 사전순을 선택하여 목록을 정렬할 수도 있습니다. 정렬 순서를 변경하려면 목록 오른쪽에 있는 화살표를 클릭합니다.

데이터 소스 연결을 선택한 후 선택적으로 탭 오른쪽 위에 있는 연결 테스트를 클릭하고(권장), 다음을 클릭합니다.
데이터 집합 선택 탭에서 복제 작업에 포함할 테이블 및/또는 뷰를 선택합니다. 또한 데이터베이스에서 데이터 선택에 설명된 대로 와일드카드를 사용하고 선택 규칙을 만들 수도 있습니다.
대상 연결 선택 탭의 사용할 수 있는 연결 목록에서 대상을 선택한 후 다음을 클릭합니다. 기능적인 측면에서는 앞서 설명한 소스 연결 선택 탭과 동일합니다.
설정 탭에서 선택적으로 다음 설정을 변경한 후 다음을 클릭합니다.

업데이트 방법
- 데이터 변경 내용 캡처(CDC): 데이터 레이크 랜딩 작업은 전체 로드로 시작됩니다(선택한 모든 테이블이 랜딩되는 동안). 랜딩된 데이터는 CDC(데이터 변경 내용 캡처) 기술을 사용하여 최신 상태로 유지됩니다.
  
  정보 메모DDL 작업의 CDC(데이터 변경 내용 캡처)는 지원되지 않습니다.
  
  데이터 변경 내용 캡처 빈도는 스케줄러 설정에 따라 결정됩니다. 기본 변경 내용 캡처 간격은 6시간입니다. 자세한 내용은 데이터 복제 작업 설정을 참조하십시오.
- 다시 로드: 선택한 소스 테이블의 데이터를 대상 플랫폼으로 전체 로드하고 필요한 경우 대상 테이블을 만듭니다. 전체 로드는 작업이 시작될 때 자동으로 발생하지만 수동으로 수행하거나 필요에 따라 주기적으로 발생하도록 예약할 수도 있습니다.
  
  정보 메모SaaS 응용 프로그램 미리 보기 커넥터를 사용하는 경우 이 설정을 사용할 수 없습니다. 미리 보기 커넥터는 연결 만들기 대화 상자와 온라인 도움말 모두에서 버튼으로 표시됩니다.
데이터 변경 내용 캡처(CDC)를 선택하고 데이터에 CDC를 지원하지 않는 테이블이나 뷰도 포함되어 있는 경우 두 개의 데이터 파이프라인이 만들어집니다. CDC를 지원하는 모든 테이블이 포함된 하나의 파이프라인과 다시 로드를 사용하는 다른 모든 테이블 및 뷰가 포함된 또 다른 파이프라인입니다.

사용할 폴더

파일을 쓰려는 버킷 폴더에 따라 다음 중 하나를 선택합니다.
- 기본 폴더: 기본 폴더 형식은 <프로젝트 이름>/<작업 이름>입니다.
- 루트 폴더: 파일을 버킷에 직접 기록합니다.
- 폴더: 폴더 이름을 입력합니다. 폴더가 없는 경우 데이터 레이크 랜딩 작업 중에 폴더가 만들어집니다.
  
  정보 메모 폴더 이름에는 특수 문자(예: @, #, ! 등)를 포함할 수 없습니다.
복제 스케줄러
- 데이터 복제 간격: 데이터 소스의 변경 내용을 캡처하는 빈도를 예약하고 시작 시간 및 시작 날짜를 설정할 수 있습니다. 소스 데이터 집합이 CDC(Change data Capture)를 지원하는 경우 소스 데이터의 변경 내용만 해당 대상 테이블에 복제되고 적용됩니다. 소스 데이터 집합이 CDC(예: 뷰)를 지원하지 않는 경우 모든 소스 데이터를 해당 대상 테이블에 다시 로드하여 변경 내용이 적용됩니다. 소스 데이터 집합 중 일부가 CDC를 지원하고 일부는 지원하지 않는 경우 두 개의 별도 하위 작업이 만들어집니다(CDC(데이터 변경 내용 캡처) 업데이트 방법이 이 선택되었다고 가정). 하나는 CDC를 지원하지 않는 데이터 집합을 다시 로드하기 위한 것이고, 다른 하나는 CDC를 지원하는 데이터 집합에 대한 변경 내용을 캡처하기 위한 것입니다.
  
  작업 설정 마법사를 사용하면 시간별 간격을 예약할 수 있습니다. 작업 설정을 완료한 후에는 클라우드 저장소 대상 설정에 설명된 대로 다양한 예약 옵션을 탐색할 수 있습니다.
나중에 클라우드 저장소 대상 설정에 설명된 대로 작업 설정을 변경할 수 있습니다.
요약 탭에는 데이터 파이프라인이 시각적으로 표시됩니다. 다음 파이프라인이 만들어진 후 작업 중 하나를 선택합니다.
- <이름> 프로젝트 열기(기본값)
- <이름> 데이터 작업 열기
  
  정보 메모선택한 데이터 집합 중 일부가 CDC를 지원하지 않는 경우 두 개의 파이프라인이 표시됩니다. 하나는 CDC 작업용이고 다른 하나는 다시 로드 작업용입니다.
그런 다음 만들기 및 실행(기본값) 또는 만들기를 클릭하여 작업을 실행하지 않고 만듭니다.

만들기 및 실행을 클릭하면 작업이 만들어지고 실행이 시작됩니다(몇 분 정도 걸릴 수 있음).
만들기를 클릭하면 이전에 선택한 파이프라인이 만들어진 후 작업에 따라 다음 중 하나가 발생합니다.
- 프로젝트가 열리고 새로 만들어진 작업이 표시됩니다.
- 작업이 데이터 집합 탭에서 열립니다. 데이터 집합 탭에는 선택한 소스 테이블의 구조와 메타데이터가 표시됩니다. 여기에는 명시적으로 나열된 모든 테이블과 선택 규칙과 일치하는 테이블이 포함됩니다.
  
  데이터 소스에서 더 많은 테이블을 추가하려면 소스 데이터 선택을 클릭합니다.
데이터 집합에서 변환을 수행하거나 데이터를 필터링하거나 열을 추가할 수 있습니다.

자세한 내용은 데이터 집합 관리을 참조하십시오.
원하는 변환을 추가했으면 데이터 집합 유효성 검사를 클릭하여 데이터 집합의 유효성을 검사할 수 있습니다. 유효성 검사에 실패하면 계속 진행하기 전에 오류를 해결합니다.

자세한 내용은 데이터 집합 유효성 검사 및 조정을 참조하십시오.
준비가 되면 준비 및 실행을 클릭하여 데이터 작업을 준비하고 실행합니다.

작업 복구 및 기타 작업 실행 방법에 대한 자세한 내용은 고급 실행 옵션을 참조하십시오.
이제 복제 작업이 시작되고 모니터링에서 진행률을 볼 수 있습니다. 자세한 내용은 개별 데이터 작업 모니터링를 참조하십시오.

데이터 집합의 로드 우선 순위 설정

각 데이터 집합에 로드 우선 순위를 할당하여 데이터 작업에서 데이터 집합의 로드 순서를 제어할 수 있습니다. 예를 들어, 큰 데이터 집합보다 작은 데이터 집합을 로드하려는 경우에 유용할 수 있습니다.

로드 우선 순위를 클릭합니다.
각 데이터 집합의 로드 우선 순위를 선택합니다.

기본 로드 우선 순위는 보통입니다. 데이터 집합은 다음 우선 순위에 따라 로드됩니다.
- 가장 높음
- 보다 높음
- 높음
- 기본
- 낮음
- 보다 낮음
- 가장 낮음
우선 순위가 동일한 데이터 집합은 특별한 순서 없이 로드됩니다.
확인을 클릭합니다.

SaaS 응용 프로그램 소스의 데이터 집합에는 로드 순서에 따른 종속성이 포함될 수 있습니다. 로드 우선 순위를 설정할 때 이를 고려합니다.

메타데이터 새로 고침

작업의 설계 보기에서 소스 메타데이터의 변경 내용에 맞게 작업의 메타데이터를 새로 고칠 수 있습니다. Metadata Manager를 사용하는 SaaS 응용 프로그램의 경우 데이터 작업에서 메타데이터를 새로 고치려면 먼저 Metadata Manager를 새로 고쳐야 합니다.

SaaS 응용 프로그램 미리 보기 커넥터를 사용하는 경우 이 작업을 사용할 수 없습니다. 미리 보기 커넥터는 연결 만들기 대화 상자와 온라인 도움말 모두에서 미리 보기 버튼 이미지

버튼으로 표시됩니다.

이 작업은 작업의 설계 보기에 있는 테이블에만 영향을 미칩니다.

다음 중 하나를 수행할 수 있습니다.
- 작업의 모든 데이터 집합에 대한 메타데이터를 새로 고치려면 ...를 클릭한 다음 메타데이터 새로 고침을 클릭합니다.
- 단일 데이터 집합에 대한 메타데이터를 새로 고치려면 데이터 집합의 데이터 집합에서 ...를 클릭한 다음 메타데이터 새로 고침을 클릭합니다.
화면 하단의 메타데이터 새로 고침에서 메타데이터 새로 고침 상태를 확인할 수 있습니다. 에 커서를 올려놓으면 메타데이터가 마지막으로 새로 고침된 시기를 확인할 수 있습니다.
변경 내용을 적용할 데이터 작업을 준비합니다.

데이터 작업을 준비하고 변경 내용을 적용하면 변경 내용이 메타데이터 새로 고침에서 제거됩니다.

변경 내용을 전파하려면 이 작업을 사용하는 저장소 작업을 준비해야 합니다.

열이 제거되면 저장소에서 기록 데이터가 손실되지 않도록 Null 값이 포함된 변환이 추가됩니다.

메타데이터 새로 고침에 대한 제한 사항

동일한 시간 슬롯에서 이전에 삭제된 열이 있으면 이름 바꾸기가 삭제된 열 이름 바꾸기로 해석됩니다(동일한 데이터 유형과 데이터 길이를 갖는 경우).

이전: a b c d

이후: a c1 d

이 예에서는 b가 삭제되고 c가 c1로 이름이 바뀌었으며, b와 c의 데이터 유형과 데이터 길이가 동일합니다.

이는 b의 이름이 c1로 변경되고 c가 삭제된 것으로 식별됩니다.
이전에 마지막 열 이름이 삭제된 경우에도 마지막 열 이름 바꾸기는 인식되지 않으며 이름이 바뀌기 전의 열도 인식되지 않습니다.

이전: a b c d

이후: a b c1

이 예에서는 d가 삭제되고 c가 c1로 이름이 바뀌었습니다.

이는 c 및 d가 삭제되고 c1이 추가된 것으로 식별됩니다.
새 열은 끝에 추가되는 것으로 가정됩니다. 다음 열과 동일한 데이터 타입으로 중간에 열이 추가되면 삭제 및 이름 바꾸기로 해석될 수 있습니다.

데이터 복제 시 제한 사항 및 고려 사항

변환에는 다음과 같은 제한이 적용됩니다.

오른쪽에서 왼쪽으로 쓰는 언어가 있는 열에는 변환이 지원되지 않습니다.
이름에 특수 문자(예: #, \, /, -)가 포함된 열에는 변환을 수행할 수 없습니다.
LOB/CLOB 데이터 유형에 대해 지원되는 유일한 변환은 대상에서 열을 삭제하는 것입니다.
변환을 사용하여 열 이름을 바꾼 다음 같은 이름의 새 열을 추가하는 것은 지원되지 않습니다.

이동된 열에서는 Null 허용 여부를 직접 변경하거나 변환 규칙을 사용하여 변경하는 것이 지원되지 않습니다. 그러나 작업에서 만들어진 새 열은 기본적으로 Null이 허용됩니다.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!

여기에 피드백을 남겨주십시오.