랜딩 설정 | Qlik Cloud 도움말
기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

랜딩 설정

랜딩 데이터 작업에 대한 설정을 구성할 수 있습니다.

  • 랜딩 작업을 열고 도구 모음에서 설정 을 클릭합니다.

설정: <작업 이름> 대화 상자가 열립니다. 사용 가능한 설정은 아래에 설명되어 있습니다.

일반

  • 데이터베이스

    대상에서 사용할 데이터베이스입니다.

    정보 메모이 옵션은 Qlik Cloud(Amazon S3 경유)에 데이터를 랜딩할 때 사용할 수 없습니다.
  • 작업 스키마

    랜딩 데이터 작업 스키마의 이름을 변경할 수 있습니다. 기본 이름은 landing입니다.

    정보 메모이 옵션은 Qlik Cloud(Amazon S3 경유)에 데이터를 랜딩할 때 사용할 수 없습니다.
  • 스키마 이름의 기본 대문자화

    모든 스키마 이름에 대한 기본 대문자화를 설정할 수 있습니다. 데이터베이스가 대문자화를 강제하도록 구성된 경우 이 옵션은 적용되지 않습니다.

  • 모든 테이블 및 뷰의 접두사

    이 작업으로 생성된 모든 테이블 및 뷰에 대한 접두사를 설정할 수 있습니다.

    정보 메모이 옵션은 Qlik Cloud(Amazon S3 경유)에 데이터를 랜딩할 때 사용할 수 없습니다.
    정보 메모여러 데이터 작업에서 데이터베이스 스키마를 사용하려면 고유한 접두사를 사용해야 합니다.
  • 업데이트 방법

    랜딩 작업은 항상 전체 로드로 시작됩니다. 전체 로드가 완료된 후 다음 방법 중 하나를 사용하여 랜딩된 데이터를 최신 상태로 유지할 수 있습니다.

    정보 메모랜딩 데이터 작업 준비 작업이 완료된 후에는 업데이트 방법을 변경할 수 없습니다.
    • 데이터 변경 내용 캡처(CDC)

      랜딩된 데이터는 CDC(데이터 변경 내용 캡처) 기술을 사용하여 최신 상태로 유지됩니다. CDC는 일부 데이터 소스에서는 지원되지 않을 수 있습니다. CDC는 열 이름 바꾸기 또는 메타데이터 변경과 같은 DDL 작업을 캡처하지 않습니다.

      데이터에 CDC를 지원하지 않는 뷰나 테이블도 포함되어 있는 경우 두 개의 데이터 파이프라인이 만들어집니다. CDC를 지원하는 모든 테이블이 포함된 파이프라인 하나와 업데이트 방법으로 다시 로드 및 비교를 사용하는 다른 모든 테이블과 뷰가 포함된 또 다른 파이프라인입니다.

    • 다시 로드 및 비교

      랜딩된 모든 데이터는 소스에서 다시 로드됩니다. 이는 소스가 CDC를 지원하지 않지만 지원되는 모든 데이터 소스와 함께 사용할 수 있는 경우에 유용합니다.

      주기적으로 다시 로드를 예약할 수 있습니다.

  • 로드 방법

    Snowflake 대상에 복제할 때 다음 로드 방법 중 하나를 선택할 수 있습니다.

    • 대량으로 로드(기본값)

      대량으로 로드를 선택하는 경우, 데이터 업로드 탭에서 로딩 매개 변수를 조정할 수 있습니다.

    • Snowpipe Streaming

      정보 메모

      Snowpipe Streaming은 다음 조건이 충족되는 경우에만 선택할 수 있습니다.

      • 데이터 변경 내용 캡처(CDC) 업데이트 방법이 활성화되었습니다.
      • Snowflake 커넥터의 인증 메커니즘키 쌍으로 설정됩니다.
      • 데이터 이동 게이트웨이을 사용하는 경우 2024.11.45 이상 버전이 필요합니다.

      Snowpipe Streaming을 선택하는 경우 이 방법을 사용할 때의 제한 사항 및 고려 사항을 잘 알고 있는지 확인합니다. 또한, Snowpipe Streaming을 선택한 다음 다시 로드 및 비교 업데이트 방법으로 전환하면 로드 방법이 자동으로 대량 로드로 다시 전환됩니다.

    대량으로 로드 대신 Snowpipe Streaming을 선택하는 주요 이유는 다음과 같습니다.

    • 비용 절감: Snowpipe Streaming은 Snowflake 웨어하우스를 사용하지 않으므로 운영 비용이 상당히 저렴합니다. 단, 이는 특정 사용 사례에 따라 다릅니다.

    • 지연 시간 단축: 데이터가 스테이징을 거치지 않고 대상 테이블에 직접 스트리밍되므로 데이터 소스에서 대상으로의 복제가 더 빨라집니다.

    팁 메모Snowpipe Streaming을 사용할 경우 초기 전체 로드가 대량 로드보다 상당히 느릴 수 있습니다. 특히 대용량 데이터 집합을 로드할 때 로드 성능을 최적화하려면 Snowpipe Streaming병렬 로드 기능과 함께 사용하는 것이 가장 좋습니다.
  • 스테이징 영역에서 사용할 폴더

    스테이징 영역이 필요한 데이터 플랫폼(예: Databricks 및 Azure Synapse Analytics)의 경우 데이터를 랜딩할 때 사용할 폴더를 선택할 수 있습니다.

    • 기본 폴더

      기본 이름인 <프로젝트 이름>/<데이터 작업 이름>으로 폴더를 생성합니다.

    • 루트 폴더

      스토리지의 루트 폴더에 데이터를 저장합니다.

      정보 메모이 옵션은 Qlik Cloud(Amazon S3 경유)에 데이터를 랜딩할 때만 사용할 수 있습니다.
    • 폴더

      사용할 폴더 이름을 지정합니다.

  • 변경 처리 간격

    소스에서 변경 사항을 처리하는 간격을 설정할 수 있습니다.

    정보 메모이 옵션은 Qlik Cloud(Amazon S3 경유)에 데이터를 랜딩할 때만 사용할 수 있습니다.
  • Data Movement gateway 사용 시 프록시 서버

    정보 메모이 옵션은 Data Movement gateway를 통해 대상에 액세스할 때만 사용할 수 있습니다.

    Data Movement 게이트웨이가 클라우드 데이터 웨어하우스 및 스토리지 영역에 연결할 때 프록시 서버를 사용하도록 선택할 수 있습니다.

    프록시 서버를 사용하도록 Data Movement 게이트웨이를 구성하는 방법에 대한 자세한 내용은 Qlik Cloud 테넌트 및 프록시 서버 설정를 참조하십시오.

    • 클라우드 데이터 웨어하우스에 연결할 때 프록시 사용

      정보 메모Snowflake, Google BigQuery 및 Databricks를 사용할 때 사용할 수 있습니다.
    • 스토리지에 연결할 때 프록시 사용

      정보 메모Azure Synapse Analytics, Amazon Redshift 및 Databricks를 사용할 때 사용할 수 있습니다.

데이터 업로드

이 탭의 일부 설정은 특정 대상 플랫폼에만 관련이 있습니다.

Qlik Cloud 및 Snowflake를 제외한 모든 데이터 플랫폼과 관련됨

파일이 닫히기 전에 도달할 수 있는 최대 크기입니다. 병렬 실행 옵션과 함께 사용하면 더 작은 파일이 더 빠르게 업로드되고 네트워크에 따라 성능이 향상될 수 있습니다. 그러나 일반적으로 작은 파일로 데이터베이스를 복잡하게 만드는 것은 좋지 않습니다.

Google BigQuery에만 관련됨

이 옵션을 선택하면 CSV 파일이 Google BigQuery에 업로드되기 전에 (gzip을 사용하여) 압축됩니다.

정보 메모

데이터 이동 게이트웨이 2023.5.16 이상이 필요합니다.

Snowflake에만 관련됨

일반 탭에서 대량 로드 또는 Snowpipe 스트리밍을 사용하여 데이터를 Snowflake에 로드할지 여부를 선택할 수 있습니다. Snowpipe 스트리밍을 선택하면 데이터 업로드 탭이 표시되지 않습니다. 대량 로드를 선택하면 다음 설정을 사용할 수 있습니다.

  • 최대 파일 크기(MB): 초기 전체 로드 및 CDC와 관련이 있습니다. 파일이 대상에 로드되기 전에 도달할 수 있는 최대 크기입니다. 성능 문제가 발생하면 이 매개 변수를 조정해 보십시오.

  • 일괄 처리로 로드할 파일 수: 초기 전체 로드에만 관련이 있습니다. 단일 일괄 처리로 로드할 파일 수입니다. 성능 문제가 발생하면 이 매개 변수를 조정해 보십시오.

대량 로드Snowpipe 스트리밍 로드 방법에 대한 설명은 일반를 참조하십시오.

메타데이터

LOB 열

LOB 열 포함 및 열 크기 제한(KB):

작업에 LOB 열을 포함하도록 선택하고 최대 LOB 크기를 설정할 수 있습니다. 최대 크기보다 큰 LOB는 잘립니다.

정보 메모대상을 Azure Synapse Analytics로 사용할 때 최대 LOB 크기는 7MB를 초과할 수 없습니다.

제어 테이블

대상 플랫폼에 생성할 다음 제어 테이블을 선택합니다.

  • 랜딩 상태: 작업 상태, 작업에서 소비한 메모리 양, 데이터 플랫폼에 아직 적용되지 않은 변경 수 및 데이터 이동 게이트웨이가 현재 읽고 있는 소스 엔드포인트의 위치를 포함하여 현재 랜딩 작업에 대한 세부 정보를 제공합니다.
  • 일시 중단된 테이블: 일시 중단된 테이블 목록과 일시 중단된 이유를 제공합니다.
  • 랜딩 기록: 랜딩 작업 중에 처리된 레코드의 수 및 볼륨, CDC 작업 종료 시의 지연 시간 등을 포함하여 작업 기록에 대한 정보를 제공합니다.
  • DDL 기록: 작업 중에 발생한 지원되는 모든 DDL 변경 기록을 포함합니다.

    DDL 기록 테이블은 다음 대상 플랫폼에서만 지원됩니다.

    • Databricks

    • Microsoft Fabric
    • Amazon Redshift
    • 데이터 이동 게이트웨이을(를) 사용하는 경우, 다음 대상에는 2024.11.14 이상 버전이 필요합니다:
      • Amazon S3
      • Google 클라우드 저장소
      • Snowflake
    • Kafka - 데이터 이동 게이트웨이을(를) 사용하는 경우 2025.5.42 이상 버전이 필요합니다.
    • 데이터 이동 게이트웨이을(를) 사용하는 경우, 다음 대상에는 2025.11.1 이상 버전이 필요합니다:
      • Google BigQuery
      • PostgreSQL용 Google Cloud Alloy DB (PostgreSQL 커넥터를 통해)
      • PostgreSQL용 Google Cloud SQL (PostgreSQL 커넥터를 통해)
      • Microsoft Azure Database for PostgreSQL(PostgreSQL 커넥터를 통해)
      • PostgreSQL

각 제어 테이블에 대한 자세한 설명은 제어 테이블를 참조하십시오.

전체 로드

성능 조정

  • 병렬로 로드할 최대 테이블 수: 한 번에 대상에 로드할 최대 테이블 수를 입력합니다. 기본값은 5입니다.
  • 트랜잭션 일관성 시간 초과(초): 전체 로드 작업을 시작하기 전에 열린 트랜잭션이 닫힐 때까지 대기할 시간(초)을 입력합니다. 기본값은 600(10분)입니다. 여전히 열려 있는 트랜잭션이 있더라도 시간 초과 값에 도달하면 전체 로드가 시작됩니다.

    정보 메모전체 로드가 시작될 때 열려 있었지만 시간 초과 값에 도달한 후에만 커밋된 트랜잭션을 복제하려면 대상 테이블을 다시 로드해야 합니다.
  • 전체 로드 중 커밋 속도: 함께 전송할 수 있는 최대 이벤트 수입니다. 기본값은 10000입니다.

전체 로드 완료 후

기본 키 또는 고유 키 생성: 전체 로드가 완료될 때까지 데이터 플랫폼에서 기본 키 또는 고유 인덱스 생성을 지연하려면 이 옵션을 선택합니다.

  • 초기 로드의 경우

  • SaaS 응용 프로그램 소스에서 데이터를 이동할 때 초기 전체 로드를 수행하는 방법을 설정할 수 있습니다.

    정보 메모데이터 이동 게이트웨이를 사용하여 데이터 소스에 액세스하는 경우 이러한 설정에는 2022.11.74 이상 버전이 필요합니다.
    캐시된 데이터 사용

    이 옵션을 사용하면 전체 데이터 검색이 선택된 상태에서 메타데이터를 생성할 때 읽은 캐시된 데이터를 사용할 수 있습니다.

    이렇게 하면 데이터가 이미 소스에서 읽히므로 API 사용 및 할당량과 관련된 오버헤드가 줄어듭니다. 초기 데이터 검색 이후의 모든 변경 내용은 데이터 변경 내용 캡처(CDC)에서 선택할 수 있습니다.

    소스에서 데이터 로드

    이 옵션은 데이터 소스에서 새 로드를 수행합니다. 이 옵션은 다음과 같은 경우에 유용합니다.

    • 메타데이터 검색이 최근에 수행되지 않았습니다.

    • 소스 데이터 집합은 작고 자주 변경되며 전체 변경 내역을 유지하고 싶지 않습니다.

    오류 처리

    데이터 오류

    정보 메모

    데이터 오류 처리는 CDC(변경 데이터 캡처) 업데이트 방법에서만 지원됩니다.

    데이터 잘림 오류: 하나 이상의 특정 레코드에서 잘림이 발생할 때 수행할 작업을 선택합니다. 목록에서 다음 중 하나를 선택할 수 있습니다.

    • 무시: 작업은 계속되고 오류는 무시됩니다.
    • 일시 중단 테이블: 작업은 계속되지만 오류 레코드가 있는 테이블의 데이터는 오류 상태로 전환되고 해당 데이터는 복제되지 않습니다.
    • 작업 중지: 작업이 중지되며 수동 개입이 필요합니다.

    기타 데이터 오류의 경우: 하나 이상의 특정 레코드에서 오류가 발생할 때 수행할 작업을 선택합니다. 목록에서 다음 중 하나를 선택할 수 있습니다.

    • 무시: 작업은 계속되고 오류는 무시됩니다.
    • 일시 중단 테이블: 작업은 계속되지만 오류 레코드가 있는 테이블의 데이터는 오류 상태로 전환되고 해당 데이터는 복제되지 않습니다.
    • 작업 중지: 작업이 중지되며 수동 개입이 필요합니다.

    다른 데이터 오류에 도달할 경우 오류 처리 에스컬레이션(테이블별): 잘림이 없는 데이터 오류 수(테이블별)가 지정된 양에 도달할 때 발생하는 오류 처리를 에스컬레이션하려면 이 확인란을 선택합니다. 유효한 값은 1~10,000입니다.

    에스컬레이션 작업: 오류 처리가 에스컬레이션될 때 발생하는 상황을 선택합니다. 사용할 수 있는 작업은 위에 설명된 기타 데이터 오류의 경우 드롭다운 목록에서 선택한 작업에 따라 달라집니다.

    • 테이블 일시 중단(기본값): 작업은 계속되지만 오류 레코드가 있는 테이블의 데이터는 오류 상태로 이동되고 해당 데이터는 landed되지 않습니다.

    • 작업 중지: 작업이 중지되며 수동 개입이 필요합니다.

    테이블 오류

    이 옵션을 사용하면 테이블 오류 처리 정책이 언제 트리거될지 제어할 수 있습니다. 기본적으로 테이블 오류가 발생하면 세 번의 재시도 후 테이블이 일시 중단되거나 작업이 중지됩니다(선택한 작업에 따라). 때로는 SaaS 애플리케이션의 계획된 유지 관리로 인해 테이블 오류가 발생할 수 있습니다. 이러한 경우, 테이블 오류 처리 정책이 트리거되기 전에 유지 관리가 완료되기에 기본 재시도 횟수가 충분하지 않을 수 있습니다. 이는 작업이 실행될 때마다 재시도가 수행되므로 작업의 예약 간격에도 따라 달라집니다. 따라서 예를 들어, 작업을 매시간 실행하도록 예약하고 작업이 시작될 때 SaaS 애플리케이션이 유지 관리를 위해 오프라인 상태가 되면, 기본 세 번의 재시도는 테이블 오류 처리 정책이 트리거되지 않고 SaaS 애플리케이션이 최대 세 시간 동안 오프라인 상태를 유지하도록 허용합니다. 더 긴 유지 관리 기간에는 테이블 오류 처리 정책이 트리거되는 것을 방지하기 위해 재시도 횟수를 늘리거나(또는 예약을 변경) 해야 합니다.

    요약하자면, SaaS 애플리케이션이 주기적인 유지 관리를 거친다는 것을 알고 있다면, 테이블 오류 처리 정책이 트리거되지 않고 유지 관리가 완료될 수 있도록 예약에 따라 재시도 횟수를 늘리는 것이 가장 좋습니다.

    정보 메모
    • 이 옵션은 Lite 또는 Standard SaaS 애플리케이션 커넥터로 구성된 작업에만 표시됩니다.

    • 데이터 이동 게이트웨이을 사용하는 경우 2024.11.70 이상 버전이 필요합니다.

    테이블 오류가 발생하는 경우: 드롭다운 목록에서 다음 중 하나를 선택합니다.

    • 테이블 일시 중단(기본값): 작업은 계속되지만 오류 레코드가 있는 테이블의 데이터는 오류 상태로 이동되고 해당 데이터는 복제되지 않습니다.
    • 작업 중지: 작업이 중지되며 수동 개입이 필요합니다.

    테이블 오류 도달 시 오류 처리 에스컬레이션(테이블별): 테이블 오류 수(테이블별)가 지정된 양에 도달할 때 발생하는 오류 처리를 에스컬레이션하려면 이 확인란을 선택합니다. 유효한 값은 1~10,000입니다.

    에스컬레이션 작업: 테이블 오류에 대한 에스컬레이션 정책은 작업 중지로 설정되어 있으며 변경할 수 없습니다.

    환경

    • 최대 다시 시도 횟수: 이 옵션을 선택한 다음 복구 가능한 환경 오류가 발생할 때 작업을 다시 시도하는 최대 시도 횟수를 지정합니다. 작업이 지정된 횟수만큼 재시도되면 작업이 중지되고 수동 개입이 필요합니다.

      작업을 다시 시도하지 않으려면 확인란을 선택 해제하거나 "0"을 지정합니다.

      작업을 무제한 다시 시도하려면 "-1"을 지정합니다.

      • 다시 시도 간격(초): 카운터를 사용하여 시스템이 작업 다시 시도 사이에 대기하는 시간(초)을 선택하거나 입력합니다.

        유효한 값은 0~2,000입니다.

    • 긴 중단에 대한 다시 시도 간격 늘리기: 긴 중단에 대한 다시 시도 간격을 늘리려면 이 확인란을 선택합니다. 이 옵션을 사용하면 최대 다시 시도 간격에 도달할 때까지 각 다음 시도 사이의 간격을 두 배로 늘립니다(지정된 최대 간격에 따라 계속 다시 시도함).
      • 최대 다시 시도 간격(초): 긴 중단에 대한 다시 시도 간격 늘리기 옵션이 활성화된 경우 카운터를 사용하여 작업 다시 시도 간격(초)을 선택하거나 입력합니다. 유효한 값은 0~2,000입니다.

    변경 처리 조정

    정보 메모이 탭은 업데이트 방법이 CDC(변경 데이터 캡처)인 경우에만 사용할 수 있습니다.

    트랜잭션 오프로드 조정

    • 다음의 경우 진행 중인 트랜잭션을 디스크로 오프로드:

      트랜잭션 데이터는 일반적으로 소스 또는 대상에 완전히 커밋될 때까지 메모리에 유지됩니다. 그러나 할당된 메모리보다 크거나 지정된 시간 제한 내에 커밋되지 않은 트랜잭션은 디스크로 오프로드됩니다.

      • 모든 트랜잭션의 총 메모리 크기 초과(MB): 디스크로 오프로드되기 전에 모든 트랜잭션이 메모리에서 차지할 수 있는 최대 크기입니다. 기본값은 1024입니다.
      • 트랜잭션 기간 초과(초): 디스크로 오프로드되기 전에 각 트랜잭션이 메모리에 머무를 수 있는 최대 시간입니다. 기간은 Qlik Talend Data Integration가 트랜잭션 캡처를 시작한 시간부터 계산됩니다. 기본값은 60입니다.

    일괄 처리 조정

    이 탭의 일부 설정은 모든 대상 또는 대상 로드 방법에 적용되지 않을 수 있습니다.

    "로드 방법"이 "Snowpipe 스트리밍"인 경우 Qlik Cloud 및 Snowflake를 제외한 모든 대상에 적용되는 설정

    • 일괄 처리된 변경 사항을 간격으로 적용:
      • 다음보다 큼: 일괄 처리 변경 사항의 각 적용 사이에 대기할 최소 시간입니다. 기본값은 1입니다.

        다음보다 큼 값을 늘리면 대상에 변경 사항이 적용되는 빈도가 줄어들고 일괄 처리 크기가 늘어납니다. 이렇게 하면 대규모 일괄 처리에 최적화된 대상 데이터베이스에 변경 사항을 적용할 때 성능이 향상될 수 있습니다.

      • 다음보다 작음: 일괄 처리 변경 사항의 각 적용 사이에 대기할 최대 시간(시간 초과를 선언하기 전)입니다. 즉, 허용되는 최대 지연 시간입니다. 기본값은 30입니다. 이 값은 다음보다 큼 값에 도달한 후 변경 사항을 적용하기 전에 대기할 최대 시간을 결정합니다.
    • 처리 메모리가 다음을 초과할 때 일괄 처리 강제 적용(MB): 전처리에 사용할 최대 메모리 양입니다. 기본값은 500MB입니다.

      최대 일괄 처리 크기의 경우 이 값을 데이터 작업에 할당할 수 있는 가장 높은 메모리 양으로 설정합니다. 이렇게 하면 대규모 일괄 처리에 최적화된 대상 데이터베이스에 변경 사항을 적용할 때 성능이 향상될 수 있습니다.

    • 여러 테이블에 일괄 처리된 변경 사항을 동시에 적용: 이 옵션을 선택하면 여러 소스 테이블의 변경 사항을 적용할 때 성능이 향상됩니다.

      • 최대 테이블 수: 일괄 처리된 변경 사항을 동시에 적용할 최대 테이블 수입니다. 기본값은 5입니다.

      정보 메모이 옵션은 데이터 플랫폼으로 Google BigQuery를 사용할 때 지원되지 않습니다.
    • 변경 처리 문당 적용되는 변경 수를 다음으로 제한: 단일 변경 처리 문에 적용되는 변경 수를 제한하려면 이 옵션을 선택합니다. 기본값은 10,000입니다.

      정보 메모이 옵션은 데이터 플랫폼으로 Google BigQuery를 사용할 때만 지원됩니다.

    "로드 방법"이 "Snowpipe 스트리밍"인 경우 Qlik Cloud 및 Snowflake에만 적용되는 설정

    • 트랜잭션당 최소 변경 수: 각 트랜잭션에 포함할 최소 변경 수입니다. 기본값은 1000입니다.

      정보 메모

      변경 수가 트랜잭션당 최소 변경 수보다 크거나 같은 경우 또는 아래 설명된 적용 전 트랜잭션을 배치하는 최대 시간(초) 값에 도달하는 경우가 먼저 발생할 때 변경 내용이 대상에 적용됩니다. 대상에 적용되는 변경 빈도는 이 두 매개 변수에 의해 제어되므로 소스 레코드에 대한 변경 내용이 대상 레코드에 즉시 반영되지 않을 수 있습니다.

    • 적용 전 트랜잭션을 배치하는 최대 시간(초): 시간 초과를 선언하기 전에 트랜잭션을 일괄 수집하는 최대 시간입니다. 기본값은 1입니다.

    간격

    SAP ODP 및 SaaS 응용 프로그램(Lite) 커넥터 사용 시 설정

    • 변경 내용 읽기 간격(분)

      소스에서 변경 내용을 읽는 간격(분). 유효한 범위는 1~1440입니다.

      정보 메모

      이 옵션은 데이터 작업이 다음과 같이 정의된 경우에만 사용할 수 있습니다.

      • 데이터 이동 게이트웨이
      • 다음 소스 중 하나:
      • 데이터 변경 내용 캡처(CDC) 업데이트 방법

    SAP OData 커넥터 사용 시 설정

    • 델타 추출 간격에 따라: 이 옵션을 선택하면 데이터 작업은 델타 추출 간격에 따라 변경 내용을 확인합니다.

      정보 메모각 "라운드" 후 간격이 시작됩니다. 라운드는 데이터 작업이 소스 테이블에서 변경 내용을 읽고 이를 대상에 전송하는 데 걸리는 시간(단일 트랜잭션으로)으로 정의할 수 있습니다. 라운드의 길이는 테이블과 변경 내용의 수에 따라 달라집니다. 따라서 간격을 10분으로 지정하고 한 라운드가 4분 걸리면 실제로 변경 내용을 확인하는 데 걸리는 시간은 14분이 됩니다.
      • 델타 추출 간격: 시스템에서 델타가 추출되는 빈도. 기본값은 60초입니다.

    • 예정대로: 이 옵션을 선택하면 데이터 작업은 델타를 한 번 추출한 다음 중지됩니다. 그러면 예정대로 계속 실행됩니다.

      정보 메모이 옵션은 CDC 주기의 간격이 24시간 이상인 경우에만 적용됩니다.

      일정 관리에 대한 정보:

      • 데이터 파이프라인 프로젝트의 랜딩 작업은 작업 예약을 참조하십시오.

    기타 조정

    • 문 캐시 크기(문 수): 나중에 실행하기 위해(대상에 변경 사항을 적용할 때) 서버에 저장할 준비된 문의 최대 수입니다. 기본값은 50입니다. 최대값은 200입니다.
    • 기본 키 열을 업데이트할 때 DELETE 및 INSERT: 이 옵션을 사용하려면 소스 데이터베이스에서 전체 보충 로깅을 켜야 합니다.

    스키마 진화

    스키마에서 다음 유형의 DDL 변경 사항을 처리하는 방법을 선택합니다. 스키마 진화 설정을 변경한 경우 작업을 다시 준비해야 합니다. 아래 테이블은 지원되는 DDL 변경 사항에 사용할 수 있는 작업을 설명합니다.

    DDL 변경 대상에 적용 무시 테이블 일시 중단 작업 중지
    열 추가
    열 이름 바꾸기 아니요 아니요
    테이블 이름 바꾸기 아니요 아니요
    열 데이터 유형 변경 아니요
    테이블 생성

    선택 규칙을 사용하여 패턴과 일치하는 데이터 세트를 추가한 경우 패턴을 충족하는 새 테이블이 감지되고 추가됩니다.

    아니요 아니요

    문자 대체

    대상 데이터베이스의 소스 문자를 대체하거나 삭제할 수 있으며/또는 선택한 문자 집합에서 지원하지 않는 소스 문자를 대체하거나 삭제할 수 있습니다.

    정보 메모
    • 모든 문자는 유니코드 코드 포인트로 지정되어야 합니다.

    • 문자 대체는 제어 테이블에서도 수행됩니다.
    • 잘못된 값은 테이블 셀 오른쪽 위에 빨간색 삼각형으로 표시됩니다. 삼각형 위에 마우스 커서를 올리면 오류 메시지가 표시됩니다.

    • 작업에 대해 정의된 모든 테이블 수준 또는 전역 변환은 문자 대체가 완료된 후에 수행됩니다.

    • 소스 문자 대체 또는 삭제 표에 정의된 대체 작업은 선택한 문자 집합에서 지원되지 않는 소스 문자 대체 또는 삭제 표에 정의된 대체 작업 전에 수행됩니다.

    • 문자 대체는 LOB 데이터 유형을 지원하지 않습니다.

    소스 문자 대체 또는 삭제

    특정 소스 문자에 대한 대체를 정의하려면 소스 문자 대체 또는 삭제 표를 사용하십시오. 예를 들어, 문자의 유니코드 표현이 소스 플랫폼과 대상 플랫폼에서 다를 때 유용할 수 있습니다. 예를 들어, Linux에서는 Shift_JIS 문자 집합의 빼기 문자가 U+2212로 표시되지만 Windows에서는 U+FF0D으로 표시됩니다.

    대체 작업
    대상 다음을 수행합니다.

    대체 작업을 정의합니다.

    1. 표 위에 있는 문자 추가 버튼을 클릭합니다.

    2. 소스 문자대체 문자 필드에 각각 소스 문자와 대상 문자를 지정합니다.

      예를 들어, 문자 "a"를 문자 "e"로 바꾸려면 각각 00610065 을 지정합니다.

      정보 메모

      지정된 소스 문자를 삭제하려면 대체 문자 열에 0을 입력합니다.

    3. 추가 문자를 바꾸거나 삭제하려면 1~2단계를 반복합니다.

    지정된 소스 또는 대상 문자를 편집합니다.

    편집을 선택한 행 끝에서 을 클릭합니다.

    테이블에서 항목 삭제

    삭제를 선택한 행 끝에서 을 클릭합니다.

    선택한 문자 집합에서 지원하지 않는 소스 문자 대체 또는 삭제

    선택한 문자 집합에서 지원하지 않는 모든 문자에 대해 단일 대체 문자를 정의하려면 문자 집합별로 지원되지 않는 소스 문자 표를 사용합니다.

    지원되지 않는 문자 대체 작업
    대상 다음을 수행합니다.

    대체 작업을 정의하거나 편집합니다.

    1. 표의 문자 집합 드롭다운 목록에서 문자 집합을 선택합니다.

      선택한 문자 집합에서 지원되지 않는 문자는 대상에서 아래 2단계에서 지정한 문자로 바뀝니다.

    2. 대체 문자 열에서 열의 아무 곳이나 클릭하고 대체 문자를 지정합니다. 예를 들어, 지원되지 않는 모든 문자를 문자 "a"로 바꾸려면 0061을 입력합니다.

      정보 메모

      지원되지 않는 문자를 모두 삭제하려면 0을 입력합니다.

    대체 작업을 비활성화합니다.

    문자 집합 드롭다운 목록에서 빈 항목을 선택합니다.

    추가 옵션

    이러한 옵션은 특정 버전이나 환경에만 관련되므로 UI에 표시되지 않습니다. 따라서 Qlik 지원 또는 제품 설명서에서 명시적으로 지시하지 않는 한 이러한 옵션을 설정하지 마십시오.

    옵션을 설정하려면 옵션을 기능 이름 추가 필드에 복사하고 추가를 클릭하면 됩니다. 그런 다음 받은 지침에 따라 값을 설정하거나 옵션을 활성화합니다.

    병렬로 데이터 세트 세그먼트 로드

    정보 메모이 설정은 SaaS 응용 프로그램 소스에는 사용할 수 없으며 소스 및 대상 데이터베이스의 특정 하위 집합에만 사용할 수 있습니다.

    전체 로드 중에 데이터 세트를 세그먼트로 분할하여 대규모 데이터 세트의 로드를 가속화할 수 있으며, 이 세그먼트는 병렬로 로드됩니다. 테이블은 데이터 범위, 모든 파티션, 모든 하위 파티션 또는 특정 파티션별로 분할할 수 있습니다.

    자세한 내용은 병렬로 랜딩 데이터 집합 세그먼트를 참조하십시오.

    작업 예약

    정보 메모스케줄러를 사용하려면 작동 가능 역할 또는 편집 가능 역할이 필요합니다.

    다음 사용 사례에서는 대상 데이터를 최신 상태로 유지하기 위해 예약 간격을 정의해야 합니다.

    • 데이터 이동 게이트웨이 없이 데이터 소스에 액세스
    • 다음마다 변경 사항 읽기 설정을 지원하지 않는 SaaS 응용 프로그램 커넥터 사용
    • 예약된 대로 옵션을 사용하여 SAP OData 소스에서 변경 사항을 캡처하는 경우.

    일정은 소스 데이터 세트의 변경 사항으로 대상 데이터 세트가 업데이트되는 빈도를 결정합니다. 일정이 업데이트 빈도를 결정하는 반면, 데이터 세트 유형은 업데이트 방법을 결정합니다. 소스 데이터 세트가 CDC(변경 데이터 캡처)를 지원하는 경우 소스 데이터의 변경 사항만 복제되어 해당 대상 테이블에 적용됩니다. 소스 데이터 세트가 CDC를 지원하지 않는 경우(예: 뷰) 모든 소스 데이터를 해당 대상 테이블에 다시 로드하여 변경 사항이 적용됩니다. 일부 소스 데이터 세트는 CDC를 지원하고 일부는 지원하지 않는 경우 두 개의 개별 하위 작업이 생성됩니다. 하나는 CDC를 지원하지 않는 데이터 세트를 다시 로드하기 위한 것이고 다른 하나는 CDC를 지원하는 데이터 세트의 변경 사항을 캡처하기 위한 것입니다. 이 경우 데이터 일관성을 보장하기 위해 두 작업에 대해 동일한 예약 간격을 유지하지 않는 것이 좋습니다(향후 업데이트 빈도를 변경하기로 결정한 경우).

    데이터 소스 유형 및 구독 계층에 따른 최소 예약 간격에 대한 자세한 내용은 허용되는 최소 예약 간격을 참조하십시오.

    예약을 변경하려면:

    1. 파이프라인 프로젝트를 연 다음 다음 중 하나를 수행합니다.

      • 작업 보기에서 데이터 작업의 3개의 가로 점으로 구성된 메뉴 버튼입니다.을 클릭하고 예약을 선택합니다.
      • 파이프라인 보기에서 데이터 작업의 3개의 세로 점으로 구성된 메뉴 버튼입니다.을 클릭하고 예약을 선택합니다.
      • 랜딩 작업을 열고 예약 도구 모음 버튼을 클릭합니다.
    2. 필요에 따라 예약 설정을 변경한 다음 확인을 클릭합니다.
    정보 메모다음 예약된 실행이 시작될 때 데이터 작업이 여전히 실행 중인 경우 작업이 완료될 때까지 다음 예약된 실행을 건너뜁니다.

    데이터 이동 게이트웨이 기반 작업에 대해 누락된 실행 실행

    네트워크 문제로 인해 데이터 이동 게이트웨이에 대한 연결이 끊어지는 경우가 있습니다. 데이터 이동 게이트웨이에 대한 연결이 다음 예약된 실행 전에 복구되지 않으면 데이터 작업이 예약대로 실행될 수 없습니다. 이런 경우, 연결이 복구된 직후에 실행을 실행할지 여부를 선택할 수 있습니다.

    모든 데이터 이동 게이트웨이에 대한 기본 설정은 관리 활동 센터에 정의되어 있습니다. 아래 설명된 대로 개별 작업에 대해 이러한 설정을 재정의할 수 있습니다.

    이 작업을 수행하려면

    1. 프로젝트를 연 다음 다음 중 하나를 수행합니다.

      • 작업 보기에서 데이터 작업의 3개의 가로 점으로 구성된 메뉴 버튼입니다.을 클릭하고 예약을 선택합니다.

      • 파이프라인 보기에서 데이터 작업의 3개의 세로 점으로 구성된 메뉴 버튼입니다.을 클릭하고 예약을 선택합니다.

      • 데이터 작업을 열고 예약 도구 모음 버튼을 클릭합니다.

      예약 - <작업> 대화 상자가 열립니다.

    2. 이 작업에 사용자 지정 설정 사용을 켭니다.

    3. 대화 상자 하단에서 다음 누락된 예약 작업 실행 옵션 중 하나를 선택합니다.

      • 다음 예약된 인스턴스 전에 작업을 실행하는 것이 중요한 경우 가능한 한 빨리 실행한 다음 예약된 대로 실행

      • 다음 예약된 인스턴스에서 작업을 실행하려면 예약된 대로

    4. 설정을 저장합니다.

    참조: 놓친 일정 후 작업 실행.

    이 페이지가 도움이 되었습니까?

    이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 알려 주십시오!