Monitoring an individual data task
데이터 작업 창의 왼쪽 상단에 있는 드롭다운 메뉴에서 모니터링을 선택하여 데이터 작업의 상태와 진행률을 모니터링할 수 있습니다.
또한 모니터링 보기를 만들어 여러 데이터 작업을 모니터링할 수 있습니다. 자세한 내용은 데이터 태스크 모니터링 및 운영를 참조하십시오.
General monitoring overview
모니터링 보기는 모든 작업 유형에 사용할 수 있으며 작업 상태 및 지표를 추적할 수 있습니다.
-
탭
작업 유형에 따라 정보, 전체 로드, 변경 처리, 배치 또는 스트리밍과 같은 사용 가능한 탭 간에 전환합니다. 각 탭에 대한 자세한 내용은 아래의 관련 작업 섹션을 참조하십시오.
-
데이터 집합 상태 필터
데이터 집합 테이블 위의 막대형 차트는 각 상태에 있는 데이터 집합 수를 보여줍니다. 대기 중, 로드 중, 완료됨 및 오류. 차트는 데이터 집합 상태가 변경됨에 따라 동적으로 업데이트됩니다. 상태 세그먼트를 클릭하여 해당 상태의 데이터 집합만 표시하도록 데이터 집합 테이블을 필터링합니다.
-
위젯 숨기기
지표 위젯을 축소하려면 위젯 숨기기를 클릭합니다. 이렇게 하면 아래의 데이터 집합 테이블을 볼 수 있는 더 많은 공간이 제공됩니다.
-
시작 날짜
현재 작업 실행이 시작된 날짜 및 시간입니다.
-
종료 날짜
작업 실행이 종료된 날짜 및 시간입니다. 완료된 작업 실행에 대해서만 표시됩니다.
-
실행 기록
이전 작업 실행 및 결과 목록을 보려면 실행 기록을 클릭합니다.
Monitoring data movement tasks
사용 가능한 모니터링 옵션은 작업 유형과 커넥터 유형에 따라 결정됩니다. 일부 커넥터는 CDC를 지원하지 않으므로(예: Epicor) CDC와 관련된 모니터링 옵션은 해당 커넥터에 표시되지 않습니다. 마찬가지로 일부 커넥터는 전체 로드를 지원하지 않으므로(예: 미리 보기 커넥터) 전체 로드와 관련된 모니터링 옵션은 해당 커넥터에 표시되지 않습니다.
데이터 파이프라인 사용 사례: 랜딩 작업
모든 랜딩 작업은 소스 데이터를 대상으로 전체 로드하는 것으로 시작해야 합니다. 초기 전체 로드가 완료되면 대상 데이터가 소스 데이터의 변경 내용으로 업데이트됩니다. 이는 작업 정의에 따라 다시 로드 및 비교 또는 변경 데이터 캡처(CDC)를 사용하여 수행할 수 있습니다.
랜딩 작업에 대한 자세한 내용은 데이터 소스에서 데이터 랜딩를 참조하십시오.
Replication use case: "Replicate data" tasks
"데이터 복제" 작업은 일반적으로 소스 데이터를 대상으로 전체 로드하는 것으로 시작합니다. 다음 표에는 전체 로드 사용 사례가 요약되어 있습니다.
데이터베이스에서 복제할 때 소스 데이터가 대상에 이미 존재하고 소스 변경 내용만 대상에 적용(또는 나중에 적용하기 위해 저장)하려는 경우 복제 모드는 변경 내용 적용, 변경 내용 저장 또는 둘 다일 수 있습니다. 이 두 복제 모드는 모두 CDC 모니터링에 표시됩니다.
"데이터 복제" 작업에 대한 자세한 내용은 다음 항목을 참조하십시오.
Standard, Premium 또는 Enterprise 구독으로 데이터 복제
Qlik Talend Cloud 시작 구독을 사용하여 데이터 복제
Replication use case: "Land data in data lake" tasks
"데이터 레이크에 데이터 랜딩" 작업은 전체 로드로 시작해야 한다는 점에서 랜딩 작업과 유사합니다. 초기 전체 로드가 완료되면 대상 데이터가 소스 데이터의 변경 내용으로 업데이트됩니다. 이는 다시 로드 또는 변경 데이터 캡처(CDC)를 사용하여 수행할 수 있습니다. 랜딩 작업과 유사함에도 불구하고 "데이터 레이크에 데이터 랜딩" 작업은 소스-대상 복제로만 구성되므로 복제 작업으로 간주됩니다. 데이터 파이프라인에서 사용할 수 있는 다운스트림(예: 변환 및 데이터 마트 사용)에서 데이터를 조작할 수 있는 가능성을 제공하지 않습니다.
"데이터 레이크에 데이터 랜딩" 작업에 대한 자세한 내용은 Standard, Premium 또는 Enterprise 구독을 통해 데이터 레이크에 데이터 랜딩를 참조하십시오.
Monitoring details
다음 모니터링 세부 정보를 사용할 수 있습니다.
-
정보
-
전체 로드
-
변경 처리
-
스트리밍
스트리밍 랜딩 작업에만 사용할 수 있습니다.
정보 모니터링 세부 정보
작업, 실행 ID 및 데이터가 업데이트된 시기에 대한 일반 정보를 볼 수 있습니다. CDC 작업의 경우 이 탭에서 예약 정보도 사용할 수 있습니다.
전체 로드 모니터링 세부 정보
버튼으로 표시됩니다.전체 로드에서 데이터 작업에 대한 다음 통계를 볼 수 있습니다.
-
총 데이터 집합
로드된 데이터 집합 수입니다.
-
오류가 있는 데이터 집합
오류가 있는 데이터 집합 수입니다.
-
총 지연 시간
작업의 현재 지연 시간(hh:mm:ss)입니다. 이 기간은 소스에서 변경 내용을 사용할 수 있는 시점부터 변경 내용이 적용되어 대상 또는 랜딩에서 사용할 수 있을 때까지의 시간을 나타냅니다.
-
총 처리량
대상 처리량(KB/초)입니다. 이는 변경 레코드가 대상 엔드포인트에 로드되는 속도를 나타냅니다.
데이터 작업의 각 데이터 집합에 대한 다음 세부 정보를 볼 수 있습니다.
-
이름
대상 데이터 집합의 이름입니다.
-
상태
테이블 상태는 대기 중, 로드 중, 완료됨 또는 오류 중 하나입니다.
-
시작됨
로드가 시작된 시간입니다.
-
종료됨
로드가 종료된 시간입니다.
-
기간
hh:mm:ss 형식의 로드 기간입니다.
-
레코드
로드 중에 대상에 기록된 레코드 수입니다.
정보 메모소스 데이터 집합이 필터링되면 레코드 가 다음 섹션으로 바뀝니다.
-
읽은 레코드: 필터링하기 전에 소스 데이터 집합에서 읽은 레코드 수입니다.
-
기록된 레코드(필터링 후): 필터링 후 대상에 실제로 기록된 레코드 수입니다.
데이터 집합 필터링에 대한 자세한 내용은 데이터 집합 필터링를 참조하십시오.
-
-
메시지
로드가 성공적으로 처리되지 않은 경우 오류 메시지를 표시합니다.
변경 처리 모니터링 세부 정보
변경 처리는 마지막 CDC 실행 중 또는 아직 완료되지 않은 경우 현재 실행 중에 모든 테이블에 적용된 변경 내용 수를 표시합니다. 작업이 시작된 이후 개별 데이터 집합에 적용된 변경 내용 수를 보려면 데이터 집합 테이블을 참조하십시오.
다음 변경 처리 통계를 볼 수 있습니다.
-
총 데이터 집합
로드된 데이터 집합 수입니다.
-
오류가 있는 데이터 집합
오류가 있는 데이터 집합 수입니다.
-
총 지연 시간
작업의 현재 지연 시간(hh:mm:ss)입니다. 이 기간은 소스에서 변경 내용을 사용할 수 있는 시점부터 변경 내용이 적용되어 대상 또는 랜딩에서 사용할 수 있을 때까지의 시간을 나타냅니다.
-
총 처리량
대상 처리량(KB/초)입니다. 이는 변경 레코드가 대상 엔드포인트에 로드되는 속도를 나타냅니다.
-
총 수신 변경 내용
소스에 존재하고 처리 대기 중인 변경 내용 수입니다. 소스에 누적된 수와 적용 중인 수를 볼 수 있습니다.
-
총 적용된 변경 내용
대상 또는 랜딩에 적용된 변경 내용 수입니다. 추가, 삭제 및 업데이트 수를 볼 수 있습니다.
데이터 작업의 각 테이블에 대한 다음 세부 정보를 볼 수 있습니다.
버튼으로 표시됩니다.-
이름
랜딩 자산의 대상 테이블 이름입니다.
-
상태
테이블 상태는 다음 중 하나입니다. 변경 내용 누적 중, 오류 또는 완료됨 (예약된 CDC 작업의 경우).
-
마지막 처리됨
테이블이 마지막으로 변경된 날짜 및 시간입니다.
-
삽입, 업데이트 및 삭제
정보 메모소스 데이터 집합이 필터링되면 삽입, 업데이트 및 삭제 열이 다음과 같이 그룹화됩니다.
-
읽기: 필터링하기 전에 소스 데이터 집합에서 읽은 변경 내용(삽입, 업데이트 및 삭제) 수입니다.
-
기록됨(필터링 후): 필터링 후 대상에 실제로 기록된 변경 내용(삽입, 업데이트 및 삭제) 수입니다.
데이터 집합 필터링에 대한 자세한 내용은 데이터 집합 필터링를 참조하십시오.
-
삽입
삽입 작업 수입니다.
-
업데이트
업데이트 작업 수입니다.
정보 메모업데이트는 SaaS 응용 프로그램 소스에 대한 삽입으로 처리됩니다. -
삭제
삭제 작업 수입니다.
-
-
DML(삽입/업데이트)
정보 메모소스 데이터 집합이 필터링되면 삽입, 업데이트 및 삭제 열이 다음과 같이 그룹화됩니다.
-
읽은 DML(삽입/업데이트): 필터링하기 전에 소스 데이터 집합에서 읽은 DML(삽입 및 업데이트) 수입니다.
-
기록된 DML(삽입/업데이트): 필터링 후 대상에 실제로 기록된 DML(삽입 및 업데이트) 수입니다.
데이터 집합 필터링에 대한 자세한 내용은 데이터 집합 필터링를 참조하십시오.
-
-
DDL 작업
DDL 작업 수
정보 메모"데이터 복제" 작업에만 사용할 수 있습니다. -
메시지
테이블 변경이 실패하고 처리되지 않은 경우 오류 메시지를 표시합니다.
온프레미스 소스에서 데이터를 랜딩하고 전체 로드 모드를 선택한 경우 랜딩 자산이 실행될 때 테이블이 자동으로 다시 로드됩니다.
온프레미스 소스에서 데이터를 랜딩하고 전체 로드 및 CDC 모드를 선택한 경우 초기 전체 로드 후 테이블이 새 데이터로 지속적으로 업데이트됩니다.
Reloading selected tables
소스에서 선택한 테이블을 수동으로 다시 로드할 수 있습니다. 이는 오류가 있는 단일 테이블을 복구하려는 경우에 유용합니다. 테이블을 다시 로드해도 CDC 타임라인에는 영향을 미치지 않으며, 테이블 다시 만들기를 사용하면 재설정됩니다. 테이블을 다시 로드할 때 메타데이터 변경 내용은 전파되지 않습니다.
-
선택한 테이블을 다시 로드하려면 모니터링의 아래쪽 절반에서 테이블을 선택하고 테이블 다시 로드를 클릭합니다.
데이터 작업을 실행하는 데 필요한 것과 동일한 권한, 즉 소유자 또는 작동 가능 역할이 필요합니다.
테이블 다시 로드는 데이터 작업의 첫 번째 실행 후에 사용할 수 있습니다. 업데이트 방법이 다시 로드 및 비교인 경우 데이터 작업이 실행 중일 때 테이블 다시 로드를 사용할 수 없습니다.
다운스트림 저장소 데이터 작업은 다음에 실행될 때 동기화됩니다. 저장소 작업에 기록이 활성화되어 있으면 유지됩니다.
테이블을 다시 로드하여 복구할 수 없는 경우 다음 단계는 데이터 작업을 복구하는 것입니다.
Reloading all tables to the target
특정 테이블을 다시 로드하여 해결할 수 없는 CDC 문제가 발생하는 경우 대상에 모든 테이블을 다시 로드할 수 있습니다. 문제의 예로는 누락된 이벤트, 소스 데이터베이스 재구성으로 인한 문제 또는 소스 데이터베이스 이벤트를 읽을 때의 실패가 있습니다.
- 데이터 작업과 이를 사용하는 모든 작업을 중지합니다.
-
데이터 작업을 열고 모니터링 탭을 선택합니다.
-
...를 클릭한 다음 대상 다시 로드를 클릭합니다.
그러면 Drop-Create를 사용하여 모든 테이블이 대상에 다시 로드되고 지금부터 모든 데이터 변경 내용 캡처가 다시 시작됩니다.
-
데이터 랜딩 작업을 소비하는 저장소 작업은 비교를 통해 다시 로드되고 다음 실행 시 적용되어 동기화됩니다. 기존 기록은 유지됩니다. 유형 2 기록은 다시 로드 및 비교 프로세스가 실행된 후 변경 내용을 반영하도록 업데이트됩니다.
유형 2 기록의 시작 날짜에 대한 타임스탬프는 다시 로드 날짜를 반영하며 반드시 소스에서 변경이 발생한 날짜는 아닙니다.
-
대상 다시 로드 작업 중에는 저장소가 동기화될 때까지 저장소 라이브 보기를 신뢰할 수 없습니다. 다음과 같은 경우 저장소가 완전히 동기화됩니다.
-
모든 테이블은 비교 및 적용을 사용하여 다시 로드됩니다.
-
각 테이블에 대해 한 번의 변경 주기가 수행됩니다.
-
Monitoring storage, transform, data mart, 미러, and knowledge mart tasks
저장소, 변환, 데이터 마트, 미러, 또는 지식 마트 작업의 상태와 진행률을 모니터링할 수 있습니다.
다음 모니터링 세부 정보를 사용할 수 있습니다.
-
정보
-
전체 로드
-
배치
정보 모니터링 세부 정보
작업, 실행 ID 및 데이터가 업데이트된 시기에 대한 일반 정보를 볼 수 있습니다.
전체 로드 모니터링 세부 정보
버튼으로 표시됩니다.전체 로드에서 데이터 작업에 대한 다음 통계를 볼 수 있습니다.
-
총 데이터 집합
로드된 데이터 집합 수입니다.
-
오류가 있는 데이터 집합
오류가 있는 데이터 집합 수입니다.
-
총 처리량
대상 처리량(KB/초)입니다. 이는 변경 레코드가 대상 엔드포인트에 로드되는 속도를 나타냅니다.
배치 모니터링 세부 정보
변경 내용 배치에 대한 통계를 볼 수 있습니다.
-
총 데이터 집합
로드된 데이터 집합 수입니다.
-
오류가 있는 데이터 집합
오류가 있는 데이터 집합 수입니다.
-
총 지연 시간
작업의 현재 지연 시간(hh:mm:ss)입니다. 이 기간은 소스에서 변경 내용을 사용할 수 있는 시점부터 변경 내용이 적용되어 대상 또는 랜딩에서 사용할 수 있을 때까지의 시간을 나타냅니다.
-
총 처리량
대상 처리량(KB/초)입니다. 이는 변경 레코드가 대상 엔드포인트에 로드되는 속도를 나타냅니다.
-
소스
소스의 지연 시간 및 처리량입니다.
-
대상
대상의 지연 시간 및 처리량입니다.
-
총 수신 변경 내용
소스에 존재하고 처리 대기 중인 변경 내용 수입니다. 소스에 누적된 수와 적용 중인 수를 볼 수 있습니다.
-
총 적용된 변경 내용
대상 또는 랜딩에 적용된 변경 내용 수입니다. 추가, 삭제 및 업데이트 수를 볼 수 있습니다.
Viewing status and progress
데이터 집합의 각 데이터 집합 또는 변경 내용에 대한 다음 세부 정보를 볼 수 있습니다.
-
이름
대상 데이터 집합의 이름입니다.
-
상태
테이블 상태는 대기 중, 로드 중, 완료됨 또는 오류 중 하나입니다.
-
시작됨
로드가 시작된 시간입니다.
-
종료됨
로드가 종료된 시간입니다.
-
기간
hh:mm:ss 형식의 로드 기간입니다.
-
레코드
로드 중에 대상에 기록된 레코드 수입니다.
정보 메모소스 데이터 집합이 필터링되면 레코드 가 다음 섹션으로 바뀝니다.
-
읽은 레코드: 필터링하기 전에 소스 데이터 집합에서 읽은 레코드 수입니다.
-
기록된 레코드(필터링 후): 필터링 후 대상에 실제로 기록된 레코드 수입니다.
데이터 집합 필터링에 대한 자세한 내용은 데이터 집합 필터링를 참조하십시오.
-
-
메시지
로드가 성공적으로 처리되지 않은 경우 오류 메시지를 표시합니다.
데이터 작업 업데이트 시간에 표시된 시간까지의 모든 소스 트랜잭션 데이터는 이 데이터 작업에서 사용할 수 있습니다. 이 정보는 모든 테이블이 로드되고 첫 번째 변경 내용 집합이 적용된 후 데이터 작업에 사용할 수 있습니다. 라이브 보기를 생성하도록 선택한 경우 라이브 보기가 업데이트되는 시기도 볼 수 있습니다.
초기 로드가 완료되기 전에 변경 내용 배치가 있는 경우 초기 로드가 완료되고 첫 번째 변경 내용 배치가 적용될 때까지 데이터 작업 업데이트 시간이 업데이트되지 않습니다. 예를 들어 100만 개의 주문이 포함된 주문 데이터 집합과 1,000만 개의 주문 세부 정보가 포함된 주문 세부 정보 데이터 집합이 포함된 데이터 자산을 로드한다고 가정해 보겠습니다. 데이터 집합은 전체 로드를 수행하는 데 각각 10분과 20분이 걸립니다. 주문 데이터 집합이 먼저 로드된 다음 주문 세부 정보 데이터 집합이 로드됩니다. 주문 데이터 집합이 로드되는 동안 새 주문이 삽입되었습니다. 따라서 주문 세부 정보가 로드될 때 주문 데이터 집합에 아직 존재하지 않는 새 주문의 세부 정보가 포함될 수 있습니다. 주문 및 주문 세부 정보 데이터 집합은 첫 번째 변경 내용 배치가 적용된 후에만 동기화되고 동일한 시간으로 완전히 업데이트됩니다.
Viewing detailed information
SQL 문 수준에서 세부 정보를 볼 수 있습니다.
-
자세히 모니터링할 데이터 집합을 선택합니다.
-
모니터링 세부 정보를 클릭합니다.
모니터링 세부 정보가 표시되며 로드 또는 변경 프로세스의 각 단계에 대해 실행되는 명령을 볼 수 있습니다. 명령을 클릭하여 실행된 전체 SQL 문을 볼 수 있습니다.
-
나열된 모든 명령에 대한 전체 SQL 문이 포함된 텍스트 파일을 내보내려면 CSV로 내보내기를 클릭합니다.
데이터 작업 업데이트 시간 for views
데이터 작업 업데이트 시간 필드에는 가장 오래된 보기가 업데이트된 시간이 표시됩니다.
-
Standard views
데이터 작업 업데이트 시간에는 가장 오래된 표준 보기가 업데이트된 시간이 표시됩니다.
예를 들어 작업에 Orders 및 Order details라는 두 개의 테이블이 있다고 가정해 보겠습니다. Orders는 10:00 및 10:01의 레코드로 10:01로 업데이트되고 Order details에는 10:00의 레코드만 있습니다. 이 경우 데이터 작업은 10:00로 업데이트됩니다. 이는 10:02에서 10:03일 수 있는 데이터 작업 로드의 시작 및 종료 시간과 혼동해서는 안 됩니다.
-
Live views (Storage data tasks)
데이터 작업 업데이트 시간에는 가장 오래된 라이브 보기가 업데이트된 시간이 표시됩니다.
예를 들어 작업에 Orders 테이블이 있다고 가정해 보겠습니다. 랜딩의 Orders는 10:00 및 10:01의 레코드로 10:01로 업데이트되지만 저장소의 Orders는 10:00의 레코드로만 업데이트됩니다. 이 경우 Orders에 대한 라이브 보기는 10:01로 업데이트되고 표준 보기는 10:00로 업데이트됩니다.
실행 기록 보기
태스크의 실행 기록을 보고 근본 원인을 파악하고 시간 경과에 따른 패턴을 이해할 수 있습니다.
-
태스크의 모니터 뷰에서 실행 기록을 클릭합니다.
-
모니터 뷰에 있는 태스크의 ... 메뉴에서 실행 기록을 클릭합니다.
필터 선택에 따라 실행 기록에 최대 100개의 실행이 표시됩니다. 다른 실행을 보려면 필터 기준을 세분화하십시오. 실행 종료일 및 태스크 상태를 기준으로 필터링할 수 있습니다. 실행 정보는 13개월 동안 보관됩니다. 실행의 데이터 세트 메타데이터는 30일 동안 보관됩니다.