데이터 마트 보기 구조
이 항목에서는 데이터 마트 보기의 내부 헤더 열(hdr__ 접두사로 식별 가능)에 대해 설명합니다. 데이터 파이프라인은 데이터를 별표 스키마로 비정규화하는 데이터 마트가 되는 경우가 많습니다. 팩트는 차원 모델링을 소비하여 분석가가 소비할 수 있는 편리한 구조를 제공합니다. 따라서 헤더 열의 역할을 이해하면 다운스트림 응용 프로그램에서 분석 및 사용을 위한 보다 집중적인 보고서를 생성할 수 있습니다.
팩트 보기
보기 이름 서식: <데이터 자산 스키마>.[<접두사>]<팩트>
다음 헤더 열이 보기 구조에 추가됩니다.
열 |
유형 |
설명 |
---|---|---|
hdr__deleted | 부울 |
팩트 테이블에서 레코드가 삭제되었는지 여부를 나타냅니다. |
hdr_{dimension-name}_key_id | int64 |
유형 1 및 유형 2 차원을 참조하십시오. 팩트 보기에는 팩트의 각 차원에 대한 별도의 열이 포함됩니다. 예: hdr__EMPLOYEES_key_id |
유형 1 차원 보기
보기 이름 서식: <데이터 자산 스키마>.[<접두사>]<차원>
다음 헤더 열이 보기 구조에 추가됩니다.
열 |
유형 |
설명 |
---|---|---|
hdr_{dimension-name}_key_id | int64 |
레코드당 증분되는 시퀀스입니다. |
hdr__deleted | 부울 |
레코드가 차원 테이블에서 삭제되었는지 여부를 나타냅니다. |
유형 2 차원 보기
보기 이름 서식: <내부 스키마>.[<접두사>]<차원>
다음 헤더 열이 보기 구조에 추가됩니다.
열 |
유형 |
설명 |
---|---|---|
hdr_{dimension-name}_key_id |
int64 |
레코드당 증분되는 시퀀스입니다. |
hdr__from_timestamp | timestamp |
이 버전의 레코드에 대한 UTC 시작 타임스탬프입니다. 예를 들어, 열은 고객이 특정 주소에서 살기 시작한 날짜를 나타낼 수 있습니다. 이 열을 사용하면 다음을 수행할 수 있습니다.
비정규화된 엔터티가 있는 유형 2 차원의 경우 저장소 또는 변환 데이터 자산에서 업데이트된 데이터 집합의 타임스탬프입니다. |
hdr__to_timestamp | timestamp |
레코드 버전의 UTC 종료 타임스탬프입니다. 열은 지정된 레코드 버전의 날짜 범위를 구분하는 데 사용됩니다. 예를 들어, 열은 고객이 특정 주소에서 더 이상 거주하지 않는 날짜를 나타낼 수 있습니다. 위의 hdr_from_timestamp 열에 대한 설명도 참조하십시오. |
hdr__operation | varchar(1) |
전체 로드 작업:
변경 처리 작업(변경 테이블 사용):
비교 및 적용 작업으로 인한 작업:
|
hdr__was_current_from_timestamp | timestamp |
레코드에 마지막 업데이트가 적용된 UTC 타임스탬프를 표시합니다. hdr__was_current_to_timestamp 열과 함께 이 열을 사용하면 당시 알고 있었던 것만 알고 특정 날짜별로 데이터를 분석할 수 있습니다. 예를 들어, 매일 오전 2시에 전날의 주문 합계를 계산한다고 가정해 보겠습니다. 따라서 12월 1일의 전일 주문 합계는 $1,000,000입니다. 그런데 12월 2일에는 11월 30일에 총 $500,000의 주문이 들어왔다는 레코드가 삽입되어 있습니다. 그래서 11월 30일의 주문 금액은 실제로 $1,500,000였습니다! 그러나 12월 1일 오전 2시에 현재를 기준으로 11월 30일의 총 주문 합계에 대한 보고서를 생성하면 결과는 여전히 $1,000,000가 됩니다. |
hdr__was_current_to_timestamp | timestamp |
이 열은 레코드가 최신 레코드로 바뀔 때 채워집니다. 레코드가 처리된 시간의 UTC 타임스탬프를 표시하므로 더 이상 최신 레코드가 아닙니다. 위의 hdr__was_current_from_timestamp 열에 대한 설명도 참조하십시오. |