기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

데이터 마트 만들기 및 관리

데이터를 온보딩하고 나면 저장소 또는 변환 작업의 데이터를 사용하여 데이터 마트를 만들 수 있습니다. 비즈니스 요구 사항에 따라 데이터 마트를 원하는 수만큼 만들 수 있습니다. 이상적으로는 데이터 마트에 영업 부서와 같은 조직 내의 특정 섹션 또는 단위에 대한 분석을 위해 수집된 요약 데이터의 리포지토리가 포함되어야 합니다.

정보 메모Qlik Talend Cloud 프리미엄 또는 Qlik Talend Cloud 엔터프라이즈 구독을 통해 데이터 마트를 만들 수 있습니다.

데이터 마트를 만드는 절차는 데이터 마트가 저장소 작업을 기반으로 하는지 또는 변환 작업을 기반으로 하는지에 관계없이 동일합니다. 이 섹션의 지침에서는 데이터 마트가 저장소 작업을 기반으로 한다고 가정합니다.

정보 메모데이터 작업은 해당 작업이 속한 프로젝트 소유자의 컨텍스트에서 작동합니다. 필수 역할 및 권한에 대한 자세한 내용은 데이터 공간 역할 및 권한을 참조하십시오.

전제 조건

데이터 마트를 만들기 전에 다음을 수행해야 합니다.

  • 데이터 마트에서 사용하려는 데이터(랜딩에서)로 저장소를 채웁니다. 자세한 내용은 데이터 온보딩을 참조하십시오.
  • 데이터 집합 관계형 모델을 만들어 소스 데이터 집합 간의 관계를 정의합니다. 자세한 내용은 데이터 모델 만들기을 참조하십시오.

    경고 메모모든 소스 데이터 집합에는 키가 있어야 합니다.

데이터 마트 만들기

데이터 마트를 만들려면:

  1. 프로젝트를 엽니다.

  2. 다음 중 하나를 수행합니다.

    • 오른쪽 위의 만들기를 클릭하고 데이터 마트 만들기를 선택합니다.
    • 저장소 데이터 작업에서 오른쪽 아래에 있는 를 클릭한 다음 데이터 마트 만들기를 선택합니다.

    데이터 마트 만들기 대화 상자가 열립니다.

  3. 데이터 마트의 이름을 제공하고 선택적으로 설명도 제공합니다.

  4. 나중에 데이터 마트를 구성하려면 열기 확인란의 선택을 해제한 다음 만들기를 클릭합니다. 그렇지 않으면 만들기를 클릭합니다.

    데이터 마트는 데이터 마트 탭에서 열립니다.

  5. 소스 데이터 선택에 설명된 대로 소스 데이터를 선택합니다.
  6. 데이터 마트에 차원이 포함되도록 하려면 데이터 마트에 차원 및 팩트 추가에 설명된 대로 차원을 추가합니다.
  7. 데이터 마트에 팩트가 포함되도록 하려면 팩트 추가에 설명된 대로 팩트를 추가합니다.
  8. 데이터 마트에 차원과 팩트가 모두 포함되어 있으면 별표 스키마 구축에 설명된 대로 별표 스키마에 차원을 추가합니다.
  9. 데이터 마트에서 데이터 집합을 만들고 데이터 마트 채우기에 설명된 대로 데이터로 채웁니다.

소스 데이터 선택

저장소 데이터 작업의 데이터 집합에서 소스 데이터를 선택합니다.

수행할 작업:

  1. 탭 중간에 있는 소스 데이터 선택 버튼을 클릭하거나 소스 데이터 선택 도구 모음 버튼을 클릭합니다.

    소스 데이터 선택 대화 상자가 열립니다.

  2. 데이터 자산 드롭다운 목록에서 저장소 작업 또는 변환을 만든 경우 변환 작업을 선택합니다.

  3. 모든 데이터 집합을 검색하려면 기본값 %를 그대로 두거나 찾을 특정 데이터 집합의 이름을 입력합니다. 그런 다음 검색을 클릭합니다.

  4. 원하는 데이터 집합을 선택한 다음 선택한 테이블 추가를 클릭합니다.

  5. 확인을 클릭하여 대화 상자를 닫은 다음 팩트 추가 및/또는 차원 추가를 진행합니다.

정보 메모프로세스를 반복하여 다른 데이터 작업의 데이터 집합을 추가할 수 있습니다.

데이터 마트에 차원 및 팩트 추가

소스 데이터를 선택했으면 데이터 마트 구축을 진행할 수 있습니다. 데이터 마트에는 팩트 데이터 집합, 차원 데이터 집합 또는 둘의 조합이 있을 수 있습니다(여기서 차원 데이터 집합은 팩트 데이터 집합과 논리적으로 관련됨).

차원 추가

차원을 추가하려면

  1. 차원 추가 버튼을 클릭합니다.

    차원 추가 대화 상자가 열립니다.

  2. 다음 설정을 사용할 수 있습니다.

    • 가장 세분화된 데이터 집합: 데이터 집합을 선택합니다.
    • 이름: 차원의 표시 이름을 지정합니다. 기본값은 가장 세분화된 데이터 집합 이름입니다.
    • 설명: 선택적으로 설명을 제공합니다.
    • 기록 유형: 다음 중 하나를 선택합니다.
      • 유형 1: 저장소의 해당 레코드가 업데이트될 때마다 차원의 기존 레코드가 업데이트됩니다.
      • 유형 2: 저장소의 해당 레코드가 업데이트될 때마다 새 레코드가 차원에 추가됩니다.
    • 비정규화할 관련 데이터 집합: 차원 데이터 집합에서 비정규화할 수 있는 모든 데이터 집합(소스 데이터 자산 모델의 관계에 따라)은 여기에서 선택할 수 있습니다.

       

      비정규화할 수 있는 차원의 예

      관련 차원이 있는 차원의 예

  3. 확인을 클릭하여 설정을 저장합니다.

    차원이 왼쪽의 차원 목록에 추가됩니다.

롤 플레잉 차원을 참조하십시오.

차원에 대한 정보 보기

차원을 선택하면 소스 관계형 모델 탭이 가운데 창에 표시됩니다. 이 탭에는 차원에 통합된 소스 데이터 집합이 표시됩니다. 차원을 추가할 때 비정규화하도록 선택한 데이터 집합은 선택된 것으로 표시되고 회색으로 표시됩니다.

범주공급업체 데이터 집합으로 비정규화된 제품 차원

팩트 추가

팩트를 추가하려면:

  1. 팩트 추가 버튼을 클릭합니다.

    팩트 추가 대화 상자가 열립니다.

  2. 다음 설정을 사용할 수 있습니다.

    • 팩트: 팩트가 될 데이터 집합을 선택합니다. 데이터 집합은 만드는 중인 팩트의 세분성을 정의해야 합니다.
    • 이름: 팩트의 표시 이름을 지정합니다. 기본값은 팩트 이름입니다.
    • 설명: 선택적으로 설명을 제공합니다.
    • 비정규화할 관련 데이터 집합: 팩트 데이터 집합에서 비정규화할 수 있는 모든 데이터 집합을 여기에서 선택할 수 있습니다.
    • 고급
      • 현재 데이터 사용: 선택하면(기본값) 팩트에 트랜잭션 날짜 열이 포함되지 않습니다.
      • 트랜잭션 날짜 선택: 특정 트랜잭션 날짜에 따라 데이터를 찾으려면 이 옵션을 선택한 다음 날짜 열을 선택합니다. 이는 별표 스키마에 유형 2 차원이 포함되어 있고 특정 트랜잭션에 대한 올바른 데이터를 찾아야 하는 경우에 유용합니다. 예를 들어, 고객의 주소가 여러 개인 경우 주문 날짜에 따라 올바른 주소를 찾을 수 있습니다.

        사용 사례 예:

        판매점은 주문과 고객 간의 관계를 분석하기 위해 데이터 마트를 만들어야 합니다. 데이터 마트는 다음과 같은 질문에 답할 수 있어야 합니다. 2022년 4분기에 주문량이 가장 많은 미국 주는 어디입니까?

         

        판매점이 현재 데이터 사용 옵션을 선택하면 Customers 테이블의 최신 레코드 버전만 계산에 포함됩니다.

        트랜잭션 날짜를 무시하면 아래 그림과 같이 부정확한 데이터가 생성됩니다.

         

        현재 데이터 사용이 선택된 경우 주문 팩트 테이블과 고객 차원 간의 관계를 표시합니다.

         

        그러나 판매점이 트랜잭션 날짜 선택 옵션을 선택하면 고객의 주문이 Customers 테이블의 올바른 레코드 버전과 연결됩니다.

        이를 통해 판매점은 2022년 4분기 주당 총 주문 합계를 정확하게 계산할 수 있습니다.

         

        트랜잭션 날짜 사용을 선택한 경우 주문 팩트 테이블과 고객 차원 간의 관계를 표시합니다.

        팁 메모트랜잭션 날짜는 비즈니스 요구에 따라 각 데이터 마트에서 다르게 활용될 수 있습니다. 예를 들어, 한 데이터 마트에서는 주문 날짜를 분석하는 데 사용할 수 있고 다른 데이터 마트에서는 배송 날짜를 분석하는 데 사용할 수 있습니다.
  3. 확인을 클릭하여 설정을 저장합니다.

    팩트는 왼쪽의 팩트 목록에 추가됩니다.

팩트에 대한 정보 보기

팩트를 선택하면 중앙 창에 다음 탭이 표시됩니다.

  • 별표 스키마 모델(기본값): 데이터 마트 내 데이터 집합 관계의 그래픽 표현을 표시합니다.
  • 팩트 모델: 팩트 데이터 집합과 관련된 모든 데이터 집합을 보여 줍니다. 팩트를 추가할 때 비정규화하기 위해 선택한 데이터 집합은 선택된 것으로 표시되고 회색으로 표시됩니다.

     

    비정규화된 주문 데이터 집합이 있는 주문 세부 정보 팩트

  • 트랜잭션 날짜: 팩트를 추가할 때 트랜잭션 날짜 선택 옵션을 선택한 경우 트랜잭션 열의 이름입니다.

알려지지 않은 차원 처리 및 늦게 도착한 차원 처리

각 차원에는 차원의 비즈니스 키(개체 ID)인 -10 행이 포함됩니다. 행 -1은 늦게 도착한 차원에 예약되어 있고, 0은 알 수 없는 차원에 예약되어 있습니다.

알 수 없는 차원

"알 수 없음"은 차원이 처음 만들어졌을 때 사용할 수 없었던 데이터입니다. 예를 들어, SHIPPER 차원에 대한 비즈니스 키인 SHIPPER 열이 있는 ORDER 팩트가 있다고 가정해 보겠습니다. ORDER 팩트 행이 아직 배송되지 않았고 SHIPPER 열에 NULL이 있는 경우, 차원에 대해 알 수 없음을 나타내는 0 레코드와 관련됩니다. ORDER 팩트가 나중에 SHIPPER 값(예: USPS)으로 업데이트되면 관련 차원 ID(0)도 차례로 업데이트됩니다.

정보 메모"알 수 없음"은 누락되었거나 존재하지 않는 데이터일 수도 있으며, 이러한 데이터는 추가되지 않을 수도 있습니다.

늦게 도착한 차원

늦게 도착한 차원에는 새 팩트 데이터에 존재하지만 차원에는 아직 존재하지 않는 키가 있습니다. 예를 들어, ORDER 팩트의 SHIPPER에 새 운송업체에 대한 "NEWSHIP" 값이 있고 해당 비즈니스 키가 DIM_SHIPPER 차원에 아직 없는 경우 데이터 마트 처리에서는 해당 팩트를 -1 행과 연관합니다. 이는 차원 테이블에 차원 구성원이 누락되었음을 나타냅니다. DIM_SHIPPER 차원에 대한 "NEWSHIP" 비즈니스 키가 도착하면 차원 행이 만들어지고, 이전에 누락된 차원에 맞춰 팩트 레코드가 업데이트됩니다.

별표 스키마 구축

데이터 마트에 차원을 추가한 후에는 이를 팩트 데이터 집합에 연결하여 별표 스키마를 만들 수 있습니다.

수행할 작업:

  1. 왼쪽의 팩트 목록에서 팩트를 선택합니다.
  2. 오른쪽의 권장 차원 목록에서 추가할 차원을 선택합니다.

    권장 차원은 점선으로 팩트 데이터 집합에 연결되어 표시됩니다.

    아래 이미지에서 일부 차원은 이전에 추가되었으므로 회색 실선으로 연결됩니다.

  3. 적용을 클릭하여 차원을 추가합니다.

    차원은 회색 실선으로 팩트 데이터 집합에 연결되어 표시됩니다.

  4. 권장 크기 패널을 닫으려면 을 클릭합니다.

데이터 마트 채우기

데이터 마트를 설계했으면 계속 채울 수 있습니다.

수행할 작업:

  1. 오른쪽 상단에 있는 준비 도구 모음 버튼을 클릭합니다.

    준비 프로세스에는 데이터 마트에서 데이터 집합 및 보기 만들기 및 카탈로그 업데이트가 포함됩니다.

    화면 하단의 준비 진행률에서 진행률을 확인할 수 있습니다.

    준비가 완료되면 준비 버튼이 실행으로 변경됩니다.

  2. 선택적으로 아래 데이터 마트 유효성 검사 및 동기화에 설명된 대로 데이터 마트의 유효성을 검사합니다.

  3. 실행 버튼을 클릭합니다.

    창이 데이터 마트에 있는 데이터 집합의 로드 진행률 및 상태를 보여 주는 모니터링 보기로 전환됩니다.

모든 소스 레코드는 삭제된 레코드를 포함하여 데이터 마트에서 처리됩니다. 이는 기록 정보가 유지되도록 하기 위해 수행됩니다.

정보 메모유형 2 기록이 있는 차원 데이터 집합의 경우 처리된 레코드 수에는 레코드의 모든 버전 행이 포함되며 처리된 실제 레코드 수보다 높은 값을 표시합니다.

데이터 마트 유효성 검사 및 동기화

데이터 마트의 유효성을 검사하면 데이터 마트 메타데이터가 저장소(또는 정의된 경우 변환)의 해당 메타데이터와 동일한지 유효성을 검사됩니다. 데이터 마트의 유효성을 검사하면 만들어진 메타데이터를 현재 별표 스키마 설계과 비교하기도 합니다. 예를 들어, 이미 만들어진 데이터 마트에 차원을 추가한 후 유효성 검사를 실행하면 유효성 검사가 실패합니다.

데이터 마트의 유효성을 검사하려면:

  1. 실행 버튼 오른쪽에 있는 메뉴에서 데이터 집합 유효성 검사를 선택하거나 창 오른쪽 아래에 있는 데이터 집합 유효성 검사 버튼을 클릭합니다.

    유효성 검사 완료 메시지가 표시됩니다.

  2. 메타데이터가 동기화되지 않았거나 별표 스키마 설계 충돌이 있는 경우 창 하단에 있는 유효성 검사 및 조정 창이 유효성 검사 보고서와 함께 자동으로 열립니다.

  3. 보류 중인 설계 변경 문제를 해결하려면 오른쪽 위의 버튼을 클릭하고 준비를 선택합니다. 데이터 손실 없이 변경 가능 열의 값이 인 경우 ALTER 작업이 수행됩니다. 그렇지 않으면 데이터 마트 테이블이 다시 만들어집니다.

    모든 유효성 검사 오류는 수동으로 해결해야 합니다.

데이터 마트 관리

이 섹션에서는 데이터 집합 및 데이터 마트를 관리하는 데 사용할 수 있는 다양한 옵션에 대해 설명합니다.

팩트 또는 차원 구체화

데이터 집합 탭에서 변환 규칙 만들기(예: 열 값 바꾸기) 및 열 수준 표현식 추가와 같은 다양한 작업을 수행하여 팩트와 차원을 구체화할 수 있습니다. 데이터 집합 탭은 데이터 마트 탭의 오른쪽에 있습니다.

데이터 집합 탭

팩트 및 차원 데이터 집합을 관리하기 위한 데이터 집합 탭

규칙 추가

전역 규칙을 추가하는 방법에 대한 설명은 데이터 집합을 변환하는 규칙 만들기를 참조하십시오.

정보 메모규칙 및 데이터 집합에서 수행할 수 있는 기타 작업에 대한 자세한 내용은 데이터 집합 관리를 참조하십시오. 데이터 마트 데이터 작업에는 데이터 집합 필터링 및 이름 바꾸기와 같은 일부 옵션을 사용할 수 없습니다.

새로운 열 추가

대상 데이터 집합에 새로운 열을 추가할 수 있습니다.

  • + 추가를 클릭합니다.

    열의 이름을 지정하고 열 데이터를 정의하는 표현식을 설정합니다.

    자세한 내용은 데이터 집합에 열 추가을 참조하십시오.

  • 추가 옆에 있는 아래을 클릭하고 소스에서 열 추가를 선택합니다.

    소스 데이터 집합에서 열을 선택합니다.

열 순서 변경

열의 서수적 위치를 변경할 수 있습니다.

  1. 열을 선택합니다.

  2. 더 보기을 클릭한 다음 순서 변경을 클릭합니다.

  3. 화살표를 사용하여 열을 위아래로 이동합니다.

  4. 준비가 되면 서수 변경을 닫으십시오.

롤 플레잉 차원

롤 플레잉 차원은 동일한 별표 스키마 내에서 여러 번 사용되지만 의미가 다른 동일한 차원입니다. 이는 일반적으로 날짜 및 고객 차원에서 볼 수 있습니다. 예를 들어, 별표 스키마에는 두 개의 날짜 엔터티가 있을 수 있습니다. 하나는 주문 날짜를 나타내고 다른 하나는 받은 날짜를 나타냅니다.

차원의 역할 이름을 추가하거나 편집하려면 다음을 수행합니다.

  1. 차원 노드에서 아이콘을 클릭하고 역할 편집을 선택합니다.
  2. 역할 편집 대화 상자에서 별표 스키마의 역할 이름 필드에 이름을 입력하거나 기존 이름을 편집하고 확인을 클릭합니다.

    역할 이름은 차원 이름 아래에 나타납니다.

추가 관리 옵션

다음 표에서는 추가 관리 옵션에 대해 설명합니다.

대상수행 작업
소스 데이터 집합 추가소스 데이터 선택를 참조하십시오.
팩트 추가팩트 추가 참조
차원 추가데이터 마트에 차원 및 팩트 추가를 참조하십시오.
차원 삭제 차원 창에서 차원을 선택한 다음 메뉴에서 삭제를 선택합니다.
팩트 삭제팩트 창에서 팩트를 선택한 다음 메뉴에서 삭제를 선택합니다.
데이터 마트 다시 만들기 오른쪽 위의 버튼을 클릭하고 테이블 다시 만들기를 선택합니다. 예를 들어, 데이터 마트에 자동으로 동기화할 수 없는 저장소에 변경 내용이 있는 경우 데이터 마트를 다시 만들어야 할 수 있습니다.
실행 중인 데이터 마트 작업 중지오른쪽 상단에 있는 중지 버튼을 클릭합니다.
데이터 마트 작업 준비

오른쪽 위의 버튼을 클릭하고 준비를 선택하여 데이터 집합을 변환 또는 저장소 자산과 동기화하고 설계 충돌을 해결합니다. 이는 실행을 위한 작업을 준비합니다. 여기에는 다음이 포함됩니다.

  • 설계가 유효한지 유효성을 검사합니다.

  • 설계와 일치하도록 물리적 테이블과 뷰를 만들거나 변경합니다.

  • 데이터 작업에 대한 SQL 코드 생성.

  • 작업 출력 데이터 집합에 대한 카탈로그 항목 만들기 또는 변경.

화면 하단의 준비 진행률에서 진행률을 확인할 수 있습니다.

데이터 마트 작업 예약

정기적으로 업데이트되도록 데이터 마트 작업을 예약할 수 있습니다. 시간 기반 일정을 설정하거나, 입력 데이터 작업 실행이 완료되면 실행되도록 작업을 설정할 수 있습니다.

데이터 작업에서 ...을 클릭하고 예약을 선택하여 일정을 만듭니다. 기본 일정 설정은 프로젝트의 설정에서 상속됩니다. 기본 설정에 대한 자세한 내용은 데이터 마트 기본값을 참조하십시오.

일정을 활성화하려면 예약사용으로 설정해야 합니다.

시간 기반 일정

시간 기반 일정을 사용하여 다른 입력 소스가 업데이트되는 시기에 관계없이 작업을 실행할 수 있습니다.

  • 데이터 작업 실행에서 특정 시간에를 선택합니다.

시간별, 일별, 주별 또는 월별 일정을 설정할 수 있습니다.

이벤트 기반 일정

입력 데이터 작업 실행이 완료되면 이벤트 기반 일정을 사용하여 작업을 실행할 수 있습니다.

  • 데이터 작업 실행에서 특정 이벤트에를 선택합니다.

입력 작업이 성공적으로 완료된 경우 또는 선택한 입력 작업이 성공적으로 완료된 경우 작업을 실행할지 여부를 선택할 수 있습니다.

정보 메모일정이 트리거될 때 입력 작업 또는 다운스트림 작업이 실행 중인 경우 작업이 실행되지 않습니다. 예약된 다음 실행까지 작업을 건너뜁니다.

데이터 다시 로드

데이터를 수동으로 다시 로드할 수 있습니다. 이는 하나 이상의 테이블에 문제가 있는 경우 유용합니다.

  1. 데이터 작업을 열고 모니터링 탭을 선택합니다.

  2. 다시 로드할 테이블을 선택합니다.

    다시 로드하기 위해 차원을 선택하면 무결성을 유지하기 위해 해당 차원을 사용하는 모든 팩트도 다시 로드됩니다.

  3. 테이블 다시 로드를 클릭합니다.

다시 로드 취소를 클릭하면 다시 로드 대기 중인 테이블의 다시 로드를 취소할 수 있습니다. 이는 이미 다시 로드된 테이블에는 영향을 미치지 않으며 현재 실행 중인 다시 로드가 완료됩니다.

다시 로드는 다음을 통해 수행됩니다.

  1. 선택한 차원 및 팩트를 자릅니다.

  2. 업스트림 데이터 작업에서 선택한 차원 테이블을 로드합니다.

  3. 업스트림 데이터 작업에서 팩트 테이블을 로드합니다. 여기에는 다음이 포함됩니다.

    • 명시적으로 선택된 팩트 테이블.

    • 다시 로드된 차원과 관련된 팩트 테이블.

정보 메모차원 x와 관련 팩트 a를 다시 로드한 다음 차원 x를 사용하여 새 팩트 b를 만들면 팩트 b가 자동으로 다시 로드되지 않습니다. 새 팩트 b를 수동으로 다시 로드해야 합니다.

데이터 마트 설정

설정 도구 모음 버튼을 클릭하여 설정: <데이터 마트 이름> 대화 상자를 엽니다.

경고 메모작업이 이미 실행된 경우 런타임 설정 이외의 설정을 변경하려면 데이터 집합을 다시 만들어야 합니다.

일반 설정

일반 탭에서는 다음 설정을 사용할 수 있습니다.

  • 데이터베이스: 데이터 마트가 만들어지는 데이터베이스입니다.
  • 데이터 작업 스키마: 데이터 집합이 만들어지는 스키마입니다.
  • 내부 스키마: 내부 데이터 집합이 만들어지는 스키마입니다.
  • 모든 테이블 및 보기에 대한 접두사

    이 작업으로 만들어진 모든 테이블 및 뷰에 대한 접두사를 설정할 수 있습니다.

    정보 메모여러 데이터 작업에서 데이터베이스 스키마를 사용하려는 경우 고유한 접두사를 사용해야 합니다.

런타임 설정

런타임 탭에서는 다음 설정을 사용할 수 있습니다.

  • 병렬 실행: Qlik Cloud가 작업에 대해 열 수 있는 최대 데이터베이스 연결 수를 입력합니다. 기본 숫자는 10입니다.
  • 웨어하우스: Snowflake에만 해당됩니다. Snowflake 데이터 웨어하우스의 이름입니다.

카탈로그 설정

  • 카탈로그에 게시

    이 버전의 데이터를 카탈로그에 데이터 집합으로 게시하려면 이 옵션을 선택합니다. 다음에 이 작업을 준비하면 카탈로그 콘텐츠가 업데이트됩니다.

카탈로그에 대한 자세한 내용은 카탈로그 도구를 사용하여 데이터 이해를 참조하십시오.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!