데이터 집합 관리 | Qlik Cloud 도움말
기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

데이터 집합 관리

랜딩, 스토리지, 변환, 데이터 마트, 스트리밍 랜딩, 스트리밍 변환복제 데이터 작업에 포함된 데이터 집합을 관리하여 변환을 생성하고, 데이터를 필터링하고, 열을 추가할 수 있습니다.

포함된 데이터 집합은 디자인 뷰의 데이터 집합 아래에 나열됩니다. 열 선택기(열 선택기)를 사용하여 표시할 열을 선택할 수 있습니다.

데이터 작업의 디자인 뷰에 있는 데이터 집합

데이터 작업의 디자인 뷰에 있는 데이터 집합
video thumbnail

변환 규칙 및 명시적 변환

전역 및 명시적 변환을 모두 수행할 수 있습니다.

변환 규칙

범위에서 %를 와일드카드로 사용하여 일치하는 모든 데이터 집합에 적용하는 변환 규칙을 생성하여 전역 변환을 수행할 수 있습니다.

변환 규칙은 영향을 받는 속성의 짙은 보라색 모서리로 표시됩니다.

명시적 변환

명시적 변환은 다음과 같은 경우에 생성됩니다.

  • 편집을 사용하여 열 속성을 변경할 때

  • 데이터 집합에서 이름 바꾸기를 사용할 때

  • 열을 추가할 때

명시적 변환은 전역 변환을 재정의하며 영향을 받는 속성의 연한 보라색 모서리로 표시됩니다.

데이터 집합 모델

데이터 집합은 작업 유형 및 작업 내의 연산에 따라 소스 기반 또는 대상 기반일 수 있습니다. 사용된 데이터 집합 모델은 소스 변경 시 파이프라인의 동작과 수행할 수 있는 연산에 영향을 미칩니다.

  • 데이터 집합은 소스 데이터 집합을 기반으로 하며 메타데이터의 변경 사항만 유지합니다. 소스 데이터의 변경 사항이 자동으로 적용되어 모든 다운스트림 작업에 변경이 발생할 수 있습니다. 열 순서를 변경하거나 소스 데이터 집합을 변경할 수 없습니다.

    다음 작업 유형은 항상 소스 기반 데이터 집합 모델을 사용합니다. 랜딩, 스토리지, 등록된 데이터, 복제 및 데이터 레이크의 랜딩.

  • 데이터 집합은 대상 메타데이터를 기반으로 합니다. 소스에서 열이 추가되거나 제거되더라도 다음 다운스트림 작업에 자동으로 적용되지 않습니다. 열 순서를 변경하고 소스 데이터 집합을 변경할 수 있습니다. 즉, 작업이 더 독립적이며 소스 변경의 영향을 제어할 수 있습니다.

    다음 작업 유형은 대상 기반 데이터 집합 모델을 사용할 수 있습니다. 변환, 데이터 마트. 연산에 따라 변환 작업에 소스 기반 모델이 사용되는 경우도 있습니다.

    • SQL 변환 또는 변환 흐름이 열 선택을 수행하는 경우 데이터 집합은 대상 기반이 됩니다. 예를 들어 SQL 변환에서 SELECT A, B, C from XYZ를 사용하거나 변환 흐름에서 열 선택 프로세서를 사용하는 경우입니다.

    • 기본 열이 유지되는 경우 데이터 집합은 소스 기반입니다. 예를 들어 SQL 변환에서 SELECT * from XYZ를 사용하는 경우입니다.

소스 기반 모델에서 대상 기반 모델로 프로젝트 업데이트

기존 프로젝트는 해당되는 경우 대상 기반 데이터 집합 모델로 업데이트됩니다. 프로젝트를 처음 열 때 업데이트 프로세스에 대한 안내를 받게 됩니다. 데이터 집합 모델이 다른 프로젝트를 가져오고 내보낼 때 몇 가지 고려 사항이 있습니다.

  • 소스 기반 모델이 있는 프로젝트를 대상 기반 모델이 있는 프로젝트로 가져올 수 없습니다.

    소스 기반 모델이 있는 프로젝트를 새 프로젝트로 가져오고, 새 프로젝트를 업데이트한 다음, 결과 프로젝트를 내보냅니다. 이제 이 프로젝트를 대상 기반 모델이 있는 프로젝트로 다시 가져올 수 있습니다.

  • 대상 기반 모델이 있는 프로젝트를 소스 기반 모델이 있는 프로젝트로 가져올 수 없습니다.

    대상 기반 모델이 있는 프로젝트를 가져오기 전에 프로젝트를 대상 기반 모델로 업데이트하십시오.

데이터 집합 필터링

정보 메모데이터 집합을 필터링하는 기능은 Qlik 데이터 게이트웨이 - 데이터 이동를 통해 데이터를 랜딩하는 랜딩 데이터 작업, 스토리지 및 변환 데이터 작업에서 사용할 수 있습니다.

필요한 경우 데이터를 필터링하여 행의 하위 집합을 생성할 수 있습니다.

  • 필터를 클릭합니다.

자세한 내용은 데이터 집합 필터링를 참조하십시오.

데이터 집합 이름 바꾸기

데이터 집합의 이름을 바꿀 수 있습니다.

  • 데이터 집합에서 자세히를 클릭한 다음 편집을 클릭합니다.

열 추가

필요한 경우 행 수준 변환을 사용하여 열을 추가할 수 있습니다.

  • 열 추가를 클릭합니다.

자세한 내용은 데이터 세트에 열 추가를 참조하십시오.

열 편집

열을 선택하고 편집을 클릭하여 열 속성을 편집할 수 있습니다.

  • 이름

  • 열을 기본 키로 설정합니다. 열에서 선택하거나 선택 취소하여 키를 설정할 수도 있습니다.

  • Null 허용

  • 데이터 유형

    열의 데이터 유형을 설정합니다. 일부 데이터 유형의 경우 추가 속성(예: 길이)을 설정할 수 있습니다.

    정보 메모열의 데이터 유형 또는 데이터 유형 크기를 변경하면 데이터 집합을 사용하는 작업에 영향을 미칠 수 있습니다. 자세한 내용은 데이터 유형 관리를 참조하십시오.

열 제거

데이터 집합에서 하나 이상의 열을 제거할 수 있습니다.

  • 제거할 열을 선택하고 제거를 클릭합니다.

제거된 열을 보려면 제거된 열 표시를 클릭합니다. 제거된 열은 취소선 텍스트로 표시됩니다. 제거된 열을 선택하고 되돌리기를 클릭하여 검색할 수 있습니다.

팁 메모추가된 열을 제거하려면 해당 열을 선택하고 되돌리기를 클릭합니다.

열에 대한 명시적 변경 사항 되돌리기

하나 이상의 열에 대한 모든 명시적 변경 사항을 되돌릴 수 있습니다.

  • 변경 사항을 되돌릴 열을 선택하고 되돌리기를 클릭합니다.

전역 변환 규칙의 변경 사항은 되돌려지지 않습니다.

추가된 열을 되돌리면 해당 열이 제거됩니다.

데이터 집합 설정

데이터 집합에 대한 설정을 변경할 수 있습니다. 기본 설정은 데이터 작업의 설정을 상속하는 것이지만 설정을 명시적으로 켜기 또는 끄기로 변경할 수도 있습니다.

  • 데이터 집합에서 자세히를 클릭한 다음 설정을 클릭합니다.

데이터 보기

데이터 파이프라인을 설계할 때 데이터의 샘플을 확인하여 데이터의 형태를 보고 검증할 수 있습니다.

다음 요구 사항을 충족해야 합니다.

  • 관리 활동 센터의 테넌트 수준에서 데이터 보기가 활성화되어 있습니다.

    활성화하려면 설정 페이지로 이동하여 기능 제어 탭을 선택하고 데이터 통합에서 데이터 보기를 켭니다.

  • 연결이 있는 공간에서 데이터 보기 가능 역할이 할당되었습니다.

  • 프로젝트가 있는 공간에서 보기 가능 역할이 할당되었습니다.

정보 메모개인 공간에 프로젝트와 연결이 생성된 경우 소유자는 항상 데이터를 볼 수 있습니다.

샘플 데이터 보기

디자인 뷰의 데이터 집합 탭에서 샘플 데이터를 보려면 다음을 수행합니다.

  • 물리적 개체에서 데이터 보기를 클릭합니다.

데이터의 샘플이 표시됩니다. 행 수를 사용하여 샘플에 포함할 데이터 행 수를 설정할 수 있습니다.

데이터 집합과 테이블 간 변경

데이터 집합과 테이블 간에 변경하려면 다음을 수행합니다.

  • 데이터의 논리적 표현을 보려면 데이터 집합을 선택합니다.

  • 데이터베이스의 물리적 표현을 테이블 및 뷰로 보려면 물리적 개체를 선택합니다.

    뉴스 메모물리적 표현이 아직 생성되지 않은 경우 이 옵션을 사용할 수 없습니다.

필터링

두 가지 방법으로 샘플 데이터를 필터링할 수 있습니다.

  • 필터를 사용하여 검색할 샘플 데이터를 필터링합니다.

    예를 들어 ${OrderYear}2023 필터를 사용하고 행 수가 10으로 설정된 경우 2024년의 주문 10개 샘플을 얻게 됩니다.

  • 특정 열을 기준으로 샘플 데이터를 필터링합니다.

    이는 기존 샘플 데이터에만 영향을 미칩니다. 필터를 사용하여 2024년의 주문만 포함하고 2022년의 주문을 표시하도록 열 필터를 설정한 경우 결과는 빈 샘플이 됩니다.

정렬

특정 열을 기준으로 데이터 샘플을 정렬할 수도 있습니다. 정렬은 기존 샘플 데이터에만 영향을 미칩니다. 필터를 사용하여 2024년의 주문만 포함하고 정렬 순서를 반전시킨 경우 샘플 데이터에는 여전히 2024년의 주문만 포함됩니다.

열 숨기기

데이터 뷰에서 열을 숨길 수 있습니다.

  • 열에서 자세히를 클릭한 다음 열 숨기기를 클릭하여 단일 열을 숨깁니다.

  • 아무 열에서나 자세히를 클릭한 다음 열 표시를 클릭하여 여러 열을 숨깁니다. 이를 통해 뷰의 모든 열에 대한 가시성을 제어할 수 있습니다.

샘플 데이터 다운로드

표시된 샘플 데이터를 다운로드할 수 있습니다.

  • 다운로드를 클릭하여 샘플 데이터 뷰의 내용을 다운로드합니다.

샘플 데이터는 브라우저 다운로드에 CSV 파일로 다운로드됩니다.

데이터 집합 검증 및 조정

데이터 작업에 포함된 모든 데이터 집합을 검증할 수 있습니다.

모든 검증 오류 및 디자인 변경 사항을 보려면 검증 및 조정을 확장합니다.

데이터 집합 검증

  • 데이터 집합을 검증하려면 데이터 집합 검증을 클릭합니다.

검증에는 다음 사항을 확인하는 작업이 포함됩니다.

  • 모든 테이블에 기본 키가 있습니다.

  • 누락된 속성이 없습니다.

  • 중복된 테이블 또는 열 이름이 없습니다.

소스와 비교한 디자인 변경 사항 목록도 표시됩니다.

  • 추가된 테이블 및 열

  • 삭제된 테이블 및 열

  • 이름이 변경된 테이블 및 열

  • 변경된 기본 키 및 데이터 유형

모든 검증 오류 및 디자인 변경 사항을 보려면 검증 및 조정을 확장합니다.

  • 검증 오류를 수정한 다음 데이터 집합을 다시 검증합니다.

  • 변경된 기본 키 또는 데이터 유형을 제외한 대부분의 디자인 변경 사항은 자동으로 조정될 수 있습니다. 이 경우 데이터 집합을 동기화해야 합니다.

데이터 집합 준비

가능한 경우 데이터 손실 없이 디자인 변경 사항을 조정하도록 데이터 집합을 준비할 수 있습니다. 데이터 손실 없이 조정할 수 없는 디자인 변경 사항이 있는 경우 데이터 손실과 함께 소스에서 테이블을 다시 생성하는 옵션이 제공됩니다.

이를 위해서는 작업을 중지해야 합니다.

  • 자세히를 클릭한 다음 준비를 클릭합니다.

데이터 집합이 준비되면 스토리지 작업을 다시 시작하기 전에 데이터 집합을 검증합니다.

데이터 집합 다시 생성

소스에서 데이터 집합을 다시 생성할 수 있습니다. 데이터 집합을 다시 생성하면 데이터 손실이 발생합니다. 소스 데이터가 있는 한 소스에서 다시 로드할 수 있습니다.

정보 메모개별 테이블에 문제가 있는 경우 테이블을 다시 만드는 대신 먼저 테이블을 다시 로드해 보는 것이 좋습니다. 테이블을 다시 만들면 기록 데이터가 손실될 수 있습니다. 주요 변경 내용이 있는 경우 데이터를 다시 로드하기 위해 다시 만들어진 데이터 작업을 사용하는 다운스트림 데이터 작업도 준비해야 합니다.

이를 위해서는 작업을 중지해야 합니다.

  • 자세히를 클릭한 다음 테이블 다시 생성을 클릭합니다.

검증 데이터 다운로드

검증 오류, 디자인 변경 사항준비 진행률에서 데이터를 다운로드할 수 있습니다.

  • 다운로드를 클릭하여 다운로드합니다.

데이터는 브라우저 다운로드에 CSV 파일로 다운로드됩니다.

제한 사항

  • Google BigQuery에서 열을 삭제하거나 이름을 바꾸면 테이블이 다시 생성되고 데이터 손실이 발생합니다.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 알려 주십시오!