분석에서 계보 분석 | Qlik Cloud 도움말
기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

분석에서 계보 분석

계보는 데이터 및 데이터 변환을 원래 소스까지 역추적합니다. Qlik Cloud는 이 흐름의 기록을 상세한 시각적 표현으로 제공하며, 여기서 분석 콘텐츠의 상위 계보를 대화형으로 검사할 수 있습니다. 계보는 응용 프로그램, 스크립트, 데이터 흐름, 테이블 레시피, ML 실험, ML 배포 및 데이터 세트와 같은 콘텐츠에 사용할 수 있습니다.

정보 메모분석 콘텐츠의 계보를 보려면 기본 데이터가 카탈로그화된 소스로 Qlik Cloud에 저장되어 있어야 합니다.

특정 필드를 검사하는 비즈니스 사용자는 가장 중요한 종속성을 요약한 필드 계보 보기를 확인할 수 있습니다.

  • 해당 필드를 파생하는 데 사용된 필드
  • 소유자 및 공간을 포함한 직접적인 연결 및 종속성
  • 원래 소스(최초로 알려진 소스)

하위 또는 향후 종속성을 보려면 영향 분석을 확인하여 개체 변경 시 어떤 요소가 영향을 받는지 조사할 수 있습니다. 분석에서 영향 분석 분석하기을 참조하십시오.

계보 사용 방법에 대한 시각적 데모는 다음을 참조하십시오.

계보 사용

정보 메모

계보를 사용하려면 User Default 또는 사용자 지정 보안 역할을 통해 계보 보기허용됨으로 설정되어 있어야 합니다.

계보 그래프

계보 그래프는 대화형 그래픽 차트에서 분석 콘텐츠를 통한 데이터 흐름을 보여줍니다. 리소스, 테이블 또는 필드를 계보 그래프의 노드라고 합니다. 노드가 조사 중인 기본 노드인 경우, 이를 포커스 상태라고 하며 그래프의 마지막 요소로 표시됩니다. 가장 세분화된 수준에서 필드 수준 계보 그래프는 노드가 소싱되거나 종속된 데이터 소스 및 변환을 보여줍니다.

계보 그래프는 다음 사용자에게 유용합니다.

  • 데이터를 다루는 데이터 전문가

  • 응용 프로그램을 구축하는 비즈니스 전문가

  • 응용 프로그램을 사용하는 고급 비즈니스 사용자

  • 머신 러닝 모델을 다루는 사용자

각 노드는 선택한 콘텐츠 계보의 단계를 나타냅니다. 이 계보 정보는 분석 자산이 데이터를 새로 고칠 때마다 컴파일됩니다. 응용 프로그램, 스크립트, 데이터 흐름 또는 테이블 레시피가 최근에 새로 고쳐지지 않은 경우 계보가 불완전하거나 부정확할 수 있습니다.

계보는 카탈로그에 나타나는 타일이나 행에서 지원되는 콘텐츠 유형에 대해 사용할 수 있습니다. 다음 분석 콘텐츠에 대한 계보를 분석할 수 있습니다.

  • 데이터 세트: 데이터 세트는 커넥터에서 로드된 데이터나 데이터 파일과 같은 데이터 소스입니다. 데이터 세트는 데이터베이스의 테이블, 데이터 저장소에 업로드된 데이터 또는 qvd 파일과 같이 응용 프로그램에서 생성된 데이터일 수 있습니다. 데이터 세트는 일반적으로 각각 하나의 테이블을 가지지만 Excel 파일과 같은 일부 데이터 세트는 여러 테이블을 가질 수 있습니다.

    Talend Studio에서 게시된 데이터 세트는 로 표시됩니다. 데이터 세트 ... 메뉴에서 TMC 작업 열기를 클릭하여 데이터 세트를 생성하는 데 사용된 Talend Management Console 작업을 이동할 수 있습니다. 자세한 내용은 Qlik Cloud에 데이터 세트 및 계보 게시를 참조하십시오.

  • : 응용 프로그램 노드는 계보의 데이터 소스를 사용하는 Qlik Sense 분석 응용 프로그램을 나타냅니다. 응용 프로그램 노드는 응용 프로그램 이름과 응용 프로그램 위치를 Qlik Sense로 표시합니다.

  • 스크립트: 스크립트 노드는 스크립트 인터페이스에서 생성된 스크립트를 나타냅니다.

  • 데이터 흐름: 데이터 흐름을 검사하여 사용하는 데이터 소스와 변환을 더 잘 이해할 수 있습니다.

  • 테이블 레시피: 테이블 레시피를 검사하여 사용하는 데이터 소스와 변환을 더 잘 이해할 수 있습니다.

  • ML 실험: 머신 러닝 모델을 위한 학습 데이터를 생성하기 위해 결합된 데이터 소스로 구성된 머신 러닝 실험의 계보를 이해할 수 있습니다.

  • ML 배포: ML 배포의 계보와 예측에 어떻게 사용되는지 이해할 수 있습니다. ML 배포의 계보는 일반적으로 ML 실험, 실험 버전, 모델 및 데이터 세트로 구성됩니다.

일반적인 입력 노드에는 기본 노드에서 사용하는 데이터 소스나 데이터 세트를 생성하는 응용 프로그램이 포함됩니다. 필드 수준 계보는 필드가 어떻게 계산되었는지, 그리고 변환 및 응용 프로그램 전반에 걸친 특정 기원에 대한 상세한 조사를 가능하게 합니다.

계보 그래프에서 사용할 수 있는 노드는 선택한 콘텐츠에 대한 입력입니다. 항목을 선택하여 기본 노드로 지정하십시오. 입력 노드는 기본 노드의 상위에 있는 노드입니다.

필드 수준 계보 그래프

필드 수준 계보 그래프

계보 그래프에서 사용할 수 있는 노드는 선택한 기본 노드, 즉 포커스 상태인 노드에 대한 입력입니다. 기본 노드는 계보를 검색하려는 단일 노드입니다. 예를 들어 응용 프로그램, 데이터 흐름, ML 실험, 데이터 세트, 파일, 테이블 또는 필드일 수 있습니다.

이 노드는 화면의 가장 오른쪽에 있으며 파란색으로 윤곽이 표시됩니다. 이 노드는 조사의 중심이며 해당 기본 노드에 대한 입력만 표시됩니다.

계보를 탐색하는 동안 화면의 다른 테이블, 응용 프로그램, 필드 또는 기타 항목으로 기본 노드를 대화형으로 변경하여 조사를 집중할 수 있습니다.

계보 기본 노드

포커스 상태인 노드(기본 노드라고도 함)는 화면 오른쪽에 표시됩니다

노드를 연결하는 선은 에지입니다. 에지는 한 노드와 다른 노드의 관계를 나타냅니다. 에지는 응용 프로그램에서 사용하는 데이터 세트와 같은 연결을 나타내는 관계를 나타냅니다. 또한 응용 프로그램의 부산물로 생성되는 데이터를 나타낼 수도 있습니다. 노드와 에지의 집합이 계보 그래프를 구성합니다.

계보 에지는 관계를 나타냅니다

에지는 개체 간의 관계를 나타냅니다

노드는 축소하거나 확장하여 상위 수준의 데이터 세트 그룹이나 응용 프로그램에서 가장 세분화된 수준인 필드 수준까지 계층 구조 수준을 드러냅니다.

이 노드 이미지에는 가장 높은(가장 거친) 수준에서 가장 낮은(가장 세분화된) 수준까지 데이터 자산(응용 프로그램), 리소스(데이터 세트), 테이블 및 필드와 같은 계층 구조 수준이 표시됩니다.

자산, 리소스, 테이블 및 필드 수준이 있는 노드

계보 그래프 열기

  1. 통찰력 또는 분석 활동 센터를 엽니다.

  2. 계보를 지원하는 항목의 컨텍스트 메뉴 더 보기에서 도구 > 계보를 선택합니다.

항목을 열었을 때 일부 콘텐츠의 계보 그래프에 액세스할 수도 있습니다. 더 보기계보를 클릭하십시오.

노드 세부 정보

세부 정보는 해당 개체에 대한 액세스 권한에 따라 제한됩니다. 세부 정보는 다음 정보를 제공할 수 있습니다.

  • 이름

  • 설명

  • 태그

  • 위치

  • 공간

  • 소유자

  • 작성자

  • 마지막 수정일

계보 그래프 탐색

그래프를 클릭하고 드래그하여 계보 그래프를 탐색하고 중앙에 배치합니다. 탐색 버튼을 사용할 수도 있습니다. 홈 홈을 선택하여 계보 그래프를 기본 노드에 중앙 배치합니다. 뒤로 및 앞으로를 클릭하여 선택 항목을 이동합니다.

계보 그래프 탐색

계보 그래프용 탐색 버튼

계보 그래프는 분석 콘텐츠에 대한 상위 종속성을 보여주며, 그래프를 열 때 기본 노드로 표시됩니다. 더 보기계보(새 기본 노드) 또는 영향 분석을 선택하여 그래프에 나타나는 다른 노드에 대한 계보(상위) 또는 영향 분석(하위)에 액세스할 수 있습니다. 노드를 선택하여 기본 노드로 지정하십시오.

노드를 확장 아래쪽 화살표하거나 축소 위쪽 화살표하여 같은 수준의 개체 그룹을 확장하거나 축소합니다.

다른 노드를 분석하기 위한 메뉴 옵션

다른 노드를 분석하기 위한 메뉴 옵션

응용 프로그램의 계보 요약 보기

응용 프로그램의 계보 요약 보기는 비즈니스 사용자에게 응용 프로그램의 상위 종속성에 대한 개요를 제공할 수 있습니다. 자세한 내용은 응용 프로그램 내 계보 요약 보기를 참조하십시오.

머신 러닝 콘텐츠에 대한 계보 분석

계보 그래프를 사용하여 ML 실험, ML 배포 및 데이터 세트를 포함한 머신 러닝 콘텐츠의 기원을 분석할 수 있습니다. 그래프를 사용하여 머신 러닝 모델이 어떻게 생성되었는지, 어떤 데이터로 학습되었는지, 프로덕션 시나리오에서 무엇에 사용되는지에 대한 전체적인 보기를 확인하십시오.

실험, 배포 및 데이터 세트는 하위 응용 프로그램과 같이 계보 그래프에서 다른 콘텐츠를 분석할 때 노드로도 나타납니다.

머신 러닝 자산은 하위 콘텐츠의 포괄적인 분석을 위해 영향 분석에도 표시됩니다. 자세한 내용은 분석에서 영향 분석 분석하기을 참조하십시오.

머신 러닝 콘텐츠에 대한 계보 열기

  • 활동 센터에서 ML 실험, ML 배포 또는 데이터 세트 옆의 더 보기를 클릭하고 도구 > 계보를 선택합니다.

  • ML 실험 또는 ML 배포에서 탐색 막대의 더 보기를 클릭하고 계보를 선택합니다.

머신 러닝 콘텐츠에 대한 계보 탐색

다른 콘텐츠와 동일한 방식으로 머신 러닝 노드를 탐색합니다. 인터페이스 개요는 다음을 참조하십시오.

계보 그래프에서 머신 러닝 항목 인식

다음 표는 계보 그래프에 나타나는 머신 러닝 관련 일반 항목을 설명합니다.

머신 러닝을 위한 일반적인 계보 항목
항목 아이콘 설명
파일 저장소 폴더

머신 러닝 콘텐츠에만 국한되지 않습니다. 데이터 세트가 저장된 위치(대부분의 경우 공간)를 보여줍니다. 학습 데이터 세트, 실험의 임베디드 분석에서 내보내기, 예측에 사용되는 적용 데이터 세트 및 예측 출력 데이터 세트와 관련이 있습니다.

데이터 세트 다수(예: QVD의 경우 QVD 파일 유형) 머신 러닝 콘텐츠에만 국한되지 않습니다. 학습 데이터 세트, 실험의 임베디드 분석에서 내보내기, 적용 데이터 세트 및 예측 출력 데이터 세트를 나타내는 데 사용됩니다.
ML 실험 ML 실험 모델이 학습되는 ML 실험입니다.
ML 실험 버전 포크 하나 이상의 모델이 학습된 ML 실험 내의 버전입니다.
ML 모델 ML 모델 실험 버전 내에서 학습된 ML 모델입니다. ML 실험에서 학습된 모델과 ML 배포에서 배포된 모델을 나타내는 데 사용됩니다.
ML 배포 ML 배포 하나 이상의 배포된 모델을 포함하는 ML 배포입니다.
아이콘 없음 - ML 배포 내의 예측 출력 노드에는 아이콘이 없습니다. 예측 출력 데이터 세트에 포함된 필드에도 아이콘이 없습니다.

계보 및 ML 실험

ML 실험은 그룹화된 배열로 표시됩니다. 다음과 같이 확장됩니다.

  • ML 실험은 하나 이상의 실험 버전으로 확장됩니다.

  • 실험 버전은 하나 이상의 ML 모델로 확장됩니다.

실험에서 학습된 모델이 ML 배포에 배포되면 하위 콘텐츠(예: 예측 또는 ML 배포)가 기본 노드로 선택될 때 계보 그래프에 나타납니다.

계보 및 ML 배포

ML 배포는 그룹화된 배열로 표시됩니다. 다음과 같이 확장됩니다.

  • ML 배포는 하나 이상의 배포된 모델로 확장됩니다.

  • 배포의 모델이 배치 예측에 사용된 경우 모델이 확장되어 각 배치 예측 출력을 보여줍니다.

필드 수준 계보는 ML 배포와 관련된 적용 데이터 세트 및 예측 출력 데이터 세트에 사용할 수 있습니다.

예측에 사용되는 배포된 모델은 학습된 실험으로 다시 연결됩니다.

예제 시나리오

예제 시나리오는 예: 머신 러닝 콘텐츠의 계보 조사를 참조하십시오.

제한 사항

계보 차트에는 다음과 같은 제한 사항이 있습니다.

  • Qlik Cloud에서 계보가 릴리스된 후 다시 로드되지 않은 응용 프로그램은 다시 로드될 때까지 전체 계보 정보를 사용할 수 없을 수 있습니다. 테넌트에서 계보가 켜진 후 로드되지 않은 경우 일부 노드에 대한 세부 정보가 제한될 수 있습니다.

  • SQL Server 또는 Google Drive 연결과 같이 테넌트 외부의 데이터 세트에 대한 노드 세부 정보는 데이터 세트 유형과 이름으로 제한됩니다. REST 연결은 REST 데이터임을 표시하기만 합니다.

  • 항목이 삭제된 경우 다른 노드를 분석할 때 계보에 계속 표시될 수 있습니다.

권한

활동 센터에서 항목의 계보를 보려면 해당 항목을 볼 수 있어야 합니다. 기본 노드에 대한 계보 그래프를 볼 수 있는 경우 상위 계보 개체에 대한 기본 세부 정보 및 메타데이터를 볼 수 있습니다.

보안

  • 사용자는 액세스 권한이 있는 기본 노드로만 변경할 수 있으며, 그렇지 않으면 컨텍스트 메뉴를 사용할 수 없습니다.

  • 사용자가 기본 노드에 대한 액세스 권한이 있는 경우 모든 상위 계보를 볼 수 있는 액세스 권한을 갖게 됩니다.

계보 분석을 위한 예제 사용 사례

계보 분석에 대한 단계별 안내는 필드 수준 계보 사용 사례를 참조하십시오.

예: 계보 요약 보기를 사용하여 정보 출처 탐색

응용 프로그램 cars-data4-app의 막대형 차트를 보는 분석 소비자로서 정보의 출처를 알고 싶습니다. 세부 정보 표시식 표시속성모양 > 일반 섹션 아래에서 차트에 대해 켜져 있는지 확인한 다음 시트 분석 모드로 전환을 선택합니다. 차트를 마우스 오른쪽 버튼으로 클릭하거나 아이콘 더 보기 메뉴를 사용하고 세부 정보 표시를 선택하여 계보 소비자 보기를 표시합니다. 종속성 표시를 클릭하십시오.

차원 Car_ID가 세 개의 나열된 CSV 소스에서 발견되는 필드 Car_ID에 종속되어 있음을 알 수 있습니다. 필드 항목에서 아이콘 더 보기 메뉴를 선택하고 계보 - Car_ID / Cars를 선택하여 응용 프로그램의 필드 Car_ID에 대한 계보 그래프를 엽니다.

소스 또는 필드를 선택하여 해당 개체의 계보 보기

메뉴를 선택한 다음 소비자 계보 요약 보기에서 소스의 계보를 보는 옵션을 선택하십시오

계보 그래프는 오른쪽에서 왼쪽으로 보이며 필드 Car_ID가 응용 프로그램 cars-data4-app으로 로드된 테이블 Cars에 있음을 보여줍니다. 필드 기록을 Qlik Cloud에 업로드된 원래 파일까지 추적하면서 노드를 확장 아래쪽 화살표하십시오. 첫 번째 릴레이를 다시 보면 필드 Car_ID를 포함하는 CSV cars-data.csv가 응용 프로그램 cars-data4-app으로 로드되었음을 알 수 있습니다. 다음 노드는 cars-data.csv가 생성된 응용 프로그램 cars-data3-app입니다. 한 릴레이를 더 뒤로 가서 노드를 확장하면 원래 소스 파일이 CSV 파일 cars-data3.csv였으며 필드 ID를 포함하고 있음을 알 수 있습니다.

테이블을 확장하고 필드를 확인하여 막대형 차트 차원 Car_id-ID의 원래 소스 파일, 테이블 및 필드를 식별할 수 있습니다.

노드를 확장하여 필드의 기록을 소스 파일까지 추적

포커스 상태인 노드에서 시작하여 계보 기록을 원래 소스까지 추적하십시오

예: 데이터 세트의 기원 및 생성 방법 조사

응용 프로그램 개발자로서 기존 데이터 세트 current_customers_analytics.xlsx를 응용 프로그램에 사용하는 것을 고려하고 있습니다. 데이터가 어디에서 오는지 이해할 수 있도록 이 데이터 세트의 기원을 조사합니다. 데이터 세트 타일이나 행에서 더 보기 메뉴의 계보를 선택하여 계보 그래프를 엽니다. 계보 그래프에서 XLSX current_customers_analytics.xlsx아이콘 더 보기 메뉴를 선택하고 개요를 열기하여 데이터 세트의 메타데이터를 봅니다.

계보 그래프에서 데이터 세트 개요 열기

데이터 세트 개요는 계보 그래프에서 열 수 있습니다

데이터 세트 개요 탭에서 태그, 분류 및 기타 기술 메타데이터 보기

데이터 세트 개요는 계보 그래프에서 액세스할 수 있습니다

데이터 프로필은 프로필 탭에서 사용할 수 있습니다

필드 프로필 탭은 계보 그래프에서 액세스할 수 있습니다

브라우저 뒤로 화살표를 클릭하여 계보 그래프로 돌아가 데이터 세트에 대한 계보 그래프를 탐색합니다. current_customers_analytics.xlsx 노드를 확장 아래쪽 화살표하고 모두 선택을 클릭하여 사용 가능한 필드를 확인합니다. 모든 노드에 대해 동일하게 수행하십시오. 각 필드는 계보(새 기본 노드)를 선택하여 포커스 상태인 기본 노드로 만들거나 영향 분석을 선택하여 향후 계보 및 데이터 세트 변경으로 영향을 받을 종속 개체를 볼 수 있는 옵션을 제공합니다.

데이터 세트에 대해 확장된 계보 그래프. 각 노드 내의 각 필드에는 응용 프로그램이나 데이터를 열거나, 영향 분석을 보거나, 포커스 상태인 노드를 변경하는 옵션이 있습니다

데이터 세트에 대한 계보 보기

계보를 역으로 따라가며 노드를 확장하면 이 XLSX 데이터 세트가 Prep Current Customers Sales - Analytics 응용 프로그램의 출력임을 알 수 있습니다. 한 릴레이를 더 뒤로 가서 파일 저장소 노드를 확장하면 판매 분석 응용 프로그램에 CSV 파일 rgb_customers.csv가 로드되었음을 알 수 있습니다. 필드 수준 분석을 통해 원래 소스 파일의 Tags 필드가 판매 분석 응용 프로그램에서 rgb_customers.Tags로 이름이 변경되었음을 알 수 있습니다. 원래 CSV 파일을 개요로 열어 소유자, 작성자, 사용량 메트릭, 태그, 분류, 필드 프로필 및 영향 분석과 같은 귀중한 메타데이터를 확인할 수 있습니다.

예: 머신 러닝 콘텐츠의 계보 조사

일반 비즈니스 사용자나 머신 러닝 전문가는 계보 그래프를 사용하여 특정 예측 값의 기원을 검사할 수 있습니다. 기본 노드가 예측 데이터 세트로 설정된 상태에서 사용자는 다음을 볼 수 있습니다.

  • 소스 및 변환을 포함한 학습 데이터

  • 실험, 실험 버전 및 모델

  • 모델이 배포된 위치 및 사용 방법

모든 노드가 확장된 계보 그래프. 그래프는 학습 데이터 준비에서 예측 데이터 세트까지의 엔드투엔드 흐름을 보여줍니다.

학습 데이터 준비에서 예측 데이터 세트까지의 엔드투엔드 흐름을 보여주는 계보 그래프

위 이미지는 다음 프로세스를 보여줍니다.

  1. 데이터 흐름 데이터 흐름이 개인 공간 폴더에 저장된 CSV 데이터 세트 Parquet 파일 유형에서 데이터를 로드하고 변환합니다. 출력은 같은 공간의 Parquet 데이터 세트 Parquet 파일 유형에 저장됩니다.

  2. Parquet 데이터 세트 Parquet 파일 유형는 ML 실험 ML 실험의 버전 1 포크에서 사용됩니다. 이 실험 버전은 ML 모델 ML 모델을 학습시킵니다.

  3. ML 모델 ML 모델은 ML 배포 ML 배포에 배포됩니다.

  4. 개인 공간 폴더의 CSV 데이터 세트 Parquet 파일 유형를 적용 데이터 세트로 사용하여 ML 배포 ML 배포는 Parquet 형식 Parquet 파일 유형의 예측 데이터 세트를 생성합니다.

데이터 통합의 계보

계보 그래프는 데이터 통합에서도 사용할 수 있습니다. 자세한 내용은 데이터 통합의 계보 분석을 참조하십시오.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 알려 주십시오!