2단계: 레이크하우스 클러스터 만들기
레이크하우스 클러스터는 Qlik 오픈 레이크하우스 저장소 작업을 실행하기 위한 컴퓨팅 환경을 정의합니다. 각 클러스터는 인스턴스 수, 컴퓨터 유형, 확장 전략을 포함한 설정을 지정합니다.
Qlik 오픈 레이크하우스 파이프라인 프로젝트에 대한 네트워크 통합을 만들면 단일 AWS 스팟 인스턴스가 있는 클러스터가 자동으로 만들어집니다. 하지만 관리 및 데이터 통합 활동 센터에서 추가 클러스터를 만들 수 있습니다.
레이크하우스 클러스터는 파이프라인을 AWS 인스턴스 그룹에 연결하여 중요한 작업을 고성능 클러스터에 할당하고 중요하지 않은 작업은 비용 효율적인 컴퓨터에 할당하여 워크로드를 최적화할 수 있습니다.
클러스터는 단일 VPC에 연결되지만, 여러 클러스터가 동일한 VPC 내에서 실행될 수 있습니다. 또한, 단일 클러스터가 여러 작업을 실행할 수 있습니다. 레이크하우스 클러스터를 만들기 전에 워크로드의 컴퓨팅 요구 사항을 정의하는 것이 좋습니다. 확장 전략을 포함한 클러스터 설정은 필요에 따라 수정할 수 있지만, 일부 변경 내용에는 클러스터를 롤링해야 할 수도 있습니다. 클러스터 설정 편집에 대한 자세한 내용은 레이크하우스 클러스터 관리를 참조하십시오.
레이크하우스 클러스터를 만들 때 Qlik 프로비저닝하는 Spot 및 On-Demand 인스턴스의 수를 지정합니다. Qlik가 클러스터에서 Spot 및 On-Demand 인스턴스를 활용하는 방법에 대한 자세한 내용은 레이크하우스 클러스터(EC2 자동 확장 그룹)를 참조하십시오.
클러스터 기능
클러스터를 생성할 때 클러스터가 실행하는 워크로드 유형(스트리밍, CDC 또는 혼합)을 선택해야 합니다. 일반적으로 스트리밍 및 CDC(데이터베이스 및 SaaS) 소스에는 별도의 클러스터를 사용하는 것이 가장 좋습니다. 이렇게 하면 정확하고 최소한의 청구 요금이 보장됩니다. 하지만 혼합 워크로드가 적절하고 클러스터를 공유할 수 있는 사용 사례가 있습니다.
-
청구량이 미미한 소규모 프로젝트의 테스트 또는 평가용.
-
비스트리밍 사용량이 최소화되어 별도의 클러스터를 구성하고 유지 관리하고 싶지 않은 경우.
전제 조건
레이크하우스 클러스터를 만들려면 다음이 필요합니다.
-
현재 테넌트 내의 네트워크 통합.
-
네트워크 통합에 대한 액세스 권한.
레이크하우스 클러스터 만들기
현재 테넌트에 클러스터를 추가하려면 다음을 수행합니다.
-
관리 활동 센터에서 레이크하우스 클러스터를 클릭합니다. 레이크하우스 클러스터 탭을 선택하고 새로 만들기를 클릭한 다음 레이크하우스 클러스터를 클릭하고 구성합니다.
-
이름: 클러스터의 이름을 입력합니다.
-
네트워크 통합: 클러스터가 배포될 네트워크 통합을 선택합니다.
-
통합 공간: 네트워크 통합에서 상속되지 않으므로 클러스터가 속할 공간을 선택합니다.
-
워크로드에 대한 클러스터 기능을 선택합니다.
-
스트리밍 워크로드: 스트리밍 데이터 소스에서 수집할 때 이 옵션을 선택합니다.
-
CDC 워크로드: 데이터베이스 및 SaaS 응용 프로그램 소스에서 수집할 때 이 옵션을 선택합니다.
-
혼합 워크로드: 테스트 시 혼합 워크로드를 선택하거나, 스트리밍 소스 사용이 최소화되고 워크로드가 주로 CDC 소스로 구성된 경우에 선택합니다.
-
-
패밀리 유형 구성:
-
유형: 인스턴스 유형을 선택합니다.
-
크기: 인스턴스 크기를 선택합니다.
-
- 인스턴스를 구성합니다.
-
AWS On-Demand 인스턴스: 이 클러스터에 대한 AWS On-Demand 인스턴스 수를 입력합니다.
-
AWS 스팟 인스턴스: 사용할 스팟 인스턴스의 최소 및 최대 수를 입력합니다.
- 다음 옵션 중에서 사용자의 업무량에 적합한 전략을 선택합니다.
-
저렴한 비용 – 낮은 비용으로 최적화되지만 가끔씩 높은 지연 시간이 발생할 수 있습니다.
-
짧은 지연 시간 - 짧고 필요한 급증을 허용하면서 짧은 지연 시간을 유지하기 위해 노력합니다.
-
일관되게 짧은 지연 시간 - 지연 시간을 낮게 유지하기 위해 사전에 확장합니다.
-
수동 크기 조정 - 자동 크기 조정 없이 정적 인스턴스 수를 유지합니다.
-
클러스터가 소프트웨어 업데이트를 수신하는 방법을 선택합니다.
-
초기 릴리스: 프로덕션에 앞서 사용자 지정 설정 및 코드에 대해 새 릴리스의 유효성을 검사하기 위한 개발 및 스테이징 클러스터에 이상적입니다.
-
추후 출시: 업데이트는 초기 출시가 성공적으로 완료된 후 적용되며, 프로덕션 환경에 권장됩니다.
-
리소스를 식별, 구성 및 관리하는 데 도움이 되는 태그에 대해 키와 값을 추가합니다.