Passaggio 2: creare un cluster lakehouse
Un cluster lakehouse definisce l'ambiente di calcolo per eseguire le attività di archiviazione di Qlik Open Lakehouse. Ogni cluster specifica le impostazioni che comprendono il numero di istanze, il tipo di computer e la strategia di scalabilità.
Quando si crea un'integrazione di rete per un progetto di pipeline Qlik Open Lakehouse, viene creato automaticamente un cluster con una singola istanza AWS Spot. Tuttavia, è possibile creare cluster aggiuntivi nei centri attività Amministrazione e Integrazione dati.
I cluster lakehouse collegano le pipeline a un gruppo di istanze AWS, consentendo di ottimizzare i carichi di lavoro assegnando i lavori critici a cluster ad alte prestazioni e i carichi di lavoro non critici a computer più economici.
Mentre un cluster è associato a un singolo VPC, più cluster possono essere eseguiti all'interno dello stesso VPC. Inoltre, un singolo cluster può eseguire più processi. È utile definire i requisiti di calcolo dei carichi di lavoro prima di creare un cluster lakehouse. Le impostazioni del cluster, compresa la strategia di scalabilità, possono essere modificate in base alle esigenze, anche se alcune modifiche possono richiedere il rollover del cluster. Per informazioni sulla modifica di queste impostazioni, vedere Gestione dei cluster lakehouse.
Quando crea un cluster lakehouse, specificare il numero di istanze Spot e On-Demand che Qlik mette a disposizione. Per ulteriori informazioni su come Qlik utilizza le istanze Spot e On-Demand nel cluster, vedere Cluster lakehouse (gruppo di scalabilità automatica EC2)
Prerequisiti
Per creare un cluster lakehouse, sono necessari i seguenti elementi:
-
Un'integrazione di rete nel tenant corrente.
-
L'autorizzazione per accedere all'integrazione di rete che si desidera utilizzare per la connessione.
Creazione di un cluster lakehouse
Per aggiungere un cluster al tenant corrente, procedere come segue:
-
Nel centro attività Amministrazione, fare clic su Cluster lakehouse. Selezionare la scheda Cluster lakehouse, fare clic su Crea nuovo, fare clic su Cluster lakehouse, quindi configurarlo:
-
Nome: inserire il nome del cluster.
-
Integrazione di rete: selezionare l'integrazione di rete in cui verrà distribuito il cluster.
-
Spazio di integrazione: selezionare lo spazio a cui apparterrà il cluster, in quanto non viene ereditato dall'integrazione di rete.
-
Tipo di famiglia: selezionare il tipo di famiglia dell'istanza.
- Configurare le istanze:
-
Istanze AWS On-Demand: inserire il numero di Istanze AWS On-Demand per questo cluster.
-
Istanze Spot AWS: inserire il numero Minimo e Massimo delle Istanze Spot da utilizzare.
- Scegliere una strategia appropriata per il carico di lavoro tra le seguenti opzioni:
-
Costi bassi: esegue l'ottimizzazione per costi più bassi, sebbene possa portare a periodi occasionali di latenza maggiore.
-
Latenza bassa: cerca di mantenere una latenza bassa, consentendo dei picchi brevi, ma necessari.
-
Latenza bassa costante: aumenta in modo proattivo per assicurare che la latenza rimanga bassa.
-
Scaling manuale: mantiene un numero statico di istanze senza scalabilità automatica.
-
Selezionare il modo in cui il suo cluster riceve gli aggiornamenti software:
-
Rollout iniziale: ideale per i cluster di sviluppo e staging, per convalidare le nuove versioni rispetto alle configurazioni e al codice personalizzati, prima della produzione.
-
Rollout successivo: gli aggiornamenti vengono applicati dopo un rollout iniziale riuscito e sono consigliati per gli ambienti di produzione.
-
Aggiungere una Chiave e un Valore per i tag che si desidera includere e che consentono di identificare, organizzare e gestire le risorse.