Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Schritt 2: Lakehouse-Cluster erstellen

Ein Lakehouse-Cluster definiert die Rechenumgebung für die Ausführung von Qlik Open Lakehouse-Speicheraufgaben. Jeder Cluster legt Einstellungen fest, zu denen die Anzahl der Instanzen, der Rechnertyp und die Skalierungsstrategie gehören.

Wenn Sie eine Netzwerkintegration für ein Qlik Open Lakehouse Pipeline-Projekt erstellen, wird automatisch ein Cluster mit einer einzelnen AWS Spot Instanz erstellt. Sie können jedoch zusätzliche Cluster in den Aktivitätscentern „Verwaltung“ und Datenintegration erstellen.

Lakehouse-Cluster verknüpfen Pipelines mit einer Gruppe von AWS-Instanzen. So können Sie Arbeitslasten optimieren, indem Sie kritische Jobs Hochleistungs-Clustern und nicht kritische Arbeitslasten kostengünstigen Rechnern zuweisen.

Ein Cluster ist mit einer einzigen VPC verbunden, es können aber mehrere Cluster in derselben VPC ausgeführt werden. Außerdem kann ein einzelner Cluster mehrere Jobs ausführen. Es ist hilfreich, die Rechenanforderungen Ihrer Arbeitslasten zu definieren, bevor Sie einen Lakehouse-Cluster erstellen. Die Cluster-Einstellungen, einschließlich der Skalierungsstrategie, können nach Bedarf geändert werden, wobei einige Änderungen ein Rollieren des Clusters erfordern können. Weitere Informationen zur Bearbeitung der Cluster-Einstellungen finden Sie unter Verwalten von Lakehouse-Clustern.

Wenn Sie einen Lakehouse-Cluster erstellen, geben Sie die Anzahl der Spot- und On-Demand-Instanzen an, die Qlik bereitstellt. Weitere Informationen dazu, wie Qlik die Spot- und On-Demand-Instanzen in Ihrem Cluster nutzt, finden Sie unter Lakehouse-Cluster (EC2-Gruppe mit automatischer Skalierung).

Cluster-Funktionen

Wenn Sie einen Cluster erstellen, müssen Sie den Typ der Arbeitslast auswählen, die auf dem Cluster ausgeführt wird: Streaming, CDC oder gemischt. Im Allgemeinen empfiehlt es sich, separate Cluster für Streaming- und CDC-Quellen (Datenbank und SaaS) zu verwenden. Dies gewährleistet genaue und minimale Abrechnungsgebühren. Es gibt jedoch Anwendungsfälle, in denen eine gemischte Arbeitslast angemessen ist und ein Cluster gemeinsam genutzt werden kann:

  • Für das Testen oder die Evaluierung von kleinen Projekten, die ein unerhebliches Abrechnungsvolumen aufweisen.

  • Wenn die Nicht-Streaming-Nutzung minimal ist und Sie keinen separaten Cluster konfigurieren und warten möchten.

Voraussetzungen

Zum Erstellen eines Lakehouse-Clusters benötigen Sie:

  • Eine Netzwerkintegration innerhalb des aktuellen Mandanten.

  • Berechtigung zum Zugriff auf die Netzwerkintegration.

Erstellen eines Lakehouse-Clusters

Um einen Cluster zum aktuellen Mandanten hinzuzufügen, gehen Sie wie folgt vor:

  1. Klicken Sie im Aktivitätscenter Verwaltung auf Lakehouse-Cluster. Wählen Sie die Registerkarte Lakehouse-Cluster aus, klicken Sie auf Neu erstellen, dann auf Lakehouse-Cluster und konfigurieren Sie den Cluster:

    • Name: Geben Sie den Namen des Clusters ein.

    • Netzwerkintegration: Wählen Sie die Netzwerkintegration aus, in der der Cluster bereitgestellt werden soll.

  2. Integrationsbereich: Wählen Sie den Bereich aus, zu dem der Cluster gehören soll, da dieser nicht von der Netzwerkintegration übernommen wird.

  3. Wählen Sie die Cluster-Funktionen für die Arbeitslast aus:

    • Streaming-Arbeitslasten: Wählen Sie diese Option aus, wenn Sie Daten aus einer Streaming-Datenquelle erfassen.

    • CDC-Arbeitslasten: Wählen Sie diese Option aus, wenn Sie Daten aus Datenbank- und SaaS-Anwendungsquellen erfassen.

    • Gemischte Arbeitslasten: Wählen Sie gemischte Arbeitslasten für Testzwecke aus, oder wenn die Nutzung von Streaming-Quellen minimal ist und Arbeitslasten hauptsächlich aus CDC-Quellen bestehen.

  4. Konfigurieren Sie den Familientyp:

    • Typ: Wählen Sie den Instanzentyp aus.

    • Größe: Wählen Sie die Instanzgröße aus.

  5. Konfigurieren Sie die Instanzen:
    • AWS On-Demand-Instanzen: Geben Sie die Anzahl der AWS On-Demand-Instanzen für diesen Cluster ein.

    • AWS Spot-Instanzen: Geben Sie die minimale und maximale Anzahl der zu verwendenden Spot-Instanzen ein.

  6. Wählen Sie aus den folgenden Optionen eine geeignete Strategie für Ihre Arbeitslast aus:
    • Niedrige Kosten: Optimiert für niedrigere Kosten, was allerdings gelegentlich zu Zeiträumen mit höherer Latenz führt.

    • Niedrige Latenz: Strebt die Beibehaltung niedriger Latenz an, lässt aber kurze erforderliche Spitzen zu.

    • Anhaltend niedrige Latenz: Skaliert proaktiv hoch, um eine anhaltend niedrige Latenz zu gewährleisten.

    • Manuelle Skalierung: Behält eine statische Anzahl von Instanzen ohne automatische Skalierung bei.

  7. Wählen Sie aus, wie Ihr Cluster Software-Updates erhält:

    • Frühes Rollout: Ideal für Entwicklungs- und Bereitstellungs-Cluster, um neue Versionen vor der Produktion mit benutzerdefinierten Einrichtungen und Code zu validieren.

    • Späteres Rollout: Updates werden nach einem erfolgreichen frühen Rollout angewendet und für Produktionsumgebungen empfohlen.

  8. Fügen Sie einen Schlüssel und einen Wert für alle Tags hinzu, die Sie zur Identifizierung, Organisation und Verwaltung von Ressourcen verwenden möchten.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!