Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Eingliederung von Daten

Der erste Schritt bei der Erstellung einer Daten-Pipeline in einem Qlik Cloud Data Integration-Datenprojekt ist die Eingliederung der Daten. Dazu gehört die fortlaufende Übertragung der Daten aus der lokalen Datenquelle und das Speichern von Datensätzen in einem leseoptimierten Format. Sie können Daten mit fortlaufender Änderungsbearbeitung aktualisieren oder geplante Ladevorgänge verwenden.

Sie erstellen die Eingliederung in einer einzelnen Operation, wird aber in zwei Schritten durchgeführt.

  • Bereitstellung der Daten

    Dazu gehört die fortlaufende Übertragung der Daten aus der lokalen Datenquelle in einen Bereitstellungsbereich mithilfe einer Bereitstellungsdatenaufgabe.

    Bereitstellen von Daten aus Datenquellen

  • Speichern von Datensätzen

    Hierzu werden der anfängliche Ladevorgang von Bereitstellungsdaten oder inkrementelle Ladevorgänge gelesen und dann die Daten in einem leseoptimierten Format anhand einer Speicherdatenaufgabe angewendet.

    Speichern von Datensätzen

Wenn Sie die Daten eingegliedert haben, können Sie die gespeicherten Datensätze auf verschiedene Weise nutzen.

  • Sie können die Datensätze in einer Analyse-App verwenden.

  • Sie können Transformationen erstellen.

  • Sie können einen Data Mart erstellen.

Onboarding für Daten

Sie starten Eingliederungsdaten in einem Datenprojekt. Datasets werden im Cloud-Daten-Warehouse gespeichert, das im Datenprojekt definiert ist. Weitere Informationen zu Datenprojekten finden Sie unter Erstellen einer Daten-Pipeline.

  1. Klicken Sie auf Neu hinzufügen und dann auf Onboarding für Daten.

  2. Fügen Sie einen Namen und eine Beschreibung für die Eingliederung hinzu.

    Klicken Sie auf Next (Weiter).

  3. Wählen Sie die Quellverbindung aus.

    Sie können eine bestehende Quellverbindung auswählen oder eine neue Datenverbindung zur Quelle erstellen.

    Weitere Informationen finden Sie unter Verbinden mit Datenquellen.

    Klicken Sie auf Next (Weiter).

  4. Wählen Sie Daten aus, die geladen werden sollen.

    Weitere Informationen finden Sie unter Auswählen von Daten.

    Klicken Sie auf Weiter.

    Einstellungen wird angezeigt. Dort können Sie die Aktualisierungsmethode und die Verlaufseinstellungen auswählen.

  5. Wählen Sie in Aktualisierungsmethode aus, welche Methode zum Aktualisieren von Daten verwendet werden soll:

    • Change Data Capture (CDC)

      Wenn Ihre Daten auch Tabellen, die CDC nicht unterstützen, oder Ansichten enthalten, werden zwei Daten-Pipelines erstellt. Eine Pipeline enthält alle Tabellen, die CDC unterstützen, und die andere Pipeline alle anderen Tabellen und Ansichten, die Neu laden und vergleichen verwenden.

    • Neu laden und vergleichen

  6. Wählen Sie aus, ob Sie den Verlauf von vorherigen Daten zusätzlich zu aktuellen Daten in Verlauf replizieren möchten.

    Klicken Sie auf Weiter, wenn Sie fertig sind.

  7. Öffnen Sie eine Vorschau der Datenaufgaben, die zur Eingliederung von Daten erstellt werden, und benennen Sie sie bei Bedarf um.

    TipphinweisDie Namen werden verwendet, wenn Datenbankschemas im Speicherdatenobjekt benannt werden. Da ein Schema nur einer Aufgabe zugewiesen werden kann, sollten Sie Namen verwenden, die eindeutig sind, um Konflikte mit Datenobjekten in anderen Datenprojekten zu vermeiden, die dieselbe Datenplattform verwenden.
  8. Wählen Sie, ob Sie eine der erstellten Datenaufgaben öffnen oder zum Datenprojekt zurückkehren möchten.

    Wenn Sie bereit sind, klicken Sie auf Beenden.

Die Eingliederungsdatenaufgaben sind jetzt erstellt. Um mit der Replikation von Daten zu beginnen, müssen Sie Folgendes tun:

Auswählen von Daten

Sie können bestimmte Tabellen oder Ansichten auswählen oder Auswahlregeln zum Ein- oder Ausschließen von Tabellengruppen verwenden.

InformationshinweisFalls die Auswahl Ansichten enthält, wird CDC nicht unterstützt.

Verwenden Sie % als Platzhalter, um ein Auswahlkriterium für Schemas und Tabellen zu definieren.

  • %.% definiert alle Tabellen in allen Schemas.

  • Öffentlich.% definiert alle Tabellen im Schema Öffentlich.

Auswahlkriterien bietet Ihnen eine Vorschau anhand Ihrer Auswahl.

Sie haben jetzt folgende Möglichkeiten:

  • Erstellen Sie eine Regel zum Ein- oder Ausschließen einer Gruppe von Tabellen anhand der Auswahlkriterien.

    Klicken Sie auf Regel aus Auswahlkriterien hinzufügen, um eine Regel zu erstellen, und wählen Sie dann entweder Einschließen oder Ausschließen.

    Sie können die Regel unter Auswahlregeln sehen.

  • Wählen Sie einen oder mehrere Datensätze aus und klicken Sie auf Ausgewählte Datasets hinzufügen.

    Sie können die hinzugefügten Datensätze unter Explizit ausgewählte Datasets sehen.

Auswahlregeln gelten nur für den aktuellen Satz Tabellen und Ansichten, nicht für Tabellen und Ansichten, die in Zukunft hinzugefügt werden.

Weitere Informationen

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!