Replizieren von Daten mit einem Standard-, Premium- oder Enterprise-Abonnement
So richten Sie eine Replikationsaufgabe ein:
-
Klicken Sie in Data Integration > Projekte auf Projekt erstellen.
-
Gehen Sie im Dialogfeld Neues Projekt wie folgt vor:
- Geben Sie einen Namen für Ihr Projekt an.
- Wählen Sie den Bereich aus, in dem das Projekt erstellt werden soll.
- Geben Sie optional eine Beschreibung an.
- Wählen Sie Replikation als Anwendungsfall aus.
- Deaktivieren Sie optional das Kontrollkästchen Öffnen, wenn Sie ein leeres Projekt erstellen und keine Einstellungen konfigurieren möchten.
-
Klicken Sie auf Erstellen.
Einer der folgenden Fälle tritt ein:
- Wenn das Kontrollkästchen Öffnen im Dialogfeld Neues Projekt aktiviert wurde (Standard), wird das Projekt geöffnet.
- Wenn Sie das Kontrollkästchen Öffnen im Dialogfeld Neues Projekt deaktiviert haben, wird das Projekt Ihrer Projektliste hinzugefügt. Sie können das Projekt später öffnen, indem Sie im Menü des Projekts die Option Öffnen auswählen.
-
Nachdem das Projekt geöffnet wurde, klicken Sie auf Daten replizieren.
Der Assistent Daten replizieren wird geöffnet.
-
Geben Sie auf der Registerkarte Allgemein einen Namen und eine Beschreibung für die Replikationsaufgabe an. Klicken Sie dann auf Weiter.
-
Wählen Sie auf der Registerkarte Quellverbindung auswählen eine Verbindung zur Datenquelle aus. Sie können optional die Verbindungseinstellungen bearbeiten, indem Sie im Menü in der Spalte Aktionen die Option Bearbeiten auswählen.
Wenn Sie noch keine Verbindung zur Datenquelle erstellt haben, müssen Sie zuerst eine erstellen, indem Sie oben rechts auf der Registerkarte auf Verbindung erstellen klicken.
Sie können die Liste der Verbindung mit den Filtern auf der linken Seite filtern. Verbindungen können nach Quelltyp, Gateway, Bereich und Besitzer gefiltert werden. Die Schaltfläche Alle Filter über der Verbindungsliste zeigt die Anzahl der aktuellen Filter. Mithilfe dieser Schaltfläche können Sie das Fenster Filter auf der linken Seite öffnen oder schließen. Derzeit aktive Filter werden auch oberhalb der Liste der verfügbaren Verbindungen angezeigt.
Sie können die Liste auch sortieren, indem Sie in der Dropdown-Liste rechts Zuletzt geändert, Zuletzt erstellt oder Alphabetisch auswählen. Klicken Sie auf den Pfeil rechts neben der Liste, um die Sortierreihenfolge zu ändern.
Nachdem Sie eine Datenquellenverbindung ausgewählt haben, klicken Sie optional oben rechts auf der Registerkarte auf Verbindung testen (empfohlen) und dann auf Weiter.
-
Wählen Sie auf der Registerkarte Datensätze auswählen Tabellen bzw. Ansichten aus, die in die Replikationsaufgabe eingeschlossen werden sollen. Sie können auch Platzhalter verwenden und Auswahlregeln erstellen, wie in Auswählen von Daten aus einer Datenbank beschrieben.
-
Wählen Sie auf der Registerkarte Zielverbindung auswählen das Ziel aus der Liste der verfügbaren Verbindungen aus und klicken Sie dann auf Weiter. Die Registerkarte funktioniert genauso wie die oben beschriebene Registerkarte Quellverbindung auswählen.
-
Auf der Registerkarte Einstellungen können Sie optional die folgenden Einstellungen ändern und dann auf Weiter klicken.
Replikationsmodus
InformationshinweisWenn aus SaaS-Anwendungsquellen repliziert wird, ist der Replikationsmodus Vollständiges Laden standardmäßig aktiviert und kann nicht deaktiviert werden.- Vollständiges Laden: Lädt die Daten aus den ausgewählten Quelltabellen in die Zielplattform und erstellt bei Bedarf die Zieltabellen. Vollständiges Laden findet automatisch statt, wenn die Aufgabe gestartet wird, kann aber bei Bedarf auch manuell durchgeführt werden.
-
Änderungen anwenden: Aktualisiert die Zieltabellen fortlaufend mit allen an den Quelltabellen vorgenommenen Änderungen.
-
Änderungen speichern: Speichert die Änderungen an den Quelltabellen in Änderungstabellen (eine pro Quelltabelle).
Weitere Informationen finden Sie unter Änderungen speichern.
Bei der Arbeit mit Data Movement Gateway werden Änderungen an der Quelle nahezu in Echtzeit erfasst. Bei der Arbeit ohne Data Movement Gateway (durch Festlegen von Daten-Gateway auf Keine in den Konnektor-Einstellungen) werden Änderungen entsprechend den Scheduler-Einstellungen erfasst. Das Standardintervall für die Änderungserfassung ist alle sechs Stunden. Weitere Informationen finden Sie unter Planen von Aufgaben beim Arbeiten ohne Data Movement Gateway.
Modus „Änderungen anwenden“
InformationshinweisWenn Sie an Data Warehouse-Ziele replizieren, können Sie nicht auswählen, welcher Modus für Änderungen anwenden verwendet werden soll. Für maximale Effizienz werden Änderungen immer im Modus Stapeloptimiert angewendet.Änderungen werden mit einer der folgenden Methoden auf die Zieltabellen angewendet:
- Stapeloptimiert: Dies ist die Standardeinstellung. Wenn diese Option ausgewählt ist, werden Änderungen in Stapeln angewendet. Es wird eine Vorverarbeitung ausgeführt, um die Transaktionen auf die effizienteste Weise in Stapeln zu gruppieren.
- Transaktional: Wählen Sie diese Option aus, um jede Transaktion einzeln in der Reihenfolge des Commit anzuwenden. In diesem Fall ist strikte referenzielle Integrität für alle Tabellen gewährleistet.
Verbindung zu Bereitstellungsbereich
Wenn die Replikation an die unten aufgelisteten Data Warehouses erfolgt, müssen Sie einen Bereitstellungsbereich einrichten. Die Daten werden im Bereitstellungsbereich verarbeitet und vorbereitet, bevor sie an das Warehouse übertragen werden.
Wählen Sie entweder einen vorhandenen Bereitstellungsbereich aus oder klicken Sie auf Neu erstellen, um einen neuen Bereitstellungsbereich zu definieren, und befolgen Sie die Anleitungen in Verbinden mit Cloud-Speicher.
Um die Verbindungseinstellungen zu bearbeiten, klicken Sie auf Bearbeiten. Um die Verbindung zu testen (empfohlen), klicken Sie auf Verbindung testen.
Weitere Informationen dazu, welche Bereitstellungsbereiche für welche Data Warehouses unterstützt werden, finden Sie in der Spalte Als Bereitstellungsbereich unterstützt in Zielplattform-Anwendungsfälle und unterstützte Versionen.
Replikationsplaner
InformationshinweisDiese Einstellung ist nur relevant, wenn ohne Data Movement Gateway auf Datenquellen zugegriffen wird. Weitere Informationen zu den Vorteilen von Data Movement Gateway und den Anwendungsfällen, in denen es erforderlich ist, finden Sie unter Qlik Data Gateway - Data Movement.-
Daten replizieren alle: Sie können planen, wie häufig Änderungen an der Datenquelle erfasst werden, und eine Startuhrzeit und ein Startdatum einrichten. Wenn die Quelldatensätze CDC (Change Data Capture) unterstützen, werden nur die Quelldaten repliziert und auf die entsprechenden Zieltabellen angewendet. Wenn die Quelldatensätze CDC nicht unterstützen (z. B. Ansichten), werden die Änderungen angewendet, indem alle Quelldaten erneut in die entsprechenden Zieltabellen geladen werden. Wenn einige der Quelldatensätze CDC unterstützen und andere nicht, werden zwei getrennte Unteraufgaben erstellt (wobei davon ausgegangen wird, dass die Replikationsoptionen Änderungen anwenden oder Änderungen speichern ausgewählt sind): eine zum erneuten Laden der Datensätze, die CDC nicht unterstützen, und eine zum Erfassen der Änderungen für Datensätze, die CDC unterstützen.
Mit dem Aufgaben-Einrichtungsassistenten können Sie ein grundlegendes stündliches Intervall planen. Nachdem Sie die Einrichtung der Aufgabe abgeschlossen haben, können Sie verschiedene Planungsoptionen prüfen, wie in Planen von Aufgaben beim Arbeiten ohne Data Movement Gateway beschrieben.
Weitere Informationen zu Mindestplanintervallen entsprechend dem Datenquellentyp und der Abonnementstufe finden Sie unter Zulässige Mindestintervalle für die Planung.
-
Auf der Registerkarte Zusammenfassung wird eine Darstellung der Daten-Pipeline angezeigt. Wenn einige der ausgewählten Datensätze CDC nicht unterstützen, werden zwei Pipelines angezeigt: eine für die CDC-Aufgabe und eine für die Ladeaufgabe. Wählen Sie, ob Sie die Datenaufgabe <Name> öffnen oder Nichts tun möchten, und klicken Sie dann auf Erstellen.
Je nach Ihrer Auswahl wird entweder die Aufgabe geöffnet oder es wird eine Liste der Projekte angezeigt.
-
Wenn Sie wählen, die Aufgabe zu öffnen, werden auf der Registerkarte Datensätze die Struktur und die Metadaten der ausgewählten Quelltabellen angezeigt. Dazu gehören alle explizit aufgelisteten Tabellen sowie Tabellen, die mit den Auswahlregeln übereinstimmen.
Wenn Sie weitere Tabellen aus der Datenquelle hinzufügen möchten, klicken Sie auf Quelldaten auswählen.
-
Optional können Sie die Aufgabeneinstellungen wie in Datenreplikations-Aufgabeneinstellungen beschrieben ändern.
-
Sie können Umwandlungen auf die Datensätze anwenden, Daten filtern oder Spalten hinzufügen.
Weitere Informationen finden Sie unter Verwalten von Datensätzen.
-
Wenn Sie die gewünschten Transformationen hinzugefügt haben, können Sie die Datasets validieren, indem Sie auf Datensätze validieren klicken. Falls die Validierung fehlschlägt, beheben Sie die Fehler, bevor Sie fortfahren.
Weitere Informationen finden Sie unter Validieren und Anpassen der Datensätze.
-
Wenn Sie bereit sind, klicken Sie auf Vorbereiten, um die Datenaufgabe zu katalogisieren und sie für die Ausführung vorzubereiten.
-
Nachdem die Datenaufgabe vorbereitet ist, klicken Sie auf Ausführen.
Informationen zum Wiederherstellen von Aufgaben und zu anderen Methoden der Aufgabenausführung finden Sie unter Erweiterte Ausführungsoptionen.
-
Die Replikationsaufgabe beginnt, und Sie können den Fortschritt in Überwachung anzeigen. Weitere Informationen finden Sie unter Überwachen einer einzelnen Datenaufgabe.
Festlegen der Ladepriorität für Datensätze
Sie können die Ladereihenfolge der Datensätze in Ihrer Datenaufgabe steuern, indem Sie jedem Datensatz eine Ladepriorität zuweisen. Das kann zum Beispiel nützlich sein, wenn kleinere Datensätze vor größeren Datensätzen geladen werden sollen.
-
Klicken Sie auf Ladepriorität.
-
Wählen Sie für jeden Datensatz eine Ladepriorität aus.
Die Standard-Ladepriorität ist Normal. Datensätze werden in der folgenden Prioritätsreihenfolge geladen:
-
Höchste
-
Höher
-
Hoch
-
Normal
-
Niedrig
-
Niedriger
-
Niedrigste
Datensätze mit der gleichen Priorität werden in keiner bestimmten Reihenfolge geladen.
-
-
Klicken Sie auf OK.
Aktualisieren von Metadaten
Sie können die Metadaten in der Aufgabe in der Ansicht Design einer Aufgabe aktualisieren, um sie an Änderungen in den Metadaten in der Quelle auszurichten. Für SaaS-Anwendungen, die Metadata Manager verwenden, muss Metadata Manager aktualisiert werden, bevor Sie Metadaten in der Datenaufgabe aktualisieren können.
-
Sie haben folgende Möglichkeiten:
-
Klicken Sie auf ... und dann auf Metadaten aktualisieren, um Metadaten für alle Datensätze in der Aufgabe zu aktualisieren.
-
Klicken Sie auf ... in einem Datensatz in Datensätze und dann auf Metadaten aktualisieren, um Metadaten für einen einzelnen Datensatz zu aktualisieren.
Sie können den Status der Metadatenaktualisierung unter Metadaten aktualisieren unten im Bildschirm anzeigen. Wenn Sie den Cursor über bewegen, können Sie sehen, wann die Metadaten zuletzt aktualisiert wurden.
-
-
Bereiten Sie die Datenaufgabe vor, um die Änderungen anzuwenden.
Wenn Sie die Datenaufgabe vorbereitet haben und die Änderungen angewendet wurden, werden die Änderungen aus Metadaten aktualisieren entfernt.
Sie müssen Speicheraufgaben vorbereiten, die diese Aufgabe nutzen, um die Änderungen weiterzugeben.
Wenn eine Spalte entfernt wird, wird eine Umwandlung mit Null-Werten hinzugefügt, um sicherzustellen, dass im Speicher keine historischen Daten verloren gehen.
Beschränkungen
-
Wenn vor dem Umbenennen im gleichen Zeitfenster eine Spalte gelöscht wurde, führt dies zur Umbenennung der gelöschten Spalte, falls sie den gleichen Datentyp und die gleiche Datenlänge hat.
Beispiel:
Vorher: a b c d
Nachher: a c1 d
In diesem Beispiel wurde b gelöscht und c in c1 umbenannt, und b und c haben den gleichen Datentyp und die gleiche Datenlänge.
Dies wird als Umbenennung von b in c1 und Löschen von c interpretiert.
-
Die Umbenennung der letzten Spalte wird nicht erkannt, auch wenn die letzte Spalte gelöscht und die vorherige umbenannt wurde.
Beispiel:
Vorher: a b c d
Nachher: a b c1
In diesem Beispiel wurde d gelöscht und c in c1 umbenannt.
Dies wird als Löschen von c und d und Hinzufügen von c1 interpretiert.
-
Es wird davon ausgegangen, dass neue Spalten am Ende hinzugefügt werden. Wenn Spalten in der Mitte mit dem gleichen Datentyp wie die nächste Spalte hinzugefügt werden, kann dies als Löschen und Umbenennen interpretiert werden.
Beschränkungen und Überlegungen beim Replizieren von Daten
Umwandlungen unterliegen folgenden Einschränkungen:
- Umwandlungen werden für Spalten mit Sprachen, die von rechts nach links geschrieben werden, nicht unterstützt.
Umwandlungen können nicht für Spalten durchgeführt werden, die Sonderzeichen (z. B. #, \, /, -) in ihrem Namen enthalten.
- Die einzige unterstützte Umwandlung für LOB/CLOB-Datentypen ist das Ablegen der Spalte auf das Ziel.
- Die Verwendung einer Umwandlung zur Umbenennung einer Spalten und anschließenden Hinzufügung einer neuen Spalten mit demselben Namen wird nicht unterstützt.
Das Ändern der Nullfähigkeit, entweder direkt oder über eine Umwandlungsregel, wird für Spalten, die verschoben werden, nicht unterstützt. Neue Spalten, die in der Aufgabe erstellt werden, sind jedoch standardmäßig nullfähig.