Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Amazon Redshift

Sie können Amazon Redshift als eine Zieldatenplattform in einer Daten-Pipeline oder einer Replikationsaufgabe. In einer Daten-Pipeline können verschiedene ELT-Vorgänge auf der Zielplattform durchgeführt werden, wie das Speichern oder Umwandeln von Daten, das Erstellen von Data Marts und die Datenregistrierung. Im Gegensatz dazu werden bei einer Replikationsaufgabe die Daten direkt aus einem Quellsystem in ein Zielsystem mit grundlegenden Umwandlungsfunktionen repliziert. ELT-Vorgänge werden nicht unterstützt. verwenden.

Das Einrichten von Amazon Redshift als Ziel bedeutet:

Einrichten eines Cloud-Bereitstellungsbereichs

InformationshinweisWenn Sie vorhandene Daten registrieren, brauchen Sie keinen Cloud-Bereitstellungsbereich einzurichten.

Für die Konfiguration einer Verbindung zu Amazon Redshift ist auch das Einrichten einer Verbindung zu einem Amazon S3 Cloud-Bereitstellungsbereich erforderlich, in dem Daten und Änderungen bereitgestellt werden, bevor sie angewendet und gespeichert werden.

Weitere Informationen zum Einrichten einer Verbindung zu Amazon S3 finden Sie unter Amazon S3.

Konfigurieren einer Verbindung zu Amazon Redshift

Nachdem Sie die Bereitstellungseinstellungen angegeben haben, gehen Sie wie folgt vor:

  1. Klicken Sie in Verbindungen auf Verbindung erstellen.

  2. Wählen Sie den Konnektor für denAmazon Redshift-Zielkonnektor aus und geben Sie dann die folgenden Einstellungen an:

Datenziel

InformationshinweisDieses Feld ist für Qlik Talend Cloud Starter-Abonnements nicht verfügbar, da Data Movement Gateway für diese Abonnementstufe nicht unterstützt wird.

Ein Data Movement Gateway ist nur erforderlich, wenn die Zieldatenbank nicht über Qlik Cloud, sondern nur über einen Private Link erreichbar ist (wenn sie sich z. B. lokal hinter einer Firewall oder in einer Virtual Private Cloud befindet). Wählen Sie in diesem Fall das Data Movement Gateway aus, über das Sie auf die Zieldatenbank zugreifen möchten.

Abhängig von Ihrem Anwendungsfall ist dies das gleiche Data Movement Gateway, das zum Verschieben von Daten aus der Datenquelle bereitgestellt wurde, oder ein anderes.

Informationen zu Anwendungsfällen für Data Movement Gateway finden Sie unter Wann ist Data Movement Gateway erforderlich? und Häufige Anwendungsfälle.

Wenn auf die Zieldatenbank direkt über Qlik Cloud zugegriffen werden kann, wählen Sie Keine aus.

InformationshinweisWenn Sie über Data Movement Gateway auf die Zieldatenbank zugreifen, müssen Sie auch den entsprechenden Treiber auf dem Data Movement Gateway-Rechner installieren. Weitere Einzelheiten finden Sie unter Treibereinrichtung unten.

Verbindungseigenschaften

  • Server: Hostname des Amazon Redshift-Datenbankservers.

  • Port: Der Port, über den Sie auf Ihre Amazon Redshift-Datenbank zugreifen möchten. Standard ist 5439.

Kontoeigenschaften

Benutzername und Kennwort: Benutzername und Kennwort eines Benutzers, der zum Zugriff auf die Amazon Redshift-Datenbank berechtigt ist.

Datenbankeigenschaften

  • Datenbankname: Es gibt zwei Methoden zum Angeben einer Datenbank:

    • Methode 1 – Aus einer Liste auswählen: Klicken Sie auf Datenbanken laden und wählen Sie dann eine Datenbank aus.
    • Methode 2 – Manuell: Wählen Sie Datenbanknamen manuell eingeben aus und geben Sie dann den Datenbanknamen ein.

Interne Eigenschaften

Interne Eigenschaften sind für besondere Anwendungsfälle vorgesehen und werden daher nicht im Dialogfenster angezeigt. Sie sollten sie nur verwenden, wenn Sie vom Qlik Support dazu angewiesen werden.

Verwenden Sie die Schaltflächen Neu erstellen und Abbrechen rechts neben den Feldern, um Eigenschaften wie erforderlich hinzuzufügen oder zu entfernen.

Name

Der Anzeigename für die Verbindung.

Voraussetzungen

Erforderliche Berechtigungen

Gewähren Sie die folgenden Berechtigungen für die Redshift-Datenbank:

  • Gewähren Sie COPY
  • Gewähren Sie INSERT
  • Gewähren Sie UPDATE
  • Gewähren Sie DELETE
  • Gewähren Sie SELECT
  • Create Schema (nur erforderlich, wenn keine Schemas vorhanden sind und Sie diese mit Qlik Talend Data Integrationerstellen möchten)
  • Gewähren Sie CREATE TABLE
  • Gewähren Sie ALTER TABLE
  • Gewähren Sie DROP TABLE

Treibereinrichtung

Ein Treiber ist nur erforderlich, wenn Sie über Data Movement Gateway auf die Datenbank zugreifen. Installieren Sie in diesem Fall den Treiber auf dem Data Movement Gateway-Rechner.

Sie können den driver mit dem Treiberinstallations-Dienstprogramm (empfohlen) oder manuell installieren. Eine manuelle Installation sollte nur in dem unwahrscheinlichen Fall versucht werden, dass Sie beim Verwenden des Treiberinstallations-Dienstprogramms auf Probleme stoßen.

Verwenden des Treiberinstallations-Dienstprogramms zum Installieren des Treibers

In diesem Abschnitt wird die Installation des erforderlichen driver beschrieben. Der Prozess umfasst das Ausführen eines Skripts, das den erforderlichen driver automatisch herunterlädt, installiert und konfiguriert. Sie können auch Skripte ausführen, um den driver bei Bedarf zu aktualisieren und zu deinstallieren.

  • Vergewissern Sie sich, dass Python 3.6 oder höher auf dem Data Movement-Gateway-Server installiert ist.

    Python ist in den meisten Linux-Distributionen vorinstalliert. Führen Sie den folgenden Befehl aus, um zu prüfen, welche Python-Version auf Ihrem System installiert ist.

    python3 --version

So laden Sie den driver herunter und installieren ihn:

  1. Halten Sie den Data Movement Gateway-Dienst an:

    sudo systemctl stop repagent

  2. Bestätigen Sie optional, dass der Dienst angehalten wurde:

    sudo systemctl status repagent

    Der Status lautet wie folgt:

    Active: inactive (dead) since <timestamp> ago

  3. Ändern Sie auf dem Data Movement-Gateway-Computer das Arbeitsverzeichnis zu:

    opt/qlik/gateway/movement/drivers/bin

  4. Führen Sie den folgenden Befehl aus:

    Syntax:

    ./install redshift

    Wenn der driver (aufgrund von Zugriffsbeschränkungen oder technischen Fehlern) nicht heruntergeladen werden kann, wird eine Meldung mit Anleitungen dazu angezeigt, wo Sie den driver herunterladen können und wohin er im Data Movement-Gateway-Computer kopiert werden muss. Führen Sie dann den Befehl install redshift erneut aus.

    Andernfalls wird die Endbenutzer-Lizenzvereinbarung für den driver angezeigt.

  5. Gehen Sie folgendermaßen vor:

    • Drücken Sie mehrmals die [Eingabetaste], um langsam durch die Endbenutzer-Lizenzvereinbarung zu scrollen.
    • Drücken Sie mehrmals die Leertaste, um schnell durch die Endbenutzer-Lizenzvereinbarung zu scrollen.
    • Drücken Sie q, um den Lizenztext zu schließen und die Optionen zum Akzeptieren der Endbenutzer-Lizenzvereinbarung anzuzeigen.
  6. Gehen Sie folgendermaßen vor:

    • Geben Sie „y“ ein und drücken Sie die [Eingabetaste], um die Endbenutzer-Lizenzvereinbarung zu akzeptieren und mit der Installation zu beginnen.
    • Geben Sie „n“ ein und drücken Sie die [Eingabetaste], um die Endbenutzer-Lizenzvereinbarung abzulehnen und den Installationsvorgang abzubrechen.
    • Geben Sie „v“ ein und drücken Sie die [Eingabetaste], um die Endbenutzer-Lizenzvereinbarung erneut anzuzeigen.

  7. Der driver wird installiert.

  8. Warten Sie, bis die Installation abgeschlossen ist („Complete!“ wird angezeigt) und starten Sie dann den Data Movement Gateway-Dienst:

    sudo systemctl start repagent

  9. Bestätigen Sie optional, dass der Dienst gestartet wurde:

    sudo systemctl status repagent

    Der Status lautet wie folgt:

    Active: active (running) since <timestamp> ago

Führen Sie den Befehl „update“ aus, wenn Sie vorherige Versionen des driver deinstallieren möchten, bevor Sie den bereitgestellten driver installieren.

So laden Sie den driver herunter und aktualisieren ihn:

  1. Halten Sie den Data Movement Gateway-Dienst an:

    sudo systemctl stop repagent

  2. Bestätigen Sie optional, dass der Dienst angehalten wurde:

    sudo systemctl status repagent

    Der Status lautet wie folgt:

    Active: inactive (dead) since <timestamp> ago

  3. Ändern Sie auf dem Data Movement-Gateway-Computer das Arbeitsverzeichnis zu:

    opt/qlik/gateway/movement/drivers/bin

  4. Führen Sie den folgenden Befehl aus:

    Syntax:

    ./update redshift

    Wenn der driver (aufgrund von Zugriffsbeschränkungen oder technischen Fehlern) nicht heruntergeladen werden kann, wird eine Meldung mit Anleitungen dazu angezeigt, wo Sie den driver herunterladen können und wohin er im Data Movement-Gateway-Computer kopiert werden muss. Führen Sie dann den Befehl update redshift erneut aus.

    Andernfalls wird die Endbenutzer-Lizenzvereinbarung für den driver angezeigt.

  5. Gehen Sie folgendermaßen vor:

    • Drücken Sie mehrmals die [Eingabetaste], um langsam durch die Endbenutzer-Lizenzvereinbarung zu scrollen.
    • Drücken Sie mehrmals die Leertaste, um schnell durch die Endbenutzer-Lizenzvereinbarung zu scrollen.
    • Drücken Sie q, um den Lizenztext zu schließen und die Optionen zum Akzeptieren der Endbenutzer-Lizenzvereinbarung anzuzeigen.
  6. Gehen Sie folgendermaßen vor:

    • Geben Sie „y“ ein und drücken Sie die [Eingabetaste], um die Endbenutzer-Lizenzvereinbarung zu akzeptieren und mit der Installation zu beginnen.
    • Geben Sie „n“ ein und drücken Sie die [Eingabetaste], um die Endbenutzer-Lizenzvereinbarung abzulehnen und den Installationsvorgang abzubrechen.
    • Geben Sie „v“ ein und drücken Sie die [Eingabetaste], um die Endbenutzer-Lizenzvereinbarung von Anfang an anzuzeigen.
  7. Der alte driver wird deinstalliert und der neue driver installiert.

  8. Warten Sie, bis die Installation abgeschlossen ist („Complete!“ wird angezeigt) und starten Sie dann den Data Movement Gateway-Dienst:

    sudo systemctl start repagent

  9. Bestätigen Sie optional, dass der Dienst gestartet wurde:

    sudo systemctl status repagent

    Der Status lautet wie folgt:

    Active: active (running) since <timestamp> ago

Führen Sie den Befehl „uninstall“ aus, wenn Sie den driver deinstallieren möchten.

So deinstallieren Sie den driver:

  1. Halten Sie alle Aufgaben an, die für die Verwendung dieses Konnektors konfiguriert sind.

  2. Ändern Sie auf dem Data Movement-Gateway-Computer das Arbeitsverzeichnis zu:

    opt/qlik/gateway/movement/drivers/bin

  3. Führen Sie den folgenden Befehl aus:

    Syntax:

    ./uninstall redshift

    Der driver wird deinstalliert.

Manuelles Installieren des Treibers

Nehmen Sie nur dann eine manuelle Installation des driver vor, wenn die automatische Treiberinstallation nicht erfolgreich abgeschlossen werden konnte.

  1. Halten Sie den Data Movement Gateway-Dienst an:

    sudo systemctl stop repagent

  2. Bestätigen Sie optional, dass der Dienst angehalten wurde:

    sudo systemctl status repagent

  3. Der Status lautet wie folgt:

    Active: inactive (dead) since <timestamp> ago

  4. Laden Sie die Linux SQL-Client-Tools herunter, die zum Verbinden mit dem Amazon Redshift-Cluster erforderlich sind, und installieren Sie sie. Für Qlik Data Gateway - Data Movement ist Amazon Redshift ODBC Driver (x64) 1.4.65.1000 erforderlich.

    Laden Sie den Treiber hier herunter:

    https://s3.amazonaws.com/redshift-downloads/drivers/odbc/1.4.65.1000/AmazonRedshiftODBC-64-bit-1.4.65.1000-1.x86_64.rpm

    Bearbeiten Sie nach dem Installieren des ODBC-Treibers die Datei /etc/odbcinst.ini wie folgt:

    [ODBC Drivers]

    Amazon Redshift (x64)=Installed

    Und:

    [Amazon Redshift (x64)]

    Description=Amazon Redshift ODBC Driver (64-bit)

    Driver=/opt/amazon/redshiftodbc/lib/64/libamazonredshiftodbc64.so

  5. Starten Sie den Data Movement Gateway-Dienst:

    sudo systemctl start repagent

  6. Bestätigen Sie optional, dass der Dienst gestartet wurde:

    sudo systemctl status repagent

    Der Status lautet wie folgt:

    Active: active (running) since <timestamp> ago

Eine Liste der für Amazon Redshift unterstützten Treiber finden Sie unter http://docs.aws.amazon.com/redshift/latest/mgmt/configure-odbc-connection.html.

Port

Port 5439 (Amazon Redshift-Cluster) muss für ausgehende Kommunikation geöffnet sein.

Zertifikat der Zertifizierungsstelle

Data Movement Gateway stellt über SSL eine Verbindung zu AWS her. Dafür muss ein entsprechende ZS-Zertifikat auf dem Data Movement Gateway-Rechner vorhanden sein; andernfalls schlägt die Verbindung fehl. Das Ziel des ZS-Zertifikats ist die Authentifizierung des Besitzes des AWS-Server-Zertifikats.

Stellen Sie sicher, dass das benötigte ZS-Zertifikat an folgendem Speicherort auf dem Linux-Rechner vorhanden ist:

/etc/pki/tls/certs/ca-bundle.crt

Falls dies nicht der Fall ist, ist die einfachste Lösung, das Zertifikat-Bundle von einem anderen Linux-Rechner zu kopieren.

Allgemeine Voraussetzungen und Überlegungen

  • Wenn Ihre Datenquelle 4-Byte-Emoji-Zeichen enthält, verwenden Sie eine Umwandlung, um den Datentyp von WSTRING(n ) in WSTRING ( n*2 ) zu konvertieren.

  • Stellen Sie sicher, dass die Uhrzeit und die Zeitzoneneinstellungen auf dem Data Movement Gateway-Rechner stimmen. Dies ist erforderlich, um Folgendes sicherzustellen:

    • Ordnungsgemäße Synchronisierung von Aufgaben für vollständiges Laden und CDC-Aufgaben
    • Korrelation der Transaktionsprotokollzeit mit der tatsächlichen Uhrzeit
  • Sie können keine Live-Ansichten und Verlaufsansichten in Qlik Cloud Analytics Services aus Datensätzen einlesen, die in einem Amazon Redshift-Ziel von Qlik Talend Data Integration erstellt wurden.

Einschränkungen und Überlegungen

  • Der Amazon Redshift-Konnektor unterstützt nur Standardauthentifizierung (Benutzername und Kennwort).

Datentypen

Die folgenden Tabellen zeigen die Amazon Redshift-Datentypen, die bei der Verwendung von Qlik Cloud unterstützt werden, sowie die Standardzuordnung von Qlik Cloud-Datentypen.

Informationen zum nativen Datentyp werden beibehalten und in der Spalte Nativer Datentyp in Datensatzansichten angezeigt. Wenn die Spalte nicht angezeigt wird, müssen Sie die Spaltenauswahl in der Datensatzansicht öffnen und die Spalte Nativer Datentyp auswählen.

InformationshinweisIn Qlik Cloud wird die Stringlänge in Zeichen angegeben, während in Redshift die varchar-Länge in Byte angegeben wird. Die Anzahl der Byte pro Zeichen kann je nach Zeichen und Codierung unterschiedlich sein. Qlik Cloud nimmt einen Länge von 3 Byte pro Zeichen an. Wenn Sie also „wstring(10)“ definieren, wird die Tabelle tatsächlich als „varchar(30)“ erstellt.
Unterstützte Datentypen
Qlik Cloud-Datentypen Amazon Redshift-Datentypen

BOOLEAN

BOOLEAN

BYTES

VARBINARY(Länge)

DATE

DATE

TIME

VARCHAR (20)

DATETIME

Wenn Dezimalstellen => 0 und =< 6, dann:

TIMESTAMP

Wenn Dezimalstellen => 7 und =< 12, dann:

VARCHAR (37)

INT1

INT2

INT2

INT2

INT4

INT4

INT8

INT8

NUMERIC

Wenn Dezimalstellen => 0 und =< 37, dann:

NUMERIC (Genauigkeit, Dezimalstellen)

Wenn Dezimalstellen => 38 und =< 127, dann:

VARCHAR (Länge)

REAL4

FLOAT4

REAL8

FLOAT8

STRING

Wenn Länge => 1 und =< 65535, dann:

VARCHAR (Länge in Byte)

Wenn Länge => 65535 und =< 2147483647, dann:

VARCHAR (65535)

UINT1

INT2

UINT2

INT4

UINT4

INT8

UINT8

NUMERIC (20,0)

WSTRING

Wenn Länge => 1 und =< 21845, dann:

NVARCHAR (Länge in Byte)

Wenn Länge => 21846 und =< 2147483647, dann:

NVARCHAR (65535)

BLOB

VARBYTE (16777216)

NCLOB

VARCHAR (65535)

CLOB

VARCHAR (65535)

Die folgenden SQL Server-Datentypen werden nicht unterstützt. Daten werden nicht gelesen.

  • HLLSKETCH

Die folgenden Datentypen werden in VARCHAR (65535) konvertiert:

  • GEOGRAPHY

  • GEOMETRY

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!