Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Eigenschaften von Azure Data Lake Storage Gen2

Zu konfigurierende Eigenschaften, damit eine Verbindung zu einem bestimmten Azure Data Lake Storage Gen2-Dateisystem hergestellt werden kann.

Verbindung zu Azure Data Lake Storage Gen2

Wählen Sie in der Liste Azure Data Lake Storage Gen2 aus und konfigurieren Sie die Verbindung.

Konfiguration

Wählen Sie Ihre Engine aus der Liste aus und richten Sie die Haupt- und erweiterten Einstellungen ein.

Haupteinstelllungen
Eigenschaft Konfiguration
Authentication method (Authentifizierungsmethode) Wählen Sie den Datenbanktreiber aus, den Sie verwenden möchten.
Account Name (Kontoname) Wenn diese Option deaktiviert ist, müssen Sie alle Parameter, die die zu verwendende Datenbank identifizieren, in die entsprechenden Felder eingeben.

Klicken Sie auf Load default values (Standardwerte laden), um die Felder mit den mit diesem Datenbanktyp verknüpften Standardwerten zu füllen.

InformationshinweisAnmerkung: Verwenden Sie den Hostnamen des Zielsystems anstelle von localhost in der URL, da die Remote Engine Gen2 in der Lage sein muss, mit dem Zielsystem zu kommunizieren.
Endpoint suffix (Endpunkt-Suffix) Wenn diese Option aktiviert ist, geben Sie die JDBC-URL ein, die die zu verwendende Datenbank identifiziert.

Folgendes Format wird erwartet: jdbc:<dbtyp>://<endpunkt>[:<port>]/<datenbankname>.

InformationshinweisAnmerkung: Verwenden Sie den Hostnamen des Zielsystems anstelle von localhost in der URL, da die Remote Engine Gen2 in der Lage sein muss, mit dem Zielsystem zu kommunizieren.
Erweiterte Einstellungen
Eigenschaft Konfiguration
Timeout Legen Sie die maximale Anzahl an Sekunden fest, die ein Benutzer auf eine verfügbare Verbindung warten soll. Wenn dieser Zeitraum abgelaufen und die Verbindung nach wie vor nicht verfügbar ist, wird eine Ausnahme ausgegeben.

Geben Sie nach dem Konfigurieren der Verbindung einen Anzeigenamen (obligatorisch) und eine Beschreibung (optional) ein.

Datensätze in Azure Data Lake Storage Gen2

Datensatzkonfiguration
Eigenschaft Konfiguration
Dataset name (Datensatzname) Geben Sie einen Anzeigenamen für den Datensatz ein. Dieser Name wird in allen Talend Cloud-Anwendungen als eindeutige Kennung für den Datensatz verwendet.
Verbindung Wählen Sie Ihre Verbindung in der Liste aus. Wenn Sie einen Datensatz basierend auf einer vorhandenen Verbindung erstellen, ist dieses Feld schreibgeschützt.
Filesystem (Dateisystem) Wählen Sie den Namen Ihres Azure Data Lake Storage-Dateisystems aus bzw. geben Sie ihn ein.
Blob path (Blob-Pfad) Geben Sie den Pfad des Verzeichnisses ein, das die abzurufende Datei enthält.
Format Wählen Sie in der Liste das Format der abzurufenden Datei aus und geben Sie die Informationen zum Dateiformat ein bzw. wählen Sie sie aus:
  • CSV:
    • Field delimiter (Feldbegrenzer): Wählen Sie den Typ des Feldbegrenzers aus, der in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld custom record delimiter (Benutzerdefinierter Feldbegrenzer) einen benutzerspezifischen Feldbegrenzer eingeben.
    • Record separator (Datensatzbegrenzer): Wählen Sie den Typ des Datensatzbegrenzers aus, der in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld custom record delimiter (Benutzerdefinierter Datensatzbegrenzer) einen benutzerspezifischen Datensatzbegrenzer eingeben.
    • Text enclosure character (Textbegrenzungszeichen): Geben Sie das Zeichen ein, das zur Begrenzung von Text verwendet wird.
    • Escape character (Maskierungszeichen): Geben Sie das Zeichen ein, das in den abzurufenden Datensätzen geschützt werden soll.
    • Header: Aktivieren Sie diese Option, wenn die abzurufende Datei Kopfzeilen (Header) enthält, und geben Sie die Anzahl der im Schema zu überspringenden Zeilen ein bzw. wählen Sie sie aus.
    • CSV schema (CSV-Schema): Geben Sie das Ihrer CSV-Datei entsprechende Schema ein.
    • File encoding (Dateicodierung): Wählen Sie den Typ der Codierung aus, die in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld Custom encoding (Benutzerdefinierte Codierung) einen benutzerspezifischen Codierungstyp eingeben.
  • Avro: Keine spezifischen Parameter erforderlich für dieses Format.
  • JSON: Keine spezifischen Parameter erforderlich für dieses Format.
  • Parquet: Keine spezifischen Parameter erforderlich für dieses Format.
  • Delta: Keine spezifischen Parameter erforderlich für dieses Format.
    InformationshinweisWichtig: Partitionierte Delta-Tabellen werden nicht unterstützt. Jede partitionierte Spalte wird zurückgegeben.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!