Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Eigenschaften von HDFS

Zu konfigurierende Eigenschaften, um eine Verbindung zu einem bestimmten Hadoop Distributed File System (HDFS) herstellen zu können.

Verbindung zu HDFS

Wählen Sie in der Liste HDFS aus und konfigurieren Sie die Verbindung.

Konfiguration

Wählen Sie Ihre Engine aus der Liste aus und richten Sie die Haupt- und erweiterten Einstellungen ein.

Verbindungseinstellungen
Eigenschaft Konfiguration
User name (Benutzername) User name (Benutzername)

Geben Sie nach dem Konfigurieren der Verbindung einen Anzeigenamen (obligatorisch) und eine Beschreibung (optional) ein.

Datensätze in HDFS

Datensatzkonfiguration
Eigenschaft Konfiguration
Dataset name (Datensatzname) Geben Sie einen Anzeigenamen für den Datensatz ein. Dieser Name wird in allen Talend Cloud-Anwendungen als eindeutige Kennung für den Datensatz verwendet.
Verbindung Wählen Sie Ihre Verbindung in der Liste aus. Wenn Sie einen Datensatz basierend auf einer vorhandenen Verbindung erstellen, ist dieses Feld schreibgeschützt.
HDFS-Dateneinstellungen
Eigenschaft Konfiguration
Path (Pfad) Geben Sie den Pfad der abzurufenden Daten im Dateisystem ein.
Format configuration (Formatkonfiguration)
Eigenschaft Konfiguration
Auto detect (Autom. erkennen) Klicken Sie auf diese Schaltfläche, damit das Format der abzurufenden Datei automatisch erkannt wird.
Format Sie können auch in der Liste das Format der abzurufenden Datei auswählen und die Informationen zum Dateiformat eingeben bzw. auswählen:
  • CSV:
    • Record delimiter (Datensatzbegrenzer): Wählen Sie den Typ des Datensatzbegrenzers aus, der in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld Custom record delimiter (Benutzerdefinierter Datensatzbegrenzer) einen benutzerspezifischen Datensatzbegrenzer eingeben.
    • Field delimiter (Feldbegrenzer): Wählen Sie den Typ des Feldbegrenzers aus, der in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld Custom field delimiter (Benutzerdefinierter Feldbegrenzer) einen benutzerspezifischen Feldbegrenzer eingeben.
    • Text enclosure character (Textbegrenzungszeichen): Geben Sie das Zeichen ein, das zur Begrenzung von Text verwendet wird.
    • Escape character (Maskierungszeichen): Geben Sie das Zeichen ein, das in den abzurufenden Datensätzen geschützt werden soll.
    • Encoding (Codierung): Wählen Sie den Typ der Codierung aus, die in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld Custom encoding (Benutzerdefinierte Codierung) einen benutzerspezifischen Codierungstyp eingeben.
    • Set header (Header festlegen): Aktivieren Sie diese Option, wenn die abzurufende Datei Kopfzeilen (Header) enthält, und geben Sie die Anzahl der im Schema zu überspringenden Zeilen ein bzw. wählen Sie sie aus.
  • Excel:
    • Excel format (Excel-Format): Wählen Sie das Format bzw. die Version der abzurufenden Datei aus.
    • Sheet (Arbeitsblatt): Geben Sie den Namen des spezifischen Excel-Arbeitsblatts ein, das Sie abrufen möchten.
    • Set header/footer (Header/Fußzeile festlegen): Aktivieren Sie diese Optionen, wenn die abzurufende Datei Kopf- (Header) und/oder Fußzeilen enthält, und geben Sie die Anzahl der im Schema zu überspringenden Zeilen ein bzw. wählen Sie sie aus.
  • Avro: Keine spezifischen Parameter erforderlich für dieses Format.
  • Parquet: Keine spezifischen Parameter erforderlich für dieses Format.
  • JSON: Keine spezifischen Parameter erforderlich für dieses Format.
Je nachdem, ob der Konnektor als Quell- oder Zieldatensatz verwendet wird, können zusätzliche Parameter angezeigt werden:
  • Für HDFS-Quelldatensätze:
    • Force parallelism—ignore escape char and text enclosure parameters (Parallelismus forcieren - Maskierungszeichen und Textbegrenzungsparameter ignorieren): Aktivieren Sie diese Option, wenn Maskierungszeichen sowie die Zeichen, die in Ihrer Datei zur Begrenzung von Text verwendet werden, ignoriert werden sollen.
  • Für HDFS-Zieldatensätze:
    • Overwrite (Überschreiben): Aktivieren Sie diese Option, wenn die Datei bereits vorhanden ist und Sie deren Inhalt überschreiben möchten.
    • Merge output (Ausgabe zusammenführen): Aktivieren Sie diese Option, wenn die Datei bereits vorhanden ist und Sie den vorhandenen und aktualisierten Dateiinhalt zusammenführen möchten.
    • Map input column names to output (Mapping von Eingabe- auf Ausgabespaltennamen): Diese Option bezieht sich nur auf Dateien im Format CSV, JSON und Excel. Mit dieser Option wird sichergestellt, dass die Namen der Eingabe- und Ausgabefelder übereinstimmen.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!