Eigenschaften von HDFS
Zu konfigurierende Eigenschaften, um eine Verbindung zu einem bestimmten Hadoop Distributed File System (HDFS) herstellen zu können.
Verbindung zu HDFS
Wählen Sie in der Liste HDFS aus und konfigurieren Sie die Verbindung.
Konfiguration
Wählen Sie Ihre Engine aus der Liste aus und richten Sie die Haupt- und erweiterten Einstellungen ein.
Eigenschaft | Konfiguration |
---|---|
User name (Benutzername) | User name (Benutzername) |
Geben Sie nach dem Konfigurieren der Verbindung einen Anzeigenamen (obligatorisch) und eine Beschreibung (optional) ein.
Datensätze in HDFS
Eigenschaft | Konfiguration | |
---|---|---|
Dataset name (Datensatzname) | Geben Sie einen Anzeigenamen für den Datensatz ein. Dieser Name wird in allen Talend Cloud-Anwendungen als eindeutige Kennung für den Datensatz verwendet. | |
Verbindung | Wählen Sie Ihre Verbindung in der Liste aus. Wenn Sie einen Datensatz basierend auf einer vorhandenen Verbindung erstellen, ist dieses Feld schreibgeschützt. |
Eigenschaft | Konfiguration |
---|---|
Path (Pfad) | Geben Sie den Pfad der abzurufenden Daten im Dateisystem ein. |
Eigenschaft | Konfiguration |
---|---|
Auto detect (Autom. erkennen) | Klicken Sie auf diese Schaltfläche, damit das Format der abzurufenden Datei automatisch erkannt wird. |
Format | Sie können auch in der Liste das Format der abzurufenden Datei auswählen und die Informationen zum Dateiformat eingeben bzw. auswählen:
|
Je nachdem, ob der Konnektor als Quell- oder Zieldatensatz verwendet wird, können zusätzliche Parameter angezeigt werden:
- Für HDFS-Quelldatensätze:
- Force parallelism—ignore escape char and text enclosure parameters (Parallelismus forcieren - Maskierungszeichen und Textbegrenzungsparameter ignorieren): Aktivieren Sie diese Option, wenn Maskierungszeichen sowie die Zeichen, die in Ihrer Datei zur Begrenzung von Text verwendet werden, ignoriert werden sollen.
- Für HDFS-Zieldatensätze:
- Overwrite (Überschreiben): Aktivieren Sie diese Option, wenn die Datei bereits vorhanden ist und Sie deren Inhalt überschreiben möchten.
- Merge output (Ausgabe zusammenführen): Aktivieren Sie diese Option, wenn die Datei bereits vorhanden ist und Sie den vorhandenen und aktualisierten Dateiinhalt zusammenführen möchten.
- Map input column names to output (Mapping von Eingabe- auf Ausgabespaltennamen): Diese Option bezieht sich nur auf Dateien im Format CSV, JSON und Excel. Mit dieser Option wird sichergestellt, dass die Namen der Eingabe- und Ausgabefelder übereinstimmen.