HDFSのプロパティ
特定のHadoop Distributed File System (HDFS)に接続できるよう設定するプロパティです。
HDFS接続
リストからHDFSを選択し、接続を設定します。
設定
リストからエンジンを選択し、メイン設定と詳細設定を行います。
プロパティ | 設定 |
---|---|
ユーザー名 | ユーザー名 |
接続を設定した後は、表示名(必須)と説明(オプション)を入力します。
HDFSデータセット
プロパティ | 設定 | |
---|---|---|
[Dataset Name] (データセット名) | データセットの表示名を入力します。この名前はすべてのTalend Cloudアプリでデータセットの一意識別子として使われます。 | |
[Connection] (接続) | リストで接続を選択します。既存の接続に基づいてデータセットを作成する場合、このフィールドは読み取り専用となります。 |
プロパティ | 設定 |
---|---|
[Path] (パス) | ファイルシステムで取得するデータをポイントするパスを入力します。 |
プロパティ | 設定 |
---|---|
自動検出 | このボタンをクリックすると、取得するデータの形式が自動的に検出されます。 |
[Format] (形式) | または、取得する次のようなファイル形式をリストで選択し、そのファイル形式に関連する情報を入力または選択します。
|
コネクターがソースデータセットやデスティネーションデータセットとして使われているかどうかによって、次のようなパラメーターが表示されることがあります。
- HDFSソースデータセットの場合:
- [Force parallelism-ignore escape char and text enclosure parameters] (並列処理を強制 - エスケープ文字とテキスト囲み文字パラメーターを無視): ファイル内のエスケープ文字、およびテキストを囲むための文字を無視したい場合は、このオプションを有効にします。
- HDFSデスティネーションデータセットの場合:
- [Overwrite] (上書き): ファイルが既に存在し、その内容を上書きする場合は、このオプションを有効にします。
- [Merge output] (出力をマージ): ファイルが既に存在し、既存ファイルやアップデート済みファイルの内容をマージする場合は、このオプションを有効にします。
- [Map input column names to output] (入力カラム名を出力カラム名にマッピング): このオプションは、CSV、JSON、Excel形式のファイルにのみ適用されます。これによって、入力カラム名と出力カラム名が同一であることが保証されます。