メイン コンテンツをスキップする 補完的コンテンツへスキップ

HDFSのプロパティ

特定のHadoop Distributed File System (HDFS)に接続できるよう設定するプロパティです。

HDFS接続

リストからHDFSを選択し、接続を設定します。

設定

リストからエンジンを選択し、メイン設定と詳細設定を行います。

接続設定
プロパティ 設定
ユーザー名 ユーザー名

接続を設定した後は、表示名(必須)と説明(オプション)を入力します。

HDFSデータセット

データセット設定
プロパティ 設定
[Dataset Name] (データセット名) データセットの表示名を入力します。この名前はすべてのTalend Cloudアプリでデータセットの一意識別子として使われます。
[Connection] (接続) リストで接続を選択します。既存の接続に基づいてデータセットを作成する場合、このフィールドは読み取り専用となります。
HDFSデータセット設定
プロパティ 設定
[Path] (パス) ファイルシステムで取得するデータをポイントするパスを入力します。
[Format configuration] (形式設定)
プロパティ 設定
自動検出 このボタンをクリックすると、取得するデータの形式が自動的に検出されます。
[Format] (形式) または、取得する次のようなファイル形式をリストで選択し、そのファイル形式に関連する情報を入力または選択します。
  • CSV:
    • [Record delimiter] (レコード区切り): 取得するファイルで使用するレコード区切りの種類を選択します。[Other] (その他)を選択すれば、[Custom record delimiter] (カスタムのレコード区切り)フィールドにカスタムのレコード区切りを入力できます。
    • [Field delimiter] (フィールド区切り): 取得するファイルで使用するフィールド区切りのタイプを選択します。[Other] (その他)を選択すれば、[Custom field delimiter] (カスタムのフィールド区切り)フィールドにカスタムのレコード区切りを入力できます。
    • [Text enclosure character] (テキスト囲み文字): フィールドを囲むために使用する文字を入力します。
    • [Escape character] (エスケープ文字): 取得するレコードでエスケープする文字を入力します。
    • [Encoding] (エンコーディング): 取得するファイルで使用するエンコーディングの種類を選択します。[Other] (その他)を選択すれば、[Custom encoding] (カスタムエンコーディング)フィールドにカスタムのエンコーディングタイプを入力できます。
    • [Set Header] (ヘッダーを設定): 取得するファイルにヘッダー行が含まれている場合はこのオプションを有効にし、スキーマでスキップする行数を入力または選択します。
  • Excel:
    • [Excel format] (Excel形式): 取得するファイルに対応する形式/バージョンを選択します。
    • [Sheet] (シート): 取得するExcelシートの名前を入力します。
    • [Set Header/footer] (ヘッダー/フッターを設定): 取得するファイルにヘッダー行やフッター行が含まれている場合はこれらのオプションを有効にし、スキーマでスキップする行数を入力、または選択します。
  • Avro: この形式には特定のパラメーターは必要ありません。
  • Parquet: この形式には特定のパラメーターは必要ありません。
  • JSON: この形式には特定のパラメーターは必要ありません。
コネクターがソースデータセットやデスティネーションデータセットとして使われているかどうかによって、次のようなパラメーターが表示されることがあります。
  • HDFSソースデータセットの場合:
    • [Force parallelism-ignore escape char and text enclosure parameters] (並列処理を強制 - エスケープ文字とテキスト囲み文字パラメーターを無視): ファイル内のエスケープ文字、およびテキストを囲むための文字を無視したい場合は、このオプションを有効にします。
  • HDFSデスティネーションデータセットの場合:
    • [Overwrite] (上書き): ファイルが既に存在し、その内容を上書きする場合は、このオプションを有効にします。
    • [Merge output] (出力をマージ): ファイルが既に存在し、既存ファイルやアップデート済みファイルの内容をマージする場合は、このオプションを有効にします。
    • [Map input column names to output] (入力カラム名を出力カラム名にマッピング): このオプションは、CSV、JSON、Excel形式のファイルにのみ適用されます。これによって、入力カラム名と出力カラム名が同一であることが保証されます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。