メイン コンテンツをスキップする

HDFSのコンポーネント

tHDFSCompare HDFS内の2つのファイルを読み取り専用スキーマに基づいて比較し、比較情報を提示する行フローを生成します。
tHDFSConfiguration 同じジョブでHDFSへの接続設定を再利用します。
tHDFSConnection 特定のHDFSに接続することで、このHDFSと通信するために作成した接続を他のHadoopのコンポーネントが再利用できるようにします。
tHDFSCopy ソースファイルまたはフォルダーをHDFSのターゲットディレクトリーにコピーし、必要に応じてこのソースを削除します。
tHDFSDelete 特定のHadoop分散ファイルシステム(HDFS)にあるファイルを削除します。
tHDFSExist ファイルがHDFSの指定のディレクトリー内にあるかどうかを確認します。
tHDFSGet ファイルをHadoop分散ファイルシステム(HDFS)からコピーして、ユーザー定義されたディレクトリーに貼り付け、必要な場合は名前を変更します。
tHDFSInput 他のコンポーネントがデータを処理できるように、HDFSファイルのデータを抽出します。
tHDFSList tHDFSListは、ファイルマスクパターンを基にファイルまたはフォルダーのリストを取得し、各ユニティで繰り返し処理を実行します。
tHDFSOutput 受け取るデータフローを特定のHadoop分散ファイルシステム(HDFS)に書き込みます。
tHDFSOutputRaw 単一カラム形式の階層データなど、さまざまな形式のデータを特定のHDFSファイルシステムに転送します。
tHDFSProperties HDFSで処理されたファイルのプロパティを表示する単一行フローを作成します。
tHDFSPut Hadoop分散ファイルシステムに接続して、大規模ファイルを最適なパフォーマンスでこのファイルシステムにロードします。
tHDFSRename HDFS上で選択したファイルまたは指定したディレクトリーの名前を変更します。
tHDFSRowCount HDFSのファイルを1行ずつ読み取って、ファイルに含まれる行数を決定します。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。