メイン コンテンツをスキップする

Processing (インテグレーション)のコンポーネント

tAggregateRow フローを受信し、1つまたは複数のカラムに基づいて集計します。
tAggregateSortedRow 一連の操作に基づいて、出力カラムのソートされた入力データを集計します。出力カラムに対しては、それぞれ必要な行数、実行される操作、データの集計を改善するデータ取得元の入力カラムを設定するために使われます。
tCacheClear 前に永続化されたRDD (Resilient Distributed Dataset)をメモリからクリアします。
tCacheIn 持続データへのより高速なアクセスを提供します。
tCacheOut 後でこれらのデータセットへのより高速なアクセスを提供するために、定義する特定のストレージレベルに応じて入力RDDを永続化します。
tConvertType 1つのTalendJavaタイプを自動的に変換し、エラーはコンパイルしないようにできます。
tDenormalize 1つのカラムで入力フローの非正規化を行います。
tDenormalizeSortedRow ソートされた入力フローをメモリ節約のために合成します。
tExternalSortOutput 外部ソートアプリケーションを使い、1つまたは複数のカラムに基づいて入力データをタイプ(数値またはアルファベット)か順序(昇順または降順)でソートし、ソートされたデータを後続のコンポーネントに渡します。
tExternalSortRow 外部ソートアプリケーションを使い、1つまたは複数のカラムに基づいて入力データをタイプ(数値またはアルファベット)か順序(昇順または降順)でソートします。
tExtractDelimitedFields 区切り文字カラムから複数のカラムを生成します。
tExtractDynamicFields ダイナミックカラムを解析して、標準出力カラムを作成します。
tExtractEDIField EDIFACTメッセージファイルからEDIストラクチャー化データを読み取り、EDIFACTファミリーおよびEDIFACTタイプに従ってXMLを生成し、手動で定義されたXPathクエリーまたはリポジトリーウィザードからのXPathクエリーを使用して生成されたXMLを解析してデータを抽出し、最後に行接続を介して次のコンポーネントにデータを送信します。
tExtractJSONFields JSONPathまたはXPathクエリーに基づいてJSONフィールドから目的のデータを抽出します。
tExtractPositionalFields 位置フィールドを使用して、データを抽出し、フォーマット化された文字列から複数のカラムを生成します。
tExtractRegexFields 正規表現マッチングを使用して、データを抽出し、フォーマット化された文字列から複数のカラムを生成します。
tExtractXMLField XMLストラクチャー化データをXMLフィールドから読み取り、スキーマで定義されているデータを次のコンポーネントに送信します。
tFilterColumns カラムをソートしたり、不要なカラムを削除したり、新しいカラムを追加したりして、スキーマを均質化します。
tFilterRow 選択したカラムに1つ以上の条件を設定することにより、入力行をフィルター処理します。
tJoin メインデータフローとルックアップフローの間に内部結合と外部結合を実行します。
tManagePartitions 入力データセットのパーティショニング方法を視覚的に定義できます。
tNormalize SQL標準に従って入力フローを正規化します。これによってデータクオリティが改善し、データのアップデートが容易になります。
tPartition 入力データセットのパーティショニング方法を視覚的に定義できます。
tReplace その後の処理を行う前に、すべてのファイルをクレンジングします。
tReplicate 入力スキーマを複製して、2つの同一の出力フローを作成します。
tSample 処理中のデータのサンプルサブセットを返します。
tSampleRow 単一の行のリストまたは行グループのリストに基づいて行を選択します。
tSortRow メトリックと分類テーブルの作成に役立ちます。
tSplitRow 1つの入力行を複数の出力行に分割します。
tSqlRow 入力データセットに対してSQLクエリーを実行します。
tTop データをソートし、このデータの最初の行からいくつかの行を出力します。
tTopBy データをグルーピングしてソートし、各グループの最初のデータからいくつかの行を出力します。
tUniqRow ジョブの入力または出力フローのデータクオリティを保証します。
tUnite さまざまな異種ソースからのデータを一元化します。
tWindow 指定されたSparkウィンドウを受信RDDに適用し、ウィンドウベースのRDDを次のコンポーネントに送信します。
tWriteAvroFields 入力データをAvroファイルに変換します。
tWriteDelimitedFields レコードをバイト配列に変換します。
tWriteDynamicFields コンポーネントの入力カラムからダイナミックスキーマを作成します。
tWriteJSONField 受信データをJSONフィールドに変換し、それらをファイル、データベーステーブルなどに転送します。
tWritePositionalFields レコードをバイト配列に変換します。
tWriteXMLFields レコードをバイト配列に変換します。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。