メイン コンテンツをスキップする 補完的コンテンツへスキップ

入力レコードのソート

このリンクの終端では、Talend Studioにより実行結果をグルーピングして次のコンポーネントに出力する収集ステップが実行されます。

tSortRowの設定

Procedure

  1. tSortRowをダブルクリックして、[Component] (コンポーネント)ビューを開きます。
    [Basic settings] (基本設定)ビュー。
  2. [Criteria] (条件)テーブルの下にある[Add] (追加)ボタンを3回クリックし、テーブルに3行追加します。
  3. [Schema column] (スキーマカラム)で、ソート基準として使用するスキーマカラムを各行ごとに選択します。この例では、[ZipCode] (郵便番号)[City] (市)、および[Address] (住所)を順に選択します。
  4. Sort num or alpha?カラムで、3行すべてでalphaを選択します。
  5. [Order asc or desc] (昇順または降順)カラムで、3行すべてについて[asc] (昇順)を選択します。
  6. スキーマが表示されない場合は、[Sync columns] (カラムを同期)ボタンをクリックして、先行コンポーネントからスキーマを取得します。
  7. [Advanced settings] (詳細設定)をクリックして、ビューを開きます。
    [Advanced settings] (詳細設定)ビュー。
  8. [Sort on disk] (ディスクでソート)を選択します。次に[Temp data directory path] (一時データディレクトリーパス)フィールドおよび[Create temp data directory if not exist] (存在しない場合一時データディレクトリーを作成)チェックボックスが表示されます。
  9. [Temp data directory path] (一時データディレクトリーパス)に、tSortRowで処理された一時データを格納するために使用するフォルダーのパスを入力するか、フォルダーを参照します。このアプローチを使うと、tSortRowが有効になり、より大量のデータをソートできます。
    これらのスレッドを同じディレクトリーに書き出すと、互いに上書きしてしまうため、スレッドごとにフォルダーを作成してから、スレッドIDを使って処理する必要があります。
    スレッドIDを表す変数を使用するには、[Code] (コード)をクリックしてそのビューを開き、ビューの中でthread_idの変数を探す必要があります。この例では、この変数はtCollector_1_THREAD_IDとなります。
    [Code] (コード)ビューでthread_idを検索。
    次にこの変数を使ってパスを入力する必要があります。次のようになります。
    "E:/Studio/workspace/temp"+((Integer)globalMap.get("tCollector_1_THREAD_ID"))
  10. [Create temp data directory if not exist] (存在しなければ一時データディレクトリーを作成)チェックボックスがオンになっていることを確認します。

デパーテーション化ステップの設定

Procedure

  1. デパーテーション化ステップを表すリンクをクリックして、[Component] (コンポーネント)ビューを開き、[Parallelization] (並列化)タブをクリックします。
    [並列化]ビュー。
    [Partition row] (パーテーション行)オプションは、[Type] (タイプ)エリアで自動的に選択されています。[None] (なし)オプションを選択すると、このリンクで処理するデータフローの並列化が無効になります。設定するリンクによっては、[Repartition row] (パーテーション行)オプションが[Type] (タイプ)エリアで利用可能となり、既に分割解除されているデータフローを再パーティショニングできます。
    この[Parallelization] (並列化)ビューでは、次のプロパティを定義する必要があります。
    • [Buffer Size] (バッファーサイズ): メモリを解放する前に処理する行数。
    • [Merge sort partitions] (分割のマージ/ソート): これによりマージ/ソートアルゴリズムを実装してデータの一貫性を確保できます。
  2. 必要であれば、メモリ容量に合わせて[Buffer Size] (バッファーサイズ)フィールドの値を変更します。この例では、デフォルトのままにしておきます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。