メイン コンテンツをスキップする 補完的コンテンツへスキップ

選択したデータにアクセスする

手順

  1. tCacheOutをダブルクリックして[Component] (コンポーネント)ビューを開きます。
    このコンポーネントは、選択したデータをキャッシュに保管します。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックしてスキーマエディターを開き、スキーマが入力スキーマと同一であることを確認します。同一でない場合は、[Sync columns] (カラムを同期)をクリックします。
  3. スキーマエディターの出力側で、ボタンをクリックしてスキーマをローカルファイルシステムにエクスポートし、[OK]をクリックしてエディターを閉じます。
  4. [Storage level] (ストレージレベル) リストから[Memory only] (メモリのみ)を選択します。

    各ストレージレベルの詳細は、https://spark.apache.org/docs/latest/programming-guide.html#rdd-persistence (英語のみ)をご覧ください。

  5. tCacheInをダブルクリックして[Component] (コンポーネント)ビューを開きます。
  6. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックしてスキーマエディターを開き、ボタンをクリックして、前のステップでエクスポートしたスキーマをインポートします。[OK]をクリックしてエディターを閉じます。
  7. [Output cache] (出力キャッシュ)リストから、キャッシュされたデータを読み取る必要があるtCacheOutコンポーネントを選択します。ランタイムに、このデータはWebクリックログの処理に使われるサブジョブのルックアップフローに読み取られます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。