Apache Spark StreamingのtDenormalizeプロパティ
これらのプロパティは、Spark Streamingジョブのフレームワークで実行されているtDenormalizeを設定するために使われます。
Spark StreamingのtDenormalizeコンポーネントは、変換処理ファミリーに属しています。
このコンポーネントはTalend Real-Time Big Data PlatformとTalend Data Fabricで利用できます。
基本設定
[Properties] (プロパティ) | 説明 |
---|---|
[Schema] (スキーマ)と[Edit Schema] (スキーマを編集) |
|
[To denormalize] (非正規化) |
このテーブルでは、カラムの非正規化に使用するパラメーターを定義します。 [Column] (カラム): 非正規化するカラムを選択します。 [Delimiter] (区切り): 二重引用符の間のデータを非正規化するために使用するセパレーターを入力します。 [Merge same value] (同じ値をマージ): このチェックボックスをオンにすると、同一の値がマージされます。 |
使用方法
使用方法のガイダンス | 説明 |
---|---|
使用ルール |
このコンポーネントは中間ステップとして使用されます。 このコンポーネントは、所属するSpark Streamingのコンポーネントのパレットと共に、Spark Streamingジョブを作成している場合にだけ表示されます。 特に明記していない限り、このドキュメンテーションのシナリオでは、標準ジョブ、つまり従来の Talend Data Integrationジョブだけを扱います。 |
[Spark Connection] (Spark接続) |
[Run] (実行)ビューの[Spark configuration] (Spark設定)タブで、ジョブ全体でのSparkクラスターへの接続を定義します。また、ジョブでは、依存jarファイルを実行することを想定しているため、Sparkがこれらのjarファイルにアクセスできるように、これらのファイルの転送先にするファイルシステム内のディレクトリーを指定する必要があります。
この接続は、ジョブごとに有効になります。 |