tReservoirSampling
ビッグデータセットからランダムサンプルデータを抽出します。
tReservoirSamplingは、サンプルデータのプロファイリング結果がフルデータセットのプロファイリング結果と同質かつ同種となるように、入力データセットからサンプルデータセットを抽出します。
ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。