Accéder au contenu principal

tReservoirSampling

Ce composant extrait un échantillon de données aléatoires d'un ensemble de Big Data.

Le tReservoirSampling extrait un échantillon du jeu de données d'entrée afin que les résultats du profiling de cet échantillon de données soient uniformes et homogènes par rapport à ceux du profiling de l'intégralité du jeu de données.

En mode local, les versions 2.4.0 et supérieures d'Apache Spark sont supportées.

Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.