Propriétés du générateur de données

Propriétés à configurer pour pouvoir générer automatiquement vos données de test en tant que jeu de données.

Le générateur de données (Data generator) est unidirectionnel et peut uniquement être utilisé comme jeu de données source dans votre pipeline.

Connexion du générateur de données

Sélectionnez Data generator connection (Connexion au générateur de données) dans la liste et configurez la connexion.

Configuration

Sélectionnez votre moteur dans la liste et configurez les paramètres principaux et avancés.

Après avoir configuré la connexion, donnez-lui un nom à afficher (obligatoire) et une description (facultative).

Jeu de données du générateur de données

Configuration du jeu de données
Propriété		Configuration
Dataset name		Saisissez un nom pour le jeu de données. Ce nom sera utilisé comme identifiant unique du jeu de données dans toutes les applications Talend Cloud.
Connexion		Sélectionnez votre connexion dans la liste. Si vous créez un jeu de données basé sur une connexion existante, ce champ est en lecture seule.
Saisissez		Sélectionnez le type de jeu de données à créer : Batch (Lot) si vous souhaitez générer une fois des enregistrements. Le pipeline utilisant ce jeu de données sera un pipeline de type batch. Streaming (Flux) si vous souhaitez générer des enregistrements toutes les N millisecondes dans un pipeline de type streaming. Le pipeline utilisant ce jeu de données sera un pipeline de type streaming et vous pourrez définir l'intervalle d'interrogation en millisecondes dans le champ Polling configuration (Configuration de l'interrogation) du jeu de données source.

Paramètres principaux
Propriété	Configuration
Rows (Lignes)	Saisissez le nombre d'enregistrements à générer.
Champ	Définissez les champs et la nature des données à générer. Vous pouvez utiliser des types prédéfinis pour vous aider à générer des données spécifiques : Name (Nom) : saisissez le nom du champ à générer. Exemple : `firstname` Type : sélectionnez dans la liste le type de données que vous souhaitez donner à votre champ. Selon le type sélectionné, des champs supplémentaires peuvent s'afficher pour configurer vos données. Exemple : `First Name` Blank % (% vide) : saisissez ou sélectionnez le pourcentage de champs vides à générer. Exemple : `5`, pour 5 % de champs de prénoms vides générés.
Random within list (Aléatoire au sein d'une liste)	Si vous sélectionnez ce type, vous pouvez manuellement ajouter à vos champs générés des éléments aléatoires avec des valeurs personnalisées et des poids. Par exemple, vous pouvez générer un champ nommé `hair_color` avec trois éléments : `brown` avec un poids de `0.4` (40 % des valeurs générées), `red` avec un poids de `0.4` (40 % des valeurs générées) et `blond` avec un poids de 0.2 (20 % des valeurs générées).

Advanced settings
Propriété	Configuration
Use seed (Utiliser une graine)	Activez cette option si vous souhaitez utiliser une graine spécifique pour initialiser un générateur de nombres aléatoires. Les graines vous permettent de conserver les mêmes résultats. Exemple : 123456
Enable custom locales (Activer les locales personnalisées)	Activez cette option et sélectionnez dans la liste une langue et un code pays. Par défaut, la valeur est en-us. Vous pouvez sélectionnez plusieurs locales : dans ce cas, les enregistrements seront créés à l'aide des différentes locales sélectionnées, de manière aléatoire. Cela vous permet de modifier la valeur de certains types selon ces locales (par exemple, les enregistrements d'adresses varient selon la locale sélectionnée).

Configuration du jeu de données source du générateur de données

Champs à configurer dans le jeu de données source de votre pipeline.

Propriété		Configuration
Random rows number (Nombre de lignes aléatoire)		Activez cette option si vous souhaitez générer un nombre aléatoire de lignes, avec une valeur minimale (Minimum rows number) et une valeur maximale (Maximum rows number) que vous définissez.
Polling configuration (Configuration de l'interrogation) (seulement si vous avez créé des enregistrements de type streaming (flux))		Dans l'onglet Main, configurez l'intervalle de temps entre chaque génération d'un ensemble d'enregistrements, dans le champ Min poll interval. Dans l'onglet Advanced, configurez le nombre d'enregistrements générés pour chaque ensemble dans le champ Max poll records. Par défaut, la valeur est 1.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.

Laissez vos commentaires ici