Paramètres spécifiques aux composants pour le tSqlRow
Le tableau suivant présente les fonctions et paramètres des scripts de Jobs que vous pouvez définir dans la fonction setSettings {} du composant.
Fonction/paramètre | Description | Obligatoire ? |
---|---|---|
SQL_CONTEXT |
Spécifiez le langage de requête à utiliser dans le tSqlRow. Les valeurs acceptées sont :
|
Non |
SQL_QUERY |
Saisissez votre requête en faisant particulièrement attention à l'ordre des champs afin de correspondre à la définition du schéma. Le composant tSqlRow utilise le libellé de son lien d'entrée pour nommer la table enregistrée stockant les jeux de données depuis le même lien d'entrée. Par exemple, si un lien d'entrée est nommé row1, ce row1 est le nom de la table sur laquelle effectuer les requêtes. |
Oui |
REGISTER_JARS {} |
Dans cette fonction, utilisez le paramètre JAR_NAME pour ajouter les Jar Spark SQL ou Hive SQL UDF (user-defined function, fonction personnalisée) que vous souhaitez que le tSqlRow utilise. Si vous ne souhaitez pas appeler votre fonction personnalisée à l'aide de son nom de classe entièrement qualifié, vous devez définir un alias de fonction pour cette fonction personnalisée, dans les fonctions TEMP_SQL_UDF_FUNCTIONS {}et utiliser cet alias. Il est recommandé d'utiliser l'approche de l'alias, car un alias est souvent pratique pour appeler une fonction personnalisée à partir d'une requête. |
Non |
TEMP_SQL_UDF_FUNCTIONS {} |
Ajoutez dans cette fonction les paramètres TEMPORARY_FUNCTION_ALIAS et UDF_FQCN pour donner à chaque fonction personnalisée importée un nom de fonction temporaire à utiliser dans la requête, dans le tSqlRow. Si vous avez spécifié le contexte Spark SQL en configurant le paramètre SQL_CONTEXT à SQLContext, vous devez inclure dans cette fonction le paramètre DATA_TYPE, afin de spécifier le type de données de sortie de la fonction personnalisée Spark SQL à utiliser. |
Non |
LABEL |
Utilisez ce paramètre pour spécifier un libellé textuel pour le composant. |
Non |