Big Data : nouvelles fonctionnalités
Améliorations apportées à la conception de Jobs Spark
Fonctionnalité |
Description |
Disponible dans |
---|---|---|
ADLS Gen2 | Azure Data Lake Storage Generation2 est à présent supporté avec les plateformes Big Data suivantes :
|
Tous les produits Talend incluant Big Data |
Snowflake | Les composants Snowflake pour Spark Batch sont à présent généralement disponibles. |
Tous les produits Talend incluant Big Data |
Jeux de données natifs |
Dans les Jobs Spark Batch, le support des jeux de données Spark natifs a été ajouté à d'autres composants, afin d'obtenir de meilleures performances. Pour bénéficier de cette amélioration, les utilisateurs et utilisatrices doivent utiliser Spark V2.0 ou supérieure avec les composants suivants :
Les composants suivants nécessitent Spark V2.1 ou supérieure pour supporter les jeux de données Spark.
|
Tous les produits Talend incluant Big Data |
Delta Lake | Les composants tDeltaLakeInput et tDeltaLakeOutput sont à présent généralement disponibles. |
Tous les produits Talend incluant Big Data |
Apache Spark V2.4 | Cette nouvelle version d'Aparch Spark est supportée avec plus de plateformes Big Data dans des Jobs Spark Batch et Spark Streaming. Les plateformes supportant Spark V2.4 sont :
|
Tous les produits Talend incluant Big Data |
Statut du Job | Avec Databricks, les utilisateurs et utilisatrices peuvent configurer la fréquence à laquelle le Studio demande au cluster Spark le statut des Jobs. |
Tous les produits Talend incluant Big Data |
tS3Configuration | Avec Amazon EMR, les utilisateurs et utilisatrices peuvent appliquer une politique de bucket S3. |
Tous les produits Talend incluant Big Data |
tAggregateRow | Dans les Jobs Spark Batch, la fonction de compte distinct (Count) et la fonction Sample Standard Deviation Algorithm function ont été ajoutées. |
Tous les produits Talend incluant Big Data |
Nouvelles versions des pilotes |
Le support des versions suivantes des pilotes a été ajouté dans les composants associés :
|
Tous les produits Talend incluant Big Data |
Nouveaux composants disponibles |
Deux nouveaux composants sont disponibles : le tAzureAdlsGen2Input et le tAzureAdlsGen2Output. |
Tous les produits Talend incluant Big Data |
Support des plateformes Big Data
Fonctionnalité |
Description |
Disponible dans |
---|---|---|
Databricks |
|
Tous les produits Talend incluant Big Data |
Hortonworks Data Platform |
|
Tous les produits Talend incluant Big Data |
Google Cloud Dataproc |
|
Tous les produits Talend incluant Big Data |
Configurations Hadoop personnalisées | Lorsqu'ils définissent des connexions à Cloudera ou Hortonworks dans le Repository, les utilisateurs et utilisatrices peuvent à présent spécifier un fichier Jar personnalisé fournissant les paramètres de connexion à l'environnement Hadoop à utiliser. |
Tous les produits Talend incluant Big Data |
Autres composants
Fonctionnalité |
Description |
Disponible dans |
---|---|---|
Kafka | Kafka V2.2.1 est à présent officiellement supporté avec :
|
Tous les produits Talend incluant Big Data |
Google BigQuery |
|
Tous les produits Talend incluant Big Data |
Couchbase |
|
Tous les produits Talend incluant Big Data |
CXF |
CXF V3.3.4 est à présent supporté dans les composants suivants :
|
Tous les produits Talend incluant Big Data |
MongoDB |
Le support de MongoDB V4.2.x a été ajouté aux composants MongoDB dans les Jobs Standard. |
Tous les produits Talend incluant Big Data |