Résumé statistique
Ils effectuent des analyses statistiques sur des données numériques, comme le calcul des mesures de position telles que la médiane et la moyenne, le calcul des dispersions statistiques comme l'écart interquartile et l'écart total.
- Moyen : calcule la moyenne des enregistrements.
- Median calcule la valeur séparant la moitié supérieure de la distribution d'un échantillon ou d'une population de la moitié inférieure.
- Écart interquartile calcule la différence entre le troisième quartile et le premier quartile.
- Lower quartile (premier quartile) : calcule le premier quartile des données, à savoir les 25 % inférieurs des données.
- Upper quartile (troisième quartile) : calcule le troisième quartile des données, à savoir les 25 % supérieurs des données.
- Écart : calcule la différence entre la valeur minimale et la valeur maximale.
Lorsque vous utilisez les indicateurs de résumé statistique pour profiler une base de données DB2, les résultats d'analyse peuvent être légèrement différents avec un moteur Java ou SQL, car les indicateurs sont calculés différemment selon le type de base de données et que Talend utilise des fonctions spéciales lors de son fonctionnement avec Java.
Le tableau suivant présente les indicateurs que vous pouvez sélectionner dans n'importe quelle base de données :
Indicateur | Types de données supportés par le moteur d'analyse Java | Types de données supportés par le moteur d'analyse SQL |
---|---|---|
Moyenne | Number | Number |
Median | Number | Number |
Écart interquartile | Number | Number |
Quartile supérieur | Number | Number |
Range |
|
|
Minimum |
|
|
Maximum |
|
|