Correl - fonction de graphique
Correl() renvoie le coefficient de corrélation agrégé pour deux ensembles de données. La fonction de corrélation mesure la relation établie entre les ensembles de données ; elle est agrégée pour les paires de valeurs (x,y) itérées sur les dimensions du graphique.
Correl([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] value1, value2 )
numérique
- value1, value2: Expressions ou champs contenant les deux ensembles d'échantillons pour lesquels le coefficient de corrélation est à mesurer.
- SetExpression : Par défaut, la fonction d'agrégation couvre l'ensemble des enregistrements possibles définis par la sélection. Il est possible de définir un ensemble d'enregistrements alternatif à l'aide d'une expression d'analyse d'ensembles.
- DISTINCT : Si le terme DISTINCT précède les arguments de la fonction, les doublons résultant de l'évaluation des arguments de la fonction sont ignorés.
- TOTAL : Si le terme TOTAL précède les arguments de la fonction, le calcul est effectué à partir de toutes les valeurs possibles au vu des sélections actives, et pas seulement à partir de celles qui sont associées à la valeur dimensionnelle active. Autrement dit, les dimensions du graphique ne sont pas prises en compte. Le qualificateur TOTAL peut être suivi d'une liste d'un ou de plusieurs noms de champ placés entre crochets angulaires <fld>. Ces noms de champ doivent constituer un sous-ensemble des variables de dimension du graphique.
Le paramètre de la fonction d'agrégation ne doit pas contenir d'autres fonctions d'agrégation, sauf si ces agrégations internes contiennent le qualificateur TOTAL. Pour des agrégations imbriquées plus avancées, utilisez la fonction avancée Aggr en combinaison avec une dimension spécifiée.
Les valeurs textuelles, les valeurs NULL et les valeurs manquantes dans une ou les deux paires de données sont ignorées.
Exemple | Résultat |
---|---|
Correl(Age, Salary) |
Pour une table dotée de la dimension |
Correl(TOTAL Age, Salary)) |
0.927. Pour une meilleure lisibilité, ce résultat et les suivants sont affichés avec trois décimales. |
Données utilisées dans les exemples :
Salary:
LOAD * inline [
"Employee name"|Gender|Age|Salary
Aiden Charles|Male|20|25000
Brenda Davies|Male|25|32000
Charlotte Edberg|Female|45|56000
Daroush Ferrara|Male|31|29000
Eunice Goldblum|Female|31|32000
Freddy Halvorsen|Male|25|26000
Gauri Indu|Female|36|46000
Harry Jones|Male|38|40000
Ian Underwood|Male|40|45000
Jackie Kingsley|Female|23|28000
] (delimiter is '|');