Statistiques avancées
Ils déterminent les valeurs les plus probables ainsi que les plus fréquentes et construisent des tables de fréquence. Les statistiques avancées principales comprennent les valeurs suivantes :
- Mode : calcule la valeur la plus probable. Pour des données numériques ou continues, vous pouvez définir des intervalles dans les paramètres de cet indicateur. Il est différent des indicateurs "mean" et "median". Il est utile aussi pour traiter des attributs de type nominal.
- Fréquence de la valeur : calcule le nombre d'enregistrements les plus fréquents pour chaque modèle distinct.
- Tous les autres indicateurs de fréquence des valeurs sont disponibles afin d'agréger des données selon la "date", la semaine ("week"), le mois ("month"), le trimestre ("quarter"), l'année ("year"), et l'intervalle ("bin").
- Indicateur de basse fréquence : calcule le nombre d'enregistrements les moins fréquents pour chaque modèle distinct.
- Tous les autres indicateurs de basse fréquence des valeurs sont disponibles pour chacune des valeurs suivantes : "date", semaine ("week"), mois ("month"), trimestre ("quarter"), année ("year"), et intervalle ("bin") où "bin" est le regroupement des données numériques par intervalle.
Le tableau suivant présente les indicateurs que vous pouvez sélectionner dans n'importe quelle base de données :
Indicateur | Types de données supportés par le moteur d'analyse Java | Types de données supportés par le moteur d'analyse SQL |
---|---|---|
Mode |
|
|
Value (Low) Frequency |
|
|
Date (Low) Frequency |
|
|
Week (Low) Frequency |
|
|
Month (Low) Frequency |
|
|
Quarter (Low) Frequency |
|
|
Year (Low) Frequency |
|
|
Bin (Low) Frequency |
|
|