Indicateurs relatifs aux mots
Les indicateurs de fréquence des modèles relatifs aux mots comprennent des indicateurs sensibles et non sensibles à la casse.
Les indicateurs de fréquence des modèles basés sur des mots calculent le nombre d'enregistrements pour chaque modèle distinct et sont disponibles uniquement avec le moteur Java.
Vous pouvez utiliser ces indicateurs avec le type de données String uniquement.
Indicateurs sensibles à la casse
Indicator | Objectif |
---|---|
CS Word Pattern Frequency | Calcule le nombre d'enregistrements les plus fréquents. |
CS Word Pattern Low Frequency | Calcule le nombre d'enregistrements les moins fréquents. |
Les modèles se focalisent sur les mots et sont sensibles à la casse :
Pattern (Modèle) | Description |
---|---|
[Word] | Mot commençant par un caractère en majuscule suivi de caractères en minuscules |
[WORD] | Mot composé de caractères en majuscules |
[word] | Mot composé de caractères en minuscules |
[Char] | Unique caractère en majuscule |
[char] | Unique caractère en minuscule |
[Ideogram] | Un des idéogrammes unifiés CJC |
[IdeogramSeq] | Séquence d'idéogrammes |
[hiraSeq] | Séquence de caractères japonais Hiragana |
[kataSeq] | Séquence de caractères japonais Katakana |
[hangulSeq] | Séquence de caractères coréens Hangul |
[digit] | Un des chiffres arabes : 0,1,2,3,4,5,6,7,8,9 |
[number] | Séquence de chiffres |
Lorsque vous utilisez les indicateurs CS Word Pattern Frequency et CS Word Pattern Low Frequency, les chaînes de caractères suivantes sont remplacées par les modèles suivants :
String | Pattern |
---|---|
A character is NOT a Word | [Char] [word] [word] [WORD] [char] [Word] |
someWordsINwORDS | [word][Word][WORD][char][WORD] |
Example123@domain.com | [Word][number]@[word].[word] |
anotherExample8@domain.com | [word][Word][digit]@[word].[word] |
袁 花木蘭88 | [Ideogram] [IdeogramSeq][number] |
Latin2中文 | [Word][digit][IdeogramSeq] |
Latin3フランス | [Word][digit][kataSeq] |
Latin4とうきょう | [Word][digit][hiraSeq] |
Latin5나는 한국 사람입니다 | [Word][digit][hangulSeq] |
Indicateurs non sensibles à la casse
Indicator | Objectif |
---|---|
CI Word Pattern Frequency | Calcule le nombre d'enregistrements les plus fréquents. |
CI Word Pattern Low Frequency | Calcule le nombre d'enregistrements les moins fréquents. |
Les modèles se focalisent sur les mots et ne sont pas sensibles à la casse :
Modèle | Description |
---|---|
[word] | Mot composé de caractères en minuscules |
[char] | Unique caractère en minuscule |
[Ideogram] | Un des idéogrammes unifiés CJC |
[IdeogramSeq] | Séquence d'idéogrammes |
[hiraSeq] | Séquence de caractères japonais Hiragana |
[kataSeq] | Séquence de caractères japonais Katakana |
[hangulSeq] | Séquence de caractères coréens Hangul |
[digit] | Un des chiffres arabes : 0,1,2,3,4,5,6,7,8,9 |
[number] | Séquence de chiffres |
[alnum] | Valeur alphanumérique composée de caractères et de chiffres arabes |
Lorsque vous utilisez les indicateurs CI Word Pattern Frequency et CI Word Pattern Low Frequency, les chaînes de caractères suivantes sont remplacées par les modèles suivants :
String | Pattern |
---|---|
A character is NOT a Word | [char] [word] [word] [word] [char] [word] |
someWordsINwORDS | [word] |
Example123@domain.com | [alnum]@[word].[word] |
anotherExample8@domain.com | [alnum]@[word].[word] |
袁 花木蘭88 | [Ideogram] [IdeogramSeq][number] |
Latin2中文 | [word][digit][IdeogramSeq] |
Latin3フランス | [word][digit][kataSeq] |
Latin4とうきょう | [word][digit][hiraSeq] |
Latin5나는 한국 사람입니다 | [word][digit][hangulSeq] |
Le tableau suivant présente les indicateurs que vous pouvez sélectionner dans n'importe quelle base de données :
Type de données | Number | Text | Date | Autres | ||||
---|---|---|---|---|---|---|---|---|
Type de moteur d'analyse | Java | SQL | Java | SQL | Java | SQL | Java | SQL |
CS Word Pattern Frequency | ||||||||
CS Word Pattern Low Frequency | ||||||||
CI Word Pattern Frequency | ||||||||
CI Word Pattern Low Frequency |