Wortbasierte Muster
Talend Data Preparation ermöglicht Ihnen die Analyse der Verteilung wortbasierter Muster in Ihren Daten.
Die Indikatoren für wortbasierte Muster unterscheiden zwischen Groß- und Kleinschreibung.
Muster | Beschreibung |
---|---|
[Word] | Wort beginnend mit einem Großbuchstaben und bestehend aus Kleinbuchstaben |
[WORD] | Wort mit Großbuchstaben |
[word] | Word mit Kleinbuchstaben |
[Char] | Einzelner Großbuchstabe |
[char] | Einzelner Kleinbuchstabe |
[Ideogram] | Eines der vereinheitlichten CJK-Ideogramme |
[IdeogramSeq] | Ideogrammsequenz |
[hiraSeq] | Sequenz aus japanischen Hiragana-Schriftzeichen |
[kataSeq] | Sequenz aus japanischen Katakana-Schriftzeichen |
[hangulSeq] | Sequenz aus koreanischen Hangul-Schriftzeichen |
[digit] | Eine der arabischen Zahlen: 0,1,2,3,4,5,6,7,8,9 |
[number] | Sequenz aus Zahlen |
Zeichenfolge (String) | Muster |
---|---|
A character is NOT a Word | [Char] [word] [word] [WORD] [char] [Word] |
someWordsINwORDS | [word][Word][WORD][char][WORD] |
Example123@domain.com | [Word][number]@[word].[word] |
anotherExample8@domain.com | [word][Word][digit]@[word].[word] |
袁 花木蘭88 | [Ideogram] [IdeogramSeq][number] |
Latin2中文 | [Word][digit][IdeogramSeq] |
Latin3フランス | [Word][digit][kataSeq] |
Latin4とうきょう | [Word][digit][hiraSeq] |
Latin5나는 한국 사람입니다 | [Word][digit][hangulSeq] |