Wortbasierte Muster
Talend Data Preparation ermöglicht Ihnen die Analyse der Verteilung wortbasierter Muster in Ihren Daten.
Die Indikatoren für wortbasierte Muster unterscheiden zwischen Groß- und Kleinschreibung.
| Muster | Beschreibung |
|---|---|
| [Word] | Wort beginnend mit einem Großbuchstaben und bestehend aus Kleinbuchstaben |
| [WORD] | Wort mit Großbuchstaben |
| [word] | Word mit Kleinbuchstaben |
| [Char] | Einzelner Großbuchstabe |
| [char] | Einzelner Kleinbuchstabe |
| [Ideogram] | Eines der vereinheitlichten CJK-Ideogramme |
| [IdeogramSeq] | Ideogrammsequenz |
| [hiraSeq] | Sequenz aus japanischen Hiragana-Schriftzeichen |
| [kataSeq] | Sequenz aus japanischen Katakana-Schriftzeichen |
| [hangulSeq] | Sequenz aus koreanischen Hangul-Schriftzeichen |
| [digit] | Eine der arabischen Zahlen: 0,1,2,3,4,5,6,7,8,9 |
| [number] | Sequenz aus Zahlen |
| Zeichenfolge (String) | Muster |
|---|---|
| A character is NOT a Word | [Char] [word] [word] [WORD] [char] [Word] |
| someWordsINwORDS | [word][Word][WORD][char][WORD] |
| Example123@domain.com | [Word][number]@[word].[word] |
| anotherExample8@domain.com | [word][Word][digit]@[word].[word] |
| 袁 花木蘭88 | [Ideogram] [IdeogramSeq][number] |
| Latin2中文 | [Word][digit][IdeogramSeq] |
| Latin3フランス | [Word][digit][kataSeq] |
| Latin4とうきょう | [Word][digit][hiraSeq] |
| Latin5나는 한국 사람입니다 | [Word][digit][hangulSeq] |