Hinzufügen neuer regulärer ausdrucksbasierter semantischer Typen
Sie können in Talend Dictionary Service einen semantischen Typ auf der Grundlage eines regulären Ausdrucks erstellen und ihn in der Liste der erkannten Datentypen in Talend Data Preparation hinzufügen.
In Talend Data Preparation kann zurzeit nicht jeder Typ von Daten einem der vordefinierten semantischen Typen zugeordnet werden. Italienische Sozialversicherungsnummern beispielsweise, auch als Codice fiscale bekannt, werden bisher nicht erkannt.
Ein Beispiel: Sie arbeiten für eine italienische Firma und haben nur mit italienischen Kunden zu tun. In diesem Beispiel müssen Sie einige Kundendaten bereinigen, z. B. die Namen, E-Mailadressen oder Sozialversicherungsnummern der Kunden. Der semantische Typ für die Spalte mit den Sozialversicherungsnummern wird standardmäßig auf text eingestellt. Das ist nicht präzise genug und Sie möchten eine neue Kategorie erstellen, die diesem Typ von Daten eher entspricht: in diesem Fall den semantischen Typ codice fiscale.
Sie erstellen diesen neuen semantischen Typ in Talend Dictionary Service. Er wird dann automatisch in Talend Data Preparation zur Verfügung gestellt, sodass Ihre Daten einem geeigneten Typ zugeordnet werden können.
Prozedur
Ergebnisse
Ihren Daten wurde jetzt der von Ihnen manuell in Talend Dictionary Service erstellte semantische Typ codice_fiscale zugeordnet. Ab jetzt wird neuen Datensätzen mit italienischen Sozialversicherungsnummern beim Import automatisch der zutreffende Typ zugeordnet.