Hinzufügen neuer wörterbuchbasierter semantischer Typen
Sie können in Talend Dictionary Service einen semantischen Typ auf der Grundlage eines Wörterbuchs erstellen und ihn in der Liste der erkannten Datentypen in Talend Cloud Data Stewardship hinzufügen. Allerdings sind in einem wörterbuchbasierten semantischen Typ keine Wertduplikate zulässig, da sie nutzlos sind und den Prozess verlangsamen.
In Talend Cloud Data Stewardship kann zurzeit nicht jeder Typ von Daten einem der vordefinierten semantischen Typen zugeordnet werden. Die Grafschaften im Vereinigten Königreich zum Beispiel werden momentan nicht erkannt.
Warum und wann dieser Vorgang ausgeführt wird
Ein Beispiel: Sie arbeiten für eine britische Firma und nur mit Kunden, die im Vereinigten Königreich angesiedelt sind. In diesem Beispiel müssen Sie einige Kundendaten bereinigen, z. B. die Namen und E-Mailadressen der Kunden oder die Grafschaft (County), in der sie leben. Bei der Festlegung des Datenmodells in Data Stewardship fragen sich, Sie welcher semantische Typ für die Spalte mit den Grafschaften verwendet werden sollte. Sie möchten folglich einen für diese Daten spezifischen semantischen Typ hinzufügen: den semantischen Typ UK_counties (UK-Länder) beispielsweise.
Sie können diesen neuen semantischen Typ in Talend Dictionary Service erstellen. Er wird dann automatisch in Data Stewardship zur Verfügung gestellt, sodass Ihre Daten mit einem geeigneten Typ verglichen und validiert werden können.
Prozedur
Ergebnisse
Beim Laden der Daten mit den Grafschaften des Vereinigten Königreichs in Talend Cloud Data Stewardship werden diese mit dem zutreffenden semantischen Typ, UK_counties (Grafschaften im Vereinigten Königreich), den Sie manuell in Talend Dictionary Service erstellt haben, verglichen und validiert.