Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Hinzufügen neuer semantischer Compound-Typen

Sie können einen zusammengesetzten semantischen Typ (Compound) erstellen, der andere semantische Typen referenziert, die auf dem Talend Dictionary Service-Server veröffentlicht wurden, und ihn zur Liste erkannter Datentypen hinzufügen.

Bei der Erstellung eines Compound-Typs können Sie alle semantischen Typen mischen, zudem kann ein semantischer Compound-Typ andere Compound-Typen referenzieren, vorausgesetzt, alle untergeordneten Typen wurden bereits veröffentlicht.

In diesem Beispiel müssen Sie eine Datei mit Informationen zu Kunden aus den USA, dem Vereinigten Königreich, Deutschland und Frankreich aufbereiten. Eine der Spalten in diesem Datensatz enthält die Postleitzahlen aus diesen verschiedenen Ländern, die folglich unterschiedliche Formate aufweisen. In diesem Fall wendet die Anwendung den semantischen Typ an, der am ehesten den Werten in der Spalte, z. B. US Postal code (US-amerikanische Postleitzahl), entspricht. Dadurch werden die restlichen Daten, d. h. die deutschen, französischen und britischen Postleitzahlen, als ungültig eingestuft.

Um die Anwendung an diese Situation anzupassen, müssen Sie einen Compound-Typ erstellen, in dem die verschiedenen, zur Validierung der Postleitzahlen verwendeten semantischen Typen gruppiert sind.

Vorbereitungen

Alle semantischen Typen, die Sie im Compound-Typ gruppieren möchten, wurden veröffentlicht.

Prozedur

  1. Öffnen Sie über den linken Seitenbereich der Homepage die Ansicht Semantic type (Semantischer Typ).
  2. Klicken Sie auf die Schaltfläche Add semantic type (Semantischen Typ hinzufügen).
  3. Geben Sie im Feld Name Postal code (Postleitzahl) ein.
  4. Geben Sie im Feld Description (Beschreibung) American, British, German and French postal codes (US-amerikanische, britische, deutsche und französische Postleitzahlen) ein.
  5. Wählen Sie in der Dropdown-Liste Type (Typ) den Typ Compound type (Zusammengesetzter Typ) aus.
  6. Der Schalter Use for validation (Für Validierung verwenden) muss aktiviert bleiben.

    Der Compound-Typ wird verwendet, um zu ermitteln, welche Werte einer Spalte als richtig oder falsch eingestuft werden, wenn er auf eine bestimmte Spalte angewendet wird. Das Ergebnis dieses Validierungsprozesses wird in der Qualitätsleiste jeder Spalte in Ihren Datensätzen angezeigt.

    Wenn Sie den Schalter in diesem Beispiel deaktivieren würden, würde der Compound-Typ lediglich zur Datenerkennung eingesetzt werden, und kein Wert würde als ungültig eingestuft werden.

  7. Wählen Sie in der Liste Children types (Untergeordnete Typen) die semantischen Typen aus, die Sie im Compound-Typ Postal code (Postleitzahl) gruppieren möchten.
    Auswahl von semantischen Typen im neuen Compound-Typ
  8. Klicken Sie auf Save and publish (Speichern und veröffentlichen), um den neuen Compound-Typ an den Talend Dictionary Service-Server zu senden und ihn den Benutzern von Talend Cloud Data Inventory zur Verfügung zu stellen.

    Durch Klicken auf Save as draft (Als Entwurf speichern) wird der semantische Typ in Talend Dictionary Service gespeichert, jedoch nicht an die Talend Cloud-Anwendungen übertragen. Dadurch können Sie bestimmen, wann der semantische Typ öffentlich gemacht werden soll.

    Der Typ Postal code (Postleitzahl) ist jetzt in der Liste der semantischen Typen mit dem Status Published (Veröffentlicht) verfügbar.

    Die Änderung von semantischen Typen wird für jeden von Ihnen neu erstellten Datensatz sofort in Talend Cloud Data Inventory wirksam. Für die bereits vorhandenen Datensätze müssen Sie das Sample aktualisieren, damit die Qualität mit der neuen, geeigneteren Kategorie neu berechnet wird.

  9. Kehren Sie zu Ihrem Datensatz mit den Postleitzahlen aus verschiedenen Ländern zurück.
  10. Klicken Sie auf die Schaltfläche Refresh sample (Sample aktualisieren).
    Position der Schaltfläche zur Aktualisierung („Refresh“) in der Datensatzübersicht

Ergebnisse

Ihre Daten werden jetzt dem von Ihnen in Talend Dictionary Service manuell erstellten Compound-Typ Postal code (Postleitzahl) zugeordnet. Ab jetzt wird neuen Datensätzen mit Postleitzahlen beim Import automatisch der zutreffende Typ zugeordnet.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!