Extrahieren von Informationen zu Telefonnummern
Mit der Funktion Extract phone number information (Informationen zu Telefonnummern extrahieren) können Sie neue Typen von Informationen zu Telefonnummern in verschiedene neue Spalten extrahieren.
Diese Funktion kann Informationen zu Telefonnummerntyp, Land, Region, geografischem Bereich, Betreibername und Zeitzone extrahieren. Das Verhalten der Funktion ist jedoch vom semantischen Typ der Spalte abhängig, die die Telefonnummerndaten enthält:
- Wenn der semantische Typ entweder US Phone (US Telefon), UK Phone (UK Telefon), DE Phone (DE Telefon) oder FR Phone (FR Telefon) entspricht, brauchen Sie nur die auszugebenden Felder auswählen und können die Funktion anwenden.
- Wenn die Spalte Nummern aus verschiedenen Ländern mit unterschiedlichen Formaten enthält und den eher allgemeinen semantischen Typ Phone number (Telefonnummer) aufweist, müssen Sie die Daten zunächst formatieren, damit Sie die Funktion Extract phone number information (Informationen zu Telefonnummern extrahieren) verwenden können. Dieser Schritt ist notwendigt, da nicht standardisierte Nummer oft eine Struktur aufweisen, die verschiedenen Ländern entsprechen, sodass das jeweilige Land nicht eindeutig ermittelt werden kann.
Als Beispiel dient ein Datensatz mit Basis-Kundendaten, wie z. B. Ländernamen und Telefonnummern von Kunden weltweit. Mit Ihrer Datenaufbereitung sollen die Telefonnummern bearbeitet und nur diejenigen Kunden beibehalten werden, die ihre Mobilnummer als Kontaktinfo angegeben haben. Die Funktion Extract phone number information (Informationen zu Telefonnummern extrahieren) könnte diese Angabe zum Telefonnummerntyp anzeigen, da die Nummern aber verschiedene Formate aufweisen, kann die Funktion noch nicht angewendet werden. Zuerst führen Sie einen Formatierungsvorgang für die Spalte phone (Telefon) durch und verwenden dazu die Informationen in der Spalte country (Land), um den Nummern eine internationale Vorwahl als Präfix hinzuzufügen. Talend Data Preparation kann dann die Informationen der Telefonnummern extrahieren, die ein einheitliches Format aufweisen und darüber hinaus Angaben zum jeweiligen Land enthalten.
Prozedur
Ergebnisse
Nach einem schnellen Formatierungsschritt werden die Spalten mit den verschiedenen, aus den Telefonnummern extrahierten Informationen erstellt. Die Informationen werden aus der Telefonbibliothek von Google extrahiert. Jetzt lässt sich ganz einfach feststellen, welche Nummern zu einem Festnetzanschluss und welche zu einem Mobiltelefon gehören. Somit können Sie Ihre Datenaufbereitung fortsetzen.
Für Zeilen, die leer oder ungültig waren, werden nach Anwendung der Funktion leere Zellen generiert.