Liste der Funktionen
In diesen Tabellen werden alle in Talend Cloud Data Preparation verfügbaren Funktionen sowie deren Wirkung aufgeführt.
Bei der Anwendung einer der nachstehend aufgelisteten Funktionen - mit Ausnahme der Funktionen vom Typ Math (Mathematik) - wird der Eingabewert zurückgegeben, wenn die Daten als ungültig eingestuft werden oder der Datentyp nicht mit der ausgewählten Funktion kompatibel ist, ungeachtet dessen, ob das Kontrollkästchen Create new column (Neue Spalte erstellen) aktiviert oder deaktiviert ist.
Bei Funktionen vom Typ Math (Mathematik) werden leere Werte ignoriert, während ungültige Werte bei Anwendung der Funktion ein leeres Resultat ergeben.
Die folgenden Funktionen, die auf Matching-Algorithmen zurückgreifen, bieten keine Unterstützung für asiatische Zeichen:
- Standardize value (fuzzy matching) (Standardisieren von Werten (Fuzzy Matching))
- Find and group similar text (Ähnlichen Text finden und gruppieren)
Name | Kategorie | Beschreibung |
---|---|---|
Delete row (Zeile löschen) | Datenbereinigung | Löscht diese Zeile. |
Make as header (Als Header verwenden) | Datenbereinigung | Die Zellen dieser Zeile werden Spaltennamen, die Zeile wird gelöscht. |
Name | Kategorie | Beschreibung |
---|---|---|
Negate value (Wert negieren) | Boolescher Wert | Der boolesche Wert in den Zellen dieser Spalte wird umgekehrt. |
Change data type (Datentyp ändern) | Spaltenspez. Metadaten | Der Typ dieser Spalte wird geändert (Zahl, Text, Datum usw.). |
Change semantic domain (Semantische Domäne ändern) | Spaltenspez. Metadaten | Die semantische Domäne dieser Spalte wird geändert (Ort, PLZ, Nachname usw.). |
Create new column (Neue Spalte erstellen) | Spaltenspez. Metadaten | Die Spalte wird kopiert oder es wird eine völlig neue Spalte erstellt. InformationshinweisAnmerkung: Bei einer Verwendung im Sequence mode (Sequenzmodus) ist diese Funktion nicht mit Spark-Jobs.
|
Delete column (Spalte löschen) | Spaltenspez. Metadaten | Die ausgewählten Spalten werden gelöscht. |
Duplicate column (Spalte duplizieren) | Spaltenspez. Metadaten | Es wird eine genaue Kopie dieser Spalte angefertigt. |
Rename column (Spalte umbenennen) | Spaltenspez. Metadaten | Die Spalte wird dupliziert. |
Concatenate columns (Spalten konkatenieren) | Spalten | Der Inhalt von zwei oder mehreren Spalten wird in einer Spalte zusammengeführt. |
Concatenate with (Konkatenieren mit) | Spalten | Der Inhalt der Spalte wird mit einer anderen Spalte zusammengeführt und in einer neuen Spalte angezeigt. |
Reorder columns (Spalten neu anordnen) | Spalten | Die Spaltenreihenfolge wird geändert. |
Swap columns (Spalten vertauschen) | Spalten | Die Werte werden mit denjenigen einer anderen Spalte vertauscht. |
Convert country names and codes (Ländernamen und -codes konvertieren) | Konvertierungen | Ein Ländername wird in einen ISO-3166-Ländercode (Alpha-2, Alpha-3 oder numerisch) konvertiert bzw. umgekehrt. Diese Funktion unterstützt englische, französische und japanische Namen und Codes. |
Convert distance (Distanz konvertieren) | Konvertierungen | Eine Entfernung wird von einer in eine andere Einheit konvertiert. |
Convert duration (Dauer konvertieren) | Konvertierungen | Eine Dauer wird von einer in eine andere Einheit konvertiert. |
Convert temperature (Temperatur konvertieren) | Konvertierungen | Die Einheiten von Temperaturmesswerten werden konvertiert. |
Clear on matching value (Bei übereinstimmendem Wert löschen) | Datenbereinigung | Die Zellen, die dem vorgegebenen Wert entsprechen, werden gelöscht. |
Clear the cells with invalid values (Zellen mit ungültigen Werten löschen) | Datenbereinigung | Bereinigt Zellen, die einen als ungültig erkannten Wert enthalten. |
Coalesce columns (Zusammenfügen von Spalten) | Datenbereinigung | Der erste Wert ungleich Null wird für jede Zeile aus den ausgewählten Spalten abgerufen. |
Delete empty rows (Leere Zeilen löschen) | Datenbereinigung | Entfernt die Zeilen, in denen die Zelle in jeder Spalte leer ist. |
Delete the rows that match (Übereinstimmende Zeilen löschen) | Datenbereinigung | Die Zeilen, die eine Zelle in dieser Spalte mit einem vorgegebenen Wert enthalten, werden gelöscht. |
Delete the rows with empty cell (Zeilen mit leeren Zellen löschen) | Datenbereinigung | Löscht Zeilen, die leere Zellen enthalten. |
Delete the rows with invalid cell (Zeilen mit ungültiger Zelle löschen) | Datenbereinigung | Zeilen, die eine ungültige Zelle enthalten, werden gelöscht. |
Delete the rows with negative values (Zeilen mit negativen Werten löschen) | Datenbereinigung | Die Zeilen mit einem negativen Wert in dieser Spalte werden gelöscht. |
Fill cells with value (Zellen mit Werten füllen) | Datenbereinigung | Füllt die Zellen in der Spalte mit einem vorgegebenen Wert. |
Fill empty cells from above (Leere Zellen von oben füllen) | Datenbereinigung | Kopiert den Wert der nächsten nicht-leeren Zelle oberhalb. Wenn mehrere nicht leere Zellen vorhanden sind, werden alle mit demselben Wert gefüllt, der ursprünglich von oben übernommen wurde. InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs.
|
Fill empty cells with text (Leere Zellen mit Text füllen) | Datenbereinigung | Füllt leere Zellen in der Spalte mit einem vorgegebenen Wert. |
Fill empty cells with value (Leere Zellen mit Wert füllen) | Datenbereinigung | Füllt die Zellen in der Spalte mit einem vorgegebenen Wert. |
Standardize value (fuzzy matching) (Wert standardisieren (Fuzzy Matching)) | Datenbereinigung | Ersetzt die ungültigen Werte durch den ähnlichsten gültigen Wert aus dem Wörterbuch. InformationshinweisAnmerkung: Diese Funktion unterstützt keine asiatischen Zeichen.
|
Hash data (Daten hashen) | Datenmaskierung | Hasht den Inhalt einer Spalte unter Verwendung des SHA-256-Algorithmus. |
Mask data obfuscation ((Daten maskieren) (Obfuskation)) | Datenmaskierung | Maskiert Daten gemäß den Domäneninformationen der Spalte (Anonymisierung). |
Lookup | Datenmischung | Übernimmt Spalten aus einem anderen Datensatz in diesen. |
Calculate time since (Zeit berechnen seit) | Datumsangaben | Berechnet die verstrichene Zeit seit einem bestimmten Datum in der angegebenen Einheit (Jahr, Monat, Tag, Stunde, Minute, Sekunde). |
Calculate timestamp to date (Zeitstempel zur Datierung berechnen) | Datumsangaben | Ausgehend von einem Zeitstempel (verstrichene Zeit in Sekunden seit Unix-Zeit, d. h. 01.01.1970) wird eine neue Spalte mit dem Datum erstellt. |
Change date format (Datumsformat ändern) | Datumsangaben | Ändert das in einer Datumsspalte zu verwendende Datumsformat. |
Compare dates (Datumsangaben vergleichen) | Datumsangaben | Vergleicht die Spalte mit einer anderen Spalte oder Konstanten. |
Convert dates (Datum konvertieren) | Datumsangaben | Konvertiert Daten von einem Kalender in einen anderen. |
Extract date parts (Datumsteile extrahieren) | Datumsangaben | Erstellt Spalten mit Jahr, Monat, Quartal, Tag, Stunde, Minute, Sekunde usw. |
Modify dates (Datum ändern) | Datumsangaben | Addiert oder subtrahiert eine bestimmte Menge in der Zeiteinheit. |
Deduplicate rows with identical values (Zeilen mit identischen Werten deduplizieren) | Deduplizierung | Löscht Zeilen, die partielle oder vollständige Duplikate sind. Die erste Spalte wird beibehalten. InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs.
|
Delete these filtered rows (Diese gefilterten Zeilen löschen) | Gefiltert | Es werden nur die Zeilen gelöscht, die den aktuellen Filtern entsprechen. |
Keep these filtered rows (Diese gefilterten Zeilen beibehalten) | Gefiltert | Es werden nur die Zeilen beibehalten, die den aktuellen Filtern entsprechen. |
Add, multiply, substract or divide (Addieren, multiplizieren, subtrahieren oder dividieren) | Mathematik | Führt eine Operation/Berechnung für diese Spalte mit einer anderen Spalte oder einem festen Wert durch: Addieren/summieren (+), multiplizieren (x), subtrahieren (-) oder dividieren (/) |
Base 10 Logarithm (Logarithmus zur Basis 10) | Mathematik | Berechnet den Zehnerlogarithmus aus einer Spalte. |
Calculate absolute value (Absolutwert berechnen) | Mathematik | Berechnet den Absolutwert für alle numerischen Werte in der Spalte. |
Cosine (Kosinus) | Mathematik | Errechnet den trigonometrischen Kosinus aus einer Spalte. |
Exponential | Mathematik | Exponential einer Spaltenzahl. |
Max (Max.) | Mathematik | Maximum mit anderer Spalte oder Konstante |
Max of columns (Höchstwert der Spalten) | Mathematik | Zeigt den Höchstwert der Datenelemente von zwei oder mehr Spalten an. |
Mean of columns (Mittelwert der Spalten) | Mathematik | Berechnet den Mittelwert der Datenelemente von zwei oder mehr Spalten. |
Median of columns (Medianwert der Spalten) | Mathematik | Berechnet den Medianwert der Datenelemente von zwei oder mehr Spalten. |
Min (Min.) | Mathematik | Mindestwert mit anderer Spalte oder Konstante |
Min of columns (Mindestwert der Spalten) | Mathematik | Zeigt den Mindestwert der Datenelemente von zwei oder mehr Spalten an. |
Modulo | Mathematik | Berechnet den Restwert einer Division. |
Multiply columns (Spalten multiplizieren) | Mathematik | Multipliziert die Werte von zwei oder mehr Spalten und zeigt das Ergebnis in einer neuen Spalte an. |
Natural logarithm (Natürlicher Logarithmus) | Mathematik | Berechnet den natürlichen Logarithmus aus einer Spalte. |
Negate (Negieren) | Mathematik | Negiert eine Spaltenzahl. |
Power (Potenz) | Mathematik | Erstellt die Potenz mit einer anderen Spalte oder Konstanten. |
Sine (Sinus) | Mathematik | Errechnet den trigonometrischen Sinus aus einer Spalte. |
Square root (Quadratwurzel) | Mathematik | Errechnet die Quadratwurzel einer Spaltenzahl. |
Sum columns (Spalten summieren) | Mathematik | Berechnet die Summe der Datenelemente von zwei oder mehr Spalten und zeigt das Ergebnis in einer neuen Spalte an. |
Tangent (Tangente) | Mathematik | Errechnet die trigonometrische Tangente aus einer Spalte. |
Compare numbers (Zahlen vergleichen) | Zahlen | Vergleicht die Spalte mit einer anderen Spalte oder Konstanten. |
Format numbers (Zahlen formatieren) | Zahlen | Ermöglicht die Formatierung von Zahlen (Dezimalwerte, Ganzzahlen und wissenschaftliches Format) in einem spezifischen Format oder Muster. |
Generate sequence (Sequenz generieren) | Zahlen | Erstellt eine Folge positiver oder negativer Ganzzahlen (Integer) in einer Spalte mit dem Schritt Ihrer Wahl. InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs.
|
Remove fractional part (Bruchteil entfernen) | Zahlen | Rundet die Werte in Richtung null (3,74 -> 3) und (-3,74 -> -3). |
Remove negative values (Negative Werte entfernen) | Zahlen | Ersetzt negative Ganzzahlen bzw. Dezimalwerte durch leere Werte. |
Round value using ceil mode (Wert runden im Ceil-Modus) | Zahlen | Rundet Werte gemäß der von Ihnen festgelegten Genauigkeit auf die nächste Zahl auf (3,14 -> 4, wenn Precision (Genauigkeit) auf 0, bzw. 3,14 -> 3,2, wenn Precision (Genauigkeit) auf 1 eingestellt ist). |
Round value using down mode (Wert runden im Down-Modus) | Zahlen | Rundet Werte in Richtung null (3,74 -> 3 bzw. -3,74 -> -3, wenn Precision (Genauigkeit) auf 0 eingestellt ist). |
Round value using floor mode (Wert runden im Floor-Modus) | Zahlen | Rundet Werte gemäß der von Ihnen festgelegten Genauigkeit auf die nächste Zahl ab (3,74 -> 3, wenn Precision (Genauigkeit) auf 0, bzw. 3,74 -> 3,7, wenn Precision (Genauigkeit) auf 1 eingestellt ist). |
Round value using halfUp mode (Wert runden im Halfup-Modus) | Zahlen | Rundet Werte auf die nächste Zahl gemäß der von Ihnen festgelegten Genauigkeit (3,14 -> 3 und 3,74 -> 4 für eine Precision (Genauigkeit) von 0). |
Extract phone number information (Informationen zu Telefonnummern extrahieren) | Telefonnummern | Extrahiert zusätzliche Informationen zu Telefonnummern, z. B. Telefontyp, Land und Betreibername. Jedes Feld wird in einer neuen Spalte extrahiert. |
Format phone number (Telefonnummer formatieren) | Telefonnummern | Formatiert Telefonnummern gemäß den Standardformaten. |
Extract email parts (E-Mail-Teile extrahieren) | Untergliedern | Extrahiert lokale und domänenspezifische Teile aus einer E-Mailadresse. |
Extract full name parts (Teile eines vollständigen Namens extrahieren) | Untergliedern | Extrahiert Informationen aus einem vollständigen Namen, u. a. Anrede, Vorname, Kurzname, zweiter/dritter Vorname, Nachname und Suffix. |
Extract number (Zahl extrahieren) | Untergliedern | Extrahiert die Zahl aus der Eingabe. |
Extract values by regex (Werte über Regex extrahieren) | Untergliedern | Extrahiert Zeichenfolgen-Token basierend auf Regex-Gruppen. |
Extract values by semantic type (Werte nach semantischem Typ extrahieren) | Untergliedern | Extrahiert verschiedene Informationen in separate Spalten gemäß den vor- oder benutzerdefinierten semantischen Typen. |
Extract URL parts (URL-Teile extrahieren) | Untergliedern | Extrahiert Protokoll, Host, Port, Abfrage usw. aus einer URL in separate Spalten. |
Split the text in parts (Text in Teile untergliedern) | Untergliedern | Unterteilt die Spalte über Begrenzer. |
Calculate length (Länge berechnen) | Zeichenfolgen | Extrahiert die Anzahl an Zahlen aus einem Wert (23562 -> 5). |
Change to lower case (In Kleinbuchstaben ändern) | Zeichenfolgen | Der gesamte Zellentext in dieser Spalte wird in Kleinbuchstaben umgewandelt. |
Change to title case (In 'Erster Buchstabe groß' ändern) | Zeichenfolgen | Jedes Wort in der Spalte beginnt mit einem Großbuchstaben (Beispiel: „Das ist ein Beispiel“ -> „Das Ist Ein Beispiel“). |
Change to upper case (In Großbuchstaben ändern) | Zeichenfolgen | Der gesamte Zellentext in dieser Spalte wird in Großbuchstaben umgewandelt (GROSS). |
Contains text (Enthält Text) | Zeichenfolgen | Prüft, ob die Zelle den vorgegebenen Wert enthält. |
Extract a value by index (Wert nach Index extrahieren) | Zeichenfolgen | Extrahiert einen Textteil (Teilzeichenfolge) in eine neue Spalte. |
Magic Fill | Zeichenfolgen | Ermöglicht Ihnen die Definition eines Musters anhand von Beispielen und die Anwendung der Transformation auf die gesamte Spalte. InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs.
|
Match similar text (Ähnlichen Text suchen) | Zeichenfolgen | Erstellt eine neue Spalte mit true oder false, je nachdem, ob der Wert kleiner ist als die Levenshtein-Distanz eines vorgegebenen Werts oder dieser entspricht. |
Match pattern (Mit Muster abgleichen) | Zeichenfolgen | Erstellt eine neue Spalte mit true oder false, je nachdem, ob der Wert einem bestimmten Muster entspricht. |
Remove consecutive characters (Aufeinanderfolgende Zeichen entfernen) | Zeichenfolgen | Entfernt aufeinanderfolgende Zeichen. |
Remove part of the text (Textteile entfernen) | Zeichenfolgen | Entfernt den angegebenen Text aus den Zellen in der Spalte. |
Remove trailing and leading characters (Angehängte und führende Zeichen entfernen) | Zeichenfolgen | Entfernt angehängte oder führende Zeichen (d. h. trimmen). |
Search and replace (Suchen und ersetzen) | Zeichenfolgen | Ersetzt Zellen oder Zellenteile, die einen bestimmten Wert enthalten. |
Add extra characters (Zusätzliche Zeichen hinzufügen) | Zeichenfolgen erweitert | Fügt links oder rechts vom ursprünglichen Wert zusätzliche Zeichen hinzu (Padding), um eine erwartete Größe zu erreichen. |
Convert character width (Zeichenbreite konvertieren) | Zeichenfolgen erweitert | Konvertiert die Zeichenbreite in Halfwidth oder Fullwidth oder normalisiert die Zeichenfolgen. |
Find and group similar text (Ähnlichen Text finden und gruppieren) | Zeichenfolgen erweitert | Ersetzt alle vergleichbaren Werte durch den richtigen Wert (d. h. Cluster bei Fuzzy Matching). InformationshinweisAnmerkung: Diese Funktion unterstützt keine asiatischen Zeichen.
|
Generate unique identifier (UUID) (Eindeutige Kennung (UUID) generieren) | Zeichenfolgen erweitert | Generiert eine eindeutige Kennung für jede Zeile der Spalte. |
Remove all non alpha numeric characters (Nicht-alphanumerische Zeichen entfernen) | Zeichenfolgen erweitert | Löscht Werte, die unerwartete Zeichen enthalten, indem alle Zeichen ungleich 0-9, Aa-Zz und akzentuierte Buchstaben entfernt werden. Leerzeichen werden beibehalten. Beispiel: T=+Âl**€en#d$ 20%1,7 wird zu TÂlend 2017. |
Remove all non numeric characters (Nicht-numerische Zeichen entfernen) | Zeichenfolgen erweitert | Löscht numerische Werte, indem alle Zeichen ungleich 0-9 entfernt werden. Dezimaltrennzeichen und Leerzeichen werden beibehalten. Beispiel: T=+Âl**€en#d$ 20%1,7 wird zu 201,7. |
Simplify text (remove case, accent, etc.) (Text vereinfachen (Groß-/Kleinschreibung, Akzente entfernen usw.)) | Zeichenfolgen erweitert | Vereinfacht den Inhalt der Spalte durch Setzen des Inhalts in Kleinbuchstaben, Entfernen der Akzente, Normalisieren mithilfe von NFKD, Teilen kombinierter Zeichen und Trimmen der gesamten Zeichenfolge. Beispiel: François wird zu francois. |
Name | Kategorie | Beschreibung |
---|---|---|
Delete empty columns (Leere Spalten löschen) | Datenbereinigung | Alle Spalten, die nur leere Werte enthalten, werden gelöscht. |
Delete empty rows (Leere Zeilen löschen) | Datenbereinigung | Entfernt die Zeilen, in denen die Zelle in jeder Spalte leer ist. |
Change date format (Datumsformat ändern) | Datumsangaben | Ändert das in einer Datumsspalte zu verwendende Datumsformat. |
Remove duplicate rows (Zeilenduplikate entfernen) | Deduplizierung | Löscht alle Zeilen, die genaue Duplikate sind, und behält nur jeweils eine Instanz. InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs.
|
Format numbers (Zahlen formatieren) | Zahlen | Ermöglicht die Formatierung von Zahlen (Dezimalwerte, Ganzzahlen und wissenschaftliches Format) in einem spezifischen Format oder Muster. |
Format phone number (Telefonnummer formatieren) | Telefonnummern | Formatiert Telefonnummern gemäß den Standardformaten. |
Remove trailing and leading characters (Angehängte und führende Zeichen entfernen) | Zeichenfolgen | Entfernt angehängte oder führende Zeichen (d. h. trimmen). |
Search and replace (Suchen und ersetzen) | Zeichenfolgen | Ersetzt Zellen oder Zellenteile, die einen bestimmten Wert enthalten. |