Deduplizieren der Daten
Deduplizieren von Werten in Spalten
Sie können die Funktion Deduplicate rows with identical values (Zeilen mit identischen Werten deduplizieren) nutzen, um problemlos alle Zeilen zu löschen, die teilweise oder vollständig mit anderen Zeilen übereinstimmen.
Doppelte Informationen können in Kalkulationstabellen aufgrund eines menschlichen Fehlers, z. B. durch falsches Kopieren und Einfügen, oder automatisierter Vorgänge entstehen. Im folgenden Datensatz mit grundlegenden Kundendaten können Sie feststellen, dass die Spalten firstname (Vorname) und lastname (Nachname) Werte enthalten, die mehr als einmal vorkommen.
Jake und Peralta sind tatsächlich Einträge, die aussehen, als würden die Spalten firstname (Vorname) und lastname (Nachname) Duplikate enthalten, wenn man sie separat betrachtet. Bei näherer Betrachtung jedoch zeigt sich, dass die Informationen auf den Zeilen 1, 2 und 4 zu separaten Kunden gehören, die entweder denselben Vor- oder denselben Nachnamen haben. Zeile 3 hingegen ist ein wirkliches Duplikat von Zeile 2, außerdem fehlen einige Informationen.
Das Sie bei einer für die zwei Spalten separat durchgeführten Deduplizierung wertvolle Informationen über Kunden verlieren würden, die zufällig denselben Vor- oder Nachnamen haben, wenden Sie die Funktion Deduplicate rows with identical values (Zeilen mit identischen Werten deduplizieren) auf beide Spalten gleichzeitig an. Auf diese Weise entfernt die Funktion nur Zeilen, in denen sowohl der Vor- als auch der Nachname Duplikate sind, wie in den Zeilen 2 und 3, aber auch andere potenzielle Duplikate weiter unten im Datensatz.
Procedure
Results
Deduplizieren von Zeilen
Mit der Funktion Remove duplicate rows (Zeilenduplikate entfernen) können Sie problemlos alle Zeilen löschen, die vollständig identisch mit anderen Zeilen sind, und von diesen nur jeweils eine Instanz im Datensatz beibehalten.
Doppelte Informationen können in Kalkulationstabellen aufgrund eines menschlichen Fehlers, z. B. durch falsches Kopieren und Einfügen, oder automatisierter Vorgänge entstehen. In diesem Beispiel haben Sie einen Datensatz mit Kundendaten erhalten, in dem alle Zeilen systematisch verdoppelt wurden.
Sie ziehen die Funktion Remove duplicate rows (Zeilenduplikate entfernen) heran, um Ihren Datensatz ganz einfach zu bereinigen.
Procedure
Results
Alle Informationsduplikate werden durch eine einfache Aktion entfernt, sodass Ihr Datensatz nur noch eine gültige Instanz jeder Zeile enthält.