Erstellen neuer Featurespalten
Feature Engineering ist der Prozess der Erstellung neuer Featurespalten anhand aktueller Spalten. Damit können Sie zusätzliche Vorhersageleistung aus Quelldaten erhalten, die zur Beantwortung einer geschäftlichen Frage erfasst wurden.
Beispielsweise wird die Adresse eines Kunden aufgrund der hohen Kardinalität aus den Trainingsdaten ausgeschlossen. Anstatt die Adresse zu verwenden, können wir mit Feature Engineering eine Entfernungsspalte erstellen. Wenn wir die Adresse des Kunden zusammen mit verschiedenen Geschäftsstandorten kennen, kann die Entfernung zu den Geschäften berechnet werden. Die neuen Spalten haben einen numerischen Wert, der verwendet werden kann, um messbare Muster in den Daten aufzudecken.
Sie können die technische Planung von Features für Ihren Datensatz als Vorbereitung zur Nutzung in AutoML durchführen. Zusätzlich schlägt AutoML neue Features vor, die automatisch aus vorhandenen Features erstellt werden können.
Prüfen Sie die Features in Ihrem Datensatz, um etwaige vorhandene Probleme oder Verbesserungsmöglichkeiten zu erkennen. Das Erstellen guter Features erfordert Fachkenntnis und geschäftliche Erfahrung. Features sollen so formuliert werden, dass sie direkt zur Zielspalte passen.
Beachten Sie Folgendes:
-
Sollte ein Zeitfaktor in das Feature einbezogen werden?
-
Ist die Änderungsrate wichtig?
-
Sollte ein Feature normalisiert werden, um Unterschiede in Datenteilsätzen zu berücksichtigen?
-
Haben Nullwerte eine Bedeutung?
Automatisch erstellte Features
Mit der automatischen technischen Planung von Features („Feature Engineering“) werden neue Features automatisch anhand von vorhandenen erstellt.
AutoML erstellt automatisch erstellte Features aus Spalten, die Datums- und Uhrzeitinformationen enthalten. Diese neuen Features trennen jede Komponente der Spaltenwerte in ihre eigene Features.
Zudem können Spalten mit Freitext besonders verarbeitet werden. Die ursprünglichen Freitext-Features werden in neue Features umgewandelt, um das Modelltraining zu verbessern.
Automatisch erstellte Features verbessern bei anhaltendem Training den Prognose- und Analysewert Ihrer Modelle. Weitere Informationen finden Sie unter Automatische technische Planung von Features.
Beispiele: Erstellen von Features
Verwenden Sie die folgenden Beispiele, um ein Brainstorming darüber zu beginnen, wie Features erstellt werden können, um die Vorhersagemöglichkeiten Ihrer Daten zu steigern.
Führt eine Verkaufschance zum Abschluss?
Die Zielspalte besagt, ob die Verkaufschance zum Abschluss führte (Ja oder Nein).
-
Original-Feature: Anzahl der Sitzungen
-
Alternative Features: Treffen pro Monat oder Anzahl der Treffen in einer bestimmten Phase
Wenn die Kennzahl in Häufigkeit der Treffen umgewandelt wird, lassen sich Änderungen besser belegen. Wenn Treffen in einer bestimmten Phase im Verkaufsprozess gemessen werden, lässt sich die Verkaufsdynamik besser ausdrücken und der Zyklus belegen.
Zukünftigen Transaktionsbetrag vorhersagen
Die Zielspalte enthält den Betrag der nächsten Transaktion.
-
Original-Feature: Betrag der letzten Bestellung
-
Alternative Features: der durchschnittliche Bestellbetrag oder der Änderungsprozentsatz des Bestellbetrags
Der Durchschnittsbetrag bietet einen umfassenderen Blick auf das Bestellverhalten. Die Änderung im Kaufmuster gibt einen normalisierten Wert an.
Wird ein Kunde kündigen?
Die Zielspalte gibt an, ob der Kunde kündigen wird (Ja oder Nein).
-
Original-Feature: Kundenstimmung
-
Alternative Features: Änderung der Kundenstimmung oder Anzahl der Tage mit der aktuellen Stimmung
Eine Messung der Änderung der Stimmung führt mit höherer Wahrscheinlichkeit zu einer Maßnahme. Die Anzahl der Tage gibt die Dauer des aktuellen Zustands an.
Wird ein Mitarbeiter freiwillig kündigen?
Die Zielspalte gibt an, ob ein Mitarbeiter kündigen wird (Ja oder Nein).
-
Original-Feature: Gehalt
-
Alternative Features: Gehalt im Vergleich zum Gehalt von Kollegen oder Gehalt im Vergleich zum Branchendurchschnitt
Beim Vergleich d-es Gehalts mit dem Gehalt von Kollegen werden die Erfahrungen oder die Gefühle des Mitarbeiters besser einbezogen. Der Vergleich mit dem Durchschnittsgehalt der Branche bezieht die Opportunitätskosten des Mitarbeiters besser ein.
Wird ein Lead in eine Chance konvertiert?
Die Zielspalte gibt an, ob ein Lead konvertiert wird (Ja oder Nein).
-
Original-Feature: Wie haben Sie uns gefunden?
-
Alternative Features: Beantwortet (Ja oder Nein)
Hier ist die Aktion wichtig und nicht, wie die Antwort ausfiel. Beachten Sie, dass in diesem Fall Null etwas bedeutet, nämlich Untätigkeit.
Datumsangaben
Mit der Funktion zur automatischen technischen Planung von Features bei AutoML werden die Komponenten von Daten und Zeitstempeln automatisch in separate Spalten zerlegt.
Datumsangaben können auch auf viele andere verschiedene Weisen eingesetzt werden, um mehrere Features in einem Datensatz zu erstellen. Es gibt beispielsweise folgende Möglichkeiten:
-
Aggregieren Sie Datumsangaben in Jahreszeiten, Quartalen oder Halbjahren.
-
Berechnen Sie den Datumsunterschied, beispielsweise die Anzahl der Tage seit dem letzten Kauf.