Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Erstellen neuer Featurespalten

Feature Engineering ist der Prozess der Erstellung neuer Featurespalten anhand aktueller Spalten. Damit können Sie zusätzliche Vorhersageleistung aus Quelldaten erhalten, die zur Beantwortung einer geschäftlichen Frage erfasst wurden.

Beispielsweise wird die Adresse eines Kunden aufgrund der hohen Kardinalität aus den Trainingsdaten ausgeschlossen. Anstatt die Adresse zu verwenden, können wir mit Feature Engineering eine Entfernungsspalte erstellen. Wenn wir die Adresse des Kunden zusammen mit verschiedenen Geschäftsstandorten kennen, kann die Entfernung zu den Geschäften berechnet werden. Die neuen Spalten haben einen numerischen Wert, der verwendet werden kann, um messbare Muster in den Daten aufzudecken.

Sie können die technische Planung von Features für Ihren Datensatz als Vorbereitung zur Nutzung in AutoML durchführen. Zusätzlich schlägt AutoML neue Features vor, die automatisch aus vorhandenen Features erstellt werden können.

Neue Spalten für Entfernungen zu verschiedenen Geschäften

Tabelle mit Beispieldaten.

Prüfen Sie die Features in Ihrem Datensatz, um etwaige vorhandene Probleme oder Verbesserungsmöglichkeiten zu erkennen. Das Erstellen guter Features erfordert Fachkenntnis und geschäftliche Erfahrung. Features sollen so formuliert werden, dass sie direkt zur Zielspalte passen.

Beachten Sie Folgendes:

  • Sollte ein Zeitfaktor in das Feature einbezogen werden?

  • Ist die Änderungsrate wichtig?

  • Sollte ein Feature normalisiert werden, um Unterschiede in Datenteilsätzen zu berücksichtigen?

  • Haben Nullwerte eine Bedeutung?

Automatisch erstellte Features

Mit der automatischen technischen Planung von Features („Feature Engineering“) werden neue Features automatisch anhand von vorhandenen erstellt.

AutoML erstellt automatisch erstellte Features aus Spalten, die Datums- und Uhrzeitinformationen enthalten. Diese neuen Features trennen jede Komponente der Spaltenwerte in ihre eigene Features.

Zudem können Spalten mit Freitext besonders verarbeitet werden. Die ursprünglichen Freitext-Features werden in neue Features umgewandelt, um das Modelltraining zu verbessern.

Automatisch erstellte Features verbessern bei anhaltendem Training den Prognose- und Analysewert Ihrer Modelle. Weitere Informationen finden Sie unter Automatische technische Planung von Features.

Beispiele: Erstellen von Features

Verwenden Sie die folgenden Beispiele, um ein Brainstorming darüber zu beginnen, wie Features erstellt werden können, um die Vorhersagemöglichkeiten Ihrer Daten zu steigern.

Führt eine Verkaufschance zum Abschluss?

Die Zielspalte besagt, ob die Verkaufschance zum Abschluss führte (Ja oder Nein).

  • Original-Feature: Anzahl der Sitzungen

  • Alternative Features: Treffen pro Monat oder Anzahl der Treffen in einer bestimmten Phase

Wenn die Kennzahl in Häufigkeit der Treffen umgewandelt wird, lassen sich Änderungen besser belegen. Wenn Treffen in einer bestimmten Phase im Verkaufsprozess gemessen werden, lässt sich die Verkaufsdynamik besser ausdrücken und der Zyklus belegen.

Zukünftigen Transaktionsbetrag vorhersagen

Die Zielspalte enthält den Betrag der nächsten Transaktion.

  • Original-Feature: Betrag der letzten Bestellung

  • Alternative Features: der durchschnittliche Bestellbetrag oder der Änderungsprozentsatz des Bestellbetrags

Der Durchschnittsbetrag bietet einen umfassenderen Blick auf das Bestellverhalten. Die Änderung im Kaufmuster gibt einen normalisierten Wert an.

Wird ein Kunde kündigen?

Die Zielspalte gibt an, ob der Kunde kündigen wird (Ja oder Nein).

  • Original-Feature: Kundenstimmung

  • Alternative Features: Änderung der Kundenstimmung oder Anzahl der Tage mit der aktuellen Stimmung

Eine Messung der Änderung der Stimmung führt mit höherer Wahrscheinlichkeit zu einer Maßnahme. Die Anzahl der Tage gibt die Dauer des aktuellen Zustands an.

Wird ein Mitarbeiter freiwillig kündigen?

Die Zielspalte gibt an, ob ein Mitarbeiter kündigen wird (Ja oder Nein).

  • Original-Feature: Gehalt

  • Alternative Features: Gehalt im Vergleich zum Gehalt von Kollegen oder Gehalt im Vergleich zum Branchendurchschnitt

Beim Vergleich d-es Gehalts mit dem Gehalt von Kollegen werden die Erfahrungen oder die Gefühle des Mitarbeiters besser einbezogen. Der Vergleich mit dem Durchschnittsgehalt der Branche bezieht die Opportunitätskosten des Mitarbeiters besser ein.

Wird ein Lead in eine Chance konvertiert?

Die Zielspalte gibt an, ob ein Lead konvertiert wird (Ja oder Nein).

  • Original-Feature: Wie haben Sie uns gefunden?

  • Alternative Features: Beantwortet (Ja oder Nein)

Hier ist die Aktion wichtig und nicht, wie die Antwort ausfiel. Beachten Sie, dass in diesem Fall Null etwas bedeutet, nämlich Untätigkeit.

Datumsangaben

Mit der Funktion zur automatischen technischen Planung von Features bei AutoML werden die Komponenten von Daten und Zeitstempeln automatisch in separate Spalten zerlegt.

Datumsangaben können auch auf viele andere verschiedene Weisen eingesetzt werden, um mehrere Features in einem Datensatz zu erstellen. Es gibt beispielsweise folgende Möglichkeiten:

  • Aggregieren Sie Datumsangaben in Jahreszeiten, Quartalen oder Halbjahren.

  • Berechnen Sie den Datumsunterschied, beispielsweise die Anzahl der Tage seit dem letzten Kauf.

VERWANDTE LERNINHALTE:

Weitere Informationen

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!