Automatische technische Planung von Features
Mit der automatischen technischen Planung von Features („Feature Engineering“) kann Qlik Predict vorhandene Features in Ihren Trainingsdaten zum Erstellen neuer Features nutzen. Diese automatisch erstellten neuen Features ermöglichen es Ihnen, neue Muster in Ihren Daten zu ausfindig zu machen, und können die Leistung Ihrer Modelle für maschinelles Lernen deutlich steigern. Qlik Predict unterstützt die Feature-Entwicklung für Datum und für Freitext.
Hintergrund
Feature Engineering ist der Prozess der Erstellung neuer Feature-Spalten anhand aktueller Spalten. Qlik Predict kann Feature Engineering für eine verbesserte Bearbeitung bestimmter Datentypen automatisch durchführen. Allgemeine Informationen zum Feature Engineering finden Sie unter Erstellen neuer Featurespalten.
Identifizieren, wann die automatische Feature-Entwicklung möglich ist
Nachdem Sie einen Datensatz ausgewählt haben, der in Ihrem Experiment verwendet werden soll, wird der Datensatz analysiert und die Spalten darin werden als Spalten mit bestimmten Datentypen identifiziert. Mit diesen Datentypen kann Qlik Predict jeder Spalte im Datensatz einen Feature-Typ zuweisen. Jede Spalte erhält einen der folgenden Feature-Typen:
-
Kategorial
-
Numerisch
-
Datum
-
Freitext
Nach Möglichkeit zeigt Qlik Predict eine Liste automatisch erstellter Features an, die aus berechtigten übergeordneten Features erstellt werden können. Diese Liste automatisch erstellter Features wird weiter verfeinert und reduziert, sobald die Vorverarbeitung beginnt. Die Einbeziehung automatisch erstellter Features in Ihrem Experiment ist empfohlen, aber nicht zwingend notwendig. Sie können individuelle, automatisch erstellte Features entfernen, bevor Sie das Training beginnen und während die Konfiguration jeder neuen Experimentversion läuft.
Weitere Informationen zu Vorgängen, die vor Beginn des Experimenttrainings abgeschlossen werden, finden Sie unter Automatische Datenvorbereitung und -umwandlung.
Technische Planung des Datums-Features
Wenn Datums- und Datum/Uhrzeit-Spalten in den Trainingsdaten erkannt werden, können aus diesen Spalten automatisch neue Datums-Features erstellt werden. Weitere Informationen finden Sie unter Technische Planung des Datums-Features.
Freitextverarbeitung
Die spezielle Verarbeitung von Freitextdaten wird beim Trainieren von Modellen unterstützt. Weitere Informationen finden Sie unter Handhabung von Freitextdaten.