Konfigurieren von Experimenten
Die Konfiguration von Experimenten besteht in der Auswahl des Ziels und der Features, die das Modell zum Vorhersagen des Ziels verwenden wird. Daneben können Sie eine Reihe optionaler Einstellungen konfigurieren.
Um Sie bei der Auswahl eines Ziels zu unterstützen, wird der Verlaufsdatensatz analysiert, und die zusammengefasste Statistik wird für jede Spalte im Datensatz angezeigt. Es werden mehrere automatische Vorverarbeitungsschritte auf den Datensatz angewendet, um zu gewährleisten, dass nur geeignete Daten eingeschlossen werden. Weitere Einzelheiten zur Datenvorverarbeitung finden Sie unter Automatische Datenvorbereitung und -umwandlung.
Nach dem Ausführen von v1 können Sie bei Bedarf neue Experimentversionen erstellen, um das Modelltraining weiter zu verfeinern. Weitere Informationen finden Sie unter Verfeinern von Modellen.
Anforderungen und Berechtigungen
Weitere Informationen über die Benutzeranforderungen für die Arbeit mit ML-Experimenten finden Sie unter Arbeiten mit Experimenten.
Die Benutzeroberfläche
Die folgenden Abschnitte geben Auskunft darüber, wie Sie sich durch die Experiment-Benutzeroberfläche bewegen, um Ihr Experiment zu konfigurieren. Weitere Informationen zur Benutzeroberfläche finden Sie unter Navigieren auf der Experiment-Benutzeroberfläche.
Registernavigation
Wenn Sie ein Experiment erstellen, wird die Registerkarte Daten geöffnet. Hier können Sie das Ziel und Features für das Experiment konfigurieren.
Nach dem Ausführen mindestens einer Experimentversion werden weitere Registerkarten verfügbar. Diese weiteren Registerkarten ermöglichen es Ihnen, die Modelle, die Sie gerade in der Version trainiert haben, zu analysieren. Falls Sie nachfolgende Versionen mit unterschiedlichen Featureauswahlen konfigurieren müssen, können Sie zur Registerkarte Daten zurückkehren.
Schemaansicht und Datenansicht
Auf der Registerkarte Daten können Sie zwischen den folgenden Ansichten hin- und herwechseln:
-
Schemaansicht: Die Standardansicht. In dieser Ansicht wird jede Spalte in Ihrem Datensatz durch eine Zeile im Schema mit Informationen und Statistiken dargestellt.
-
Datenansicht: Eine alternative Ansicht, die Sie für den Zugriff auf mehr Informationen und Beispieldaten für jede Spalte verwenden können.
Fenster Experimentkonfiguration
Klicken Sie auf Konfiguration anzeigen, um einen Fensterbereich anzuzeigen, in dem Sie das Experimenttraining weiter anpassen können. Der Fensterbereich kann unabhängig davon, welche Registerkarte Sie gerade ansehen, geöffnet werden. Dieser Fensterbereich enthält eine Reihe zusätzlicher Konfigurationsoptionen.
Mit dem Fensterbereich zur Experimentkonfiguration können Sie Folgendes tun:
-
Ziel auswählen, bevor die erste Version trainiert wird
-
Features hinzufügen oder entfernen
-
Eine neue Version des Experiments konfigurieren
-
Auswählen, um den Trainingsdatensatz zu ändern oder zu aktualisieren
-
Algorithmen hinzufügen oder entfernen
-
Modelloptimierungseinstellungen ändern
Auswählen eines Ziels
Die Zielspalte enthält die Werte, die vom Modell für maschinelles Lernen vorhergesagt werden sollen. Sie können die Zielspalte bis zum Start des ersten Trainings ändern. Danach ist sie für Änderungen gesperrt.
Gehen Sie folgendermaßen vor:
Bewegen Sie in der Schemaansicht oder der Datenansicht den Mauszeiger über die Spalte.
Klicken Sie auf das angezeigte Symbol .
Die Zielspalte wird jetzt durch gekennzeichnet, und die anderen verfügbaren Spalten werden automatisch als Features ausgewählt.
Das Ziel kann alternativ im Fensterbereich der Trainingskonfiguration ausgewählt werden.
Nachdem das Ziel ausgewählt wurde, können Sie mit der Ausführung der ersten Version des Experiments beginnen. Weitere Informationen finden Sie in Trainieren von Experimenten. An dieser Stelle können Sie wie unten beschrieben weitere Konfigurationen vornehmen, oder Sie können die Konfiguration anpassen, nachdem Sie die Trainingsergebnisse geprüft haben.
Erläuterungen dazu, wie Ihre Daten interpretiert und verarbeitet werden, finden Sie im Verlauf des Experimenttrainings. Weitere Informationen finden Sie unter Interpretation von Datensatzeinblicken.
Bestimmen des Typs des erstellten Modells
Die Spalte, die Sie als Ziel auswählen, bestimmt den Typ des Modells, das von Ihrem Experiment erstellt wird. Das spielt wiederum eine Rolle bei der Bestimmung, welche Algorithmen zum Trainieren des Modells verwendet werden. Bestimmte Spalten in Ihrem Datensatz können möglicherweise nicht als Ziel für Ihr Experiment ausgewählt werden, oder es wurde eine bestimmte Verarbeitung darauf angewendet.
Die Modelltypen sind:
Binärklassifikationsmodell
Mehrklassen-Klassifikationsmodell
Regressionsmodell
In der Tabelle unten sind die Faktoren im Ziel zusammengefasst, die den Typ des verwendeten Modells bestimmen.
Modelltyp | Anzahl distinkter Werte in Spalte | Erforderlicher Feature-Typ | Zusätzliche Informationen |
---|---|---|---|
Binäre Klassifizierung | 2 | Beliebig | - |
Mehrklassen-Klassifizierung | 3-10 | Beliebig | Eine Spalte mit mehr als 10 distinkten, nichtnumerischen Klassen kann als Ziel nicht ausgewählt werden. |
Regression | Mehr als 10 | Numerisch | - |
Um zu erfahren, welchen Modelltyp Ihr Experiment trainiert, klicken Sie auf Konfiguration anzeigen und erweitern Sie Algorithmen. Der Modelltyp ist aus dem Titel des Abschnitt ersichtlich.
Auswählen von Featurespalten
Nachdem das Ziel festgelegt ist, können Sie wählen, welche der anderen verfügbaren Spalten in das Training des Modells eingeschlossen werden. Schließen Sie alle Features aus, die nicht Teil des Modells sein sollen. Beachten Sie, dass die Spalte im Datensatz bestehen bleibt, aber vom Trainingsalgorithmus nicht verwendet wird.
Oben im Fensterbereich der Experimentkonfiguration sehen Sie die Anzahl der Zellen in Ihrem Datensatz. Wenn die Zahl das Limit Ihres Datensatzes überschreibt, können Sie Features ausschließen, um unter das Limit zu gelangen.
Sie können die Featurespalten auf verschiedene Weisen auswählen:
In der Schemaansicht und Datenansicht
In den Hauptansichten können Sie Folgendes tun:
Die Auswahl Alle verfügbaren Features einschließen aufheben und dann nur diejenigen auswählen, die Sie einschließen möchten.
Die Kontrollkästchen für die Features, die Sie nicht einschließen möchten, manuell deaktivieren.
Eine Suche durchführen und alle Features in Ihrem gefilterten Suchergebnis aus- oder einschließen.
Im Trainingsanpassungsfenster
Falls Sie den Fensterbereich zur Experimentkonfiguration erweitern, können Sie Folgendes tun:
Die Kontrollkästchen für die Features, die Sie nicht einschließen möchten, manuell deaktivieren.
Nachdem Sie die erste Version des Experiments ausgeführt haben, können Sie die Anzahl der obersten einzuschließenden Features definieren.
Wenn Sie Features auswählen, wird diesen automatisch ein Feature-Typ zugewiesen. Die möglichen Feature-Typen sind:
Kategorial
Numerisch
Datum
Freitext
Der Feature-Typ wird basierend auf den in der Feature-Spalte enthaltenen Daten zugewiesen. Wenn ein Feature bestimmte Kriterien erfüllt, kann es bereitgestellt werden, um als Grundlage für automatisch erstellte Features zu dienen. Bei Bedarf können Sie ändern, ob das Feature für automatische Feature-Erstellung verwendet wird. Genaue Einzelheiten zur automatischen technischen Planung von Features („Feature Engineering“) finden Sie unter Automatische technische Planung von Features.
Bestimmte Spalten in Ihrem Datensatz können möglicherweise nicht als Features für Ihr Experiment ausgewählt werden, oder es wurde eine bestimmte Verarbeitung darauf angewandt. Erläuterungen dazu, wie Ihre Daten interpretiert und verarbeitet werden, finden Sie im Verlauf des Experimenttrainings. Weitere Informationen finden Sie unter Interpretation von Datensatzeinblicken.
Auswählen von Algorithmen
Standardmäßig werden alle verfügbaren Algorithmen eingeschlossen. Sie können beliebige Algorithmen ausschließen, die Sie nicht verwenden möchten. In der Regel tun Sie dies im Rahmen der Modellverfeinerung, nachdem Sie die ersten Trainingsergebnisse erhalten haben. Weitere Informationen finden Sie in Verfeinern von Modellen.
Ändern der Feature-Typen
Wenn ein Datensatz geladen wird, werden die Spalten abhängig vom Datentyp und anderen Merkmalen als kategorial, numerisch, Datum oder Freitext behandelt. In einigen Fällen ist es ratsam, diese Einstellung zu ändern.
Beispiel: Wenn die Tage der Woche durch die Zahlen 1-7 dargestellt werden, steht jede Zahl für einen kategorialen Wert. Standardmäßig wird sie als numerischer Wert mit fortlaufendem Rang behandelt. Sie müssten also die Konfiguration manuell ändern, damit sie als kategorial behandelt wird.
Wenn eine Spalte dahingehend identifiziert wird, dass sie Datums- und Uhrzeitinformationen enthält, wird sie als Grundlage für neu erzeugte, automatisch erstellte Features genutzt. Wenn dies geschieht, wird die ursprüngliche Spalte (das übergeordnete Feature) so behandelt, als hätte sie den Feature-Typ „Datum“.
Sie können das übergeordnete Feature vom Datums-Feature in ein kategoriales oder numerisches Feature ändern. Dies ist z. B. nützlich, wenn ein Feature als Datum identifiziert wird, Sie es aber als String oder Zahl behandeln möchten. Wenn Sie dies tun, können Sie die automatisch erstellten Features im Experimenttraining nicht mehr verwenden.
Gehen Sie folgendermaßen vor:
Suchen Sie in der Schemaansicht nach dem Feature.
Klicken Sie in der Spalte Featuretyp für dieses Feature auf .
Wählen Sie einen Wert in der Liste aus.
Sie können alternativ Featuretypen über die Datenansicht ändern. Suchen Sie das Feature und klicken Sie dann neben dem aktuellen Featuretyp auf . Wählen Sie einen Wert in der Liste aus.
Sie können alle Spalten mit einem geänderten Featuretyp im Fensterbereich zur Experimentkonfiguration unter Datenbehandlung anzeigen.
Auswirkungen auf Vorhersagen
Wenn Sie den Featuretyp eines Features manuell ändern und dann ein entsprechendes Modell bereitstellen, werden die Überschreibungen des Featuretyps auf das Feature im Anwendungsdatensatz angewendet, der für die mit diesem Modell erstellten Vorhersagen verwendet wird.
Ändern des Datensatzes
Sie können den Trainingsdatensatz vor Ausführen der ersten Experimentversion und nach Ausführen jeder weiteren Version ändern.
Wenn Sie den Datensatz vor dem Ausführen der ersten Version ändern, geht jede vor dem Ändern des Datensatzes vorgenommene Konfiguration verloren.
Gehen Sie folgendermaßen vor:
Klicken Sie im Fensterbereich zur Experimentkonfiguration unter Trainingsdaten auf Datensatz ändern.
Wählen Sie einen neuen Datensatz aus.
Weitere Informationen zum Ändern und Aktualisieren des Datensatzes während der Modellverfeinerung (nach dem Ausführen einer Experimentversion) finden Sie unter Ändern oder Aktualisieren des Datensatzes.
Konfigurieren der Modelloptimierung
Die folgenden Einstellungen können zur Optimierung Ihrer Modelle angepasst werden:
Aktivierung oder Deaktivierung der intelligenten Modelloptimierung
Aktivieren oder Deaktivieren der Hyperparameteroptimierung
Aktivieren oder Deaktivieren des zeitbezogenen Trainings
Diese Optionen können für jede Version des Experiments, das Sie ausführen, aktiviert bzw. deaktiviert werden.
Konfiguration der intelligenten Optimierung
Das Experiment verwendet standardmäßig die intelligente Modelloptimierung. Mit der intelligenten Modelloptimierung übernimmt AutoML den Prozess der Modellverfeinerung für Sie, indem es die Featureauswahl iteriert und erweiterte Umwandlungen auf Ihre Daten anwendet.
Weitere Informationen zur intelligenten Optimierung finden Sie unter Intelligente Modelloptimierung.
Sie können diese Einstellung deaktivieren, um die Modelle, die Sie trainieren, manuell zu verfeinern. Beispielsweise möchten Sie möglicherweise Ihr Modelltraining mit der intelligenten Modelloptimierung beginnen und dann für die Version 2 zur manuellen Verfeinerung wechseln, um die Konfiguration weiter anzupassen.
Gehen Sie folgendermaßen vor:
Klicken Sie auf Konfiguration anzeigen.
Falls Sie bereits mindestens eine Version des Experiments ausgeführt haben, klicken Sie auf Neue Version.
Erweitern Sie im Fensterbereich die Option Modelloptimierung.
Wechseln Sie von Intelligent zu Manuell.
Legen Sie mit dem Schieberegler die maximale Ausführungsdauer für das Training fest.
Konfigurieren der Hyperparameteroptimierung
Sie können die Modelle anhand von Hyperparameteroptimierung optimieren. Beachten Sie, dass dies eine erweiterte Option ist, durch die sich die Trainingszeit erheblich verlängern kann. Die Hyperparameteroptimierung ist verfügbar, wenn Sie die intelligente Optimierung deaktivieren.
Weitere Informationen finden Sie unter Hyperparameteroptimierung.
Gehen Sie folgendermaßen vor:
Klicken Sie auf Konfiguration anzeigen.
Falls Sie bereits mindestens eine Version des Experiments ausgeführt haben, klicken Sie auf Neue Version.
Erweitern Sie im Fensterbereich die Option Modelloptimierung.
Wechseln Sie von Intelligent zu Manuell.
Aktivieren Sie das Kontrollkästchen Hyperparameteroptimierung.
Legen Sie optional ein Zeitlimit für Ihre Optimierung fest. Das Standardzeitlimit ist eine Stunde.
Konfigurieren des zeitbezogenen Trainings
Wenn Sie möchten, dass Ihre Modelle unter Berücksichtigung einer Zeitreihendimension trainiert werden, aktivieren Sie das zeitbezogene Training für die Experimentversion. Um diese Option zu verwenden, benötigen Sie in Ihrem Datensatz eine Spalte, die die relevanten Zeitreiheninformationen enthält.
Wenn zeitbezogenes Training aktiviert ist, verwendet AutoML spezielle Kreuzvalidierungs- und Null-Imputationsverfahren, um die Modelle zu trainieren.
Weitere Informationen finden Sie unter Erstellen von zeitbezogenen Modellen und Zeitbasierte Kreuzvalidierung.
Gehen Sie folgendermaßen vor:
Klicken Sie auf Konfiguration anzeigen.
Falls Sie bereits mindestens eine Version des Experiments ausgeführt haben, klicken Sie auf Neue Version.
Erweitern Sie im Fensterbereich die Option Modelloptimierung.
Wählen Sie unter Zeitbasierter Test-Train-Split den Datumsindex aus, der für die Sortierung der Daten verwendet werden soll.
Anzeigen von Einblicken in die Trainingsdaten
Sie können auf der Registerkarte Daten des Experiments Einblicke in die Verarbeitung der Trainingsdaten anzeigen. Diese Informationen stehen in der Spalte Einblicke in der Schemaansicht zur Verfügung. Diese gezeigten Informationen hängen davon ab, ob Sie eine Version mit den aktuellen Trainingsdaten ausgeführt haben oder nicht. Die Änderungen in der Spalte Einblicke können dabei helfen zu ermitteln, warum Features möglicherweise nicht zur Nutzung zur Verfügung stehen oder warum sie automatisch weggelassen wurden.
Weitere Informationen zur Bedeutung der einzelnen Einblicke finden Sie unter Interpretation von Datensatzeinblicken.