Konfigurieren von Experimenten

Die Konfiguration von Experimenten besteht in der Auswahl des Ziels und der Features, die das Modell zum Vorhersagen des Ziels verwenden wird. Daneben können Sie eine Reihe optionaler Einstellungen konfigurieren.

Um Sie bei der Auswahl eines Ziels zu unterstützen, wird der Verlaufsdatensatz analysiert, und die zusammengefasste Statistik wird für jede Spalte im Datensatz angezeigt. Es werden mehrere automatische Vorverarbeitungsschritte auf den Datensatz angewendet, um zu gewährleisten, dass nur geeignete Daten eingeschlossen werden. Weitere Einzelheiten zur Datenvorverarbeitung finden Sie unter Automatische Datenvorbereitung und -umwandlung.

Nach dem Ausführen von v1 können Sie bei Bedarf neue Experimentversionen erstellen, um das Modelltraining weiter zu verfeinern. Weitere Informationen finden Sie unter Verfeinern von Modellen.

Anforderungen und Berechtigungen

Weitere Informationen über die Benutzeranforderungen für die Arbeit mit ML-Experimenten finden Sie unter Arbeiten mit Experimenten.

Die Benutzeroberfläche

Die folgenden Abschnitte geben Auskunft darüber, wie Sie sich durch die Experiment-Benutzeroberfläche bewegen, um Ihr Experiment zu konfigurieren. Weitere Informationen zur Benutzeroberfläche finden Sie unter Navigieren auf der Experiment-Benutzeroberfläche.

Registernavigation

Wenn Sie ein Experiment erstellen, wird die Registerkarte Daten geöffnet. Hier können Sie das Ziel und Features für das Experiment konfigurieren.

Nach dem Ausführen mindestens einer Experimentversion werden weitere Registerkarten verfügbar. Diese weiteren Registerkarten ermöglichen es Ihnen, die Modelle, die Sie gerade in der Version trainiert haben, zu analysieren. Falls Sie nachfolgende Versionen mit unterschiedlichen Featureauswahlen konfigurieren müssen, können Sie zur Registerkarte Daten zurückkehren.

Schemaansicht und Datenansicht

Auf der Registerkarte Daten können Sie zwischen den folgenden Ansichten hin- und herwechseln:

Schemaansicht: Die Standardansicht. In dieser Ansicht wird jede Spalte in Ihrem Datensatz durch eine Zeile im Schema mit Informationen und Statistiken dargestellt.
Datenansicht: Eine alternative Ansicht, die Sie für den Zugriff auf mehr Informationen und Beispieldaten für jede Spalte verwenden können.

Fenster Experimentkonfiguration

Klicken Sie auf Steuerelemente Konfiguration anzeigen, um einen Fensterbereich anzuzeigen, in dem Sie das Experimenttraining weiter anpassen können. Der Fensterbereich kann unabhängig davon, welche Registerkarte Sie gerade ansehen, geöffnet werden. Dieser Fensterbereich enthält eine Reihe zusätzlicher Konfigurationsoptionen.

Mit dem Fensterbereich zur Experimentkonfiguration können Sie Folgendes tun:

Ziel auswählen, bevor die erste Version trainiert wird
Features hinzufügen oder entfernen
Eine neue Version des Experiments konfigurieren
Auswählen, um den Trainingsdatensatz zu ändern oder zu aktualisieren
Algorithmen hinzufügen oder entfernen
Modelloptimierungseinstellungen ändern

Erweitertes Anpassungsfenster in einem ML-Experiment — Fenster Experimentkonfiguration

Auswählen eines Ziels

Die Zielspalte enthält die Werte, die vom Modell für maschinelles Lernen vorhergesagt werden sollen. Sie können die Zielspalte bis zum Start des ersten Trainings ändern. Danach ist sie für Änderungen gesperrt.

Gehen Sie folgendermaßen vor:

Bewegen Sie in der Schemaansicht oder der Datenansicht den Mauszeiger über die Spalte.
Klicken Sie auf das angezeigte Symbol .

Die Zielspalte wird jetzt durch gekennzeichnet, und die anderen verfügbaren Spalten werden automatisch als Features ausgewählt.

Datensatzspalte mit Zielsymbol. — Auswahl des Ziels in der Schemaansicht

Das Ziel kann alternativ im Fensterbereich der Trainingskonfiguration ausgewählt werden.

Nachdem das Ziel ausgewählt wurde, können Sie mit der Ausführung der ersten Version des Experiments beginnen. Weitere Informationen finden Sie in Trainieren von Experimenten. An dieser Stelle können Sie wie unten beschrieben weitere Konfigurationen vornehmen, oder Sie können die Konfiguration anpassen, nachdem Sie die Trainingsergebnisse geprüft haben.

Erläuterungen dazu, wie Ihre Daten interpretiert und verarbeitet werden, finden Sie im Verlauf des Experimenttrainings. Weitere Informationen finden Sie unter Interpretation von Datensatzeinblicken.

Bestimmen des Typs des erstellten Modells

Die Spalte, die Sie als Ziel auswählen, bestimmt den Typ des Modells, das von Ihrem Experiment erstellt wird. Das spielt wiederum eine Rolle bei der Bestimmung, welche Algorithmen zum Trainieren des Modells verwendet werden. Bestimmte Spalten in Ihrem Datensatz können möglicherweise nicht als Ziel für Ihr Experiment ausgewählt werden, oder es wurde eine bestimmte Verarbeitung darauf angewendet.

Die Modelltypen sind:

Binärklassifikationsmodell
Mehrklassen-Klassifikationsmodell
Regressionsmodell

In der Tabelle unten sind die Faktoren im Ziel zusammengefasst, die den Typ des verwendeten Modells bestimmen.

Merkmale der Zielspalte, die den Modelltyp bestimmen
Modelltyp	Anzahl distinkter Werte in Spalte	Erforderlicher Feature-Typ	Zusätzliche Informationen
Binäre Klassifizierung	2	Beliebig	-
Mehrklassen-Klassifizierung	3-10	Beliebig	Eine Spalte mit mehr als 10 distinkten, nichtnumerischen Klassen kann als Ziel nicht ausgewählt werden.
Regression	Mehr als 10	Numerisch	-

Um zu erfahren, welchen Modelltyp Ihr Experiment trainiert, klicken Sie auf Schema Konfiguration anzeigen und erweitern Sie Algorithmen. Der Modelltyp ist aus dem Titel des Abschnitt ersichtlich.

Auswählen von Featurespalten

Nachdem das Ziel festgelegt ist, können Sie wählen, welche der anderen verfügbaren Spalten in das Training des Modells eingeschlossen werden. Schließen Sie alle Features aus, die nicht Teil des Modells sein sollen. Beachten Sie, dass die Spalte im Datensatz bestehen bleibt, aber vom Trainingsalgorithmus nicht verwendet wird.

Oben im Fensterbereich der Experimentkonfiguration sehen Sie die Anzahl der Zellen in Ihrem Datensatz. Wenn die Zahl das Limit Ihres Datensatzes überschreibt, können Sie Features ausschließen, um unter das Limit zu gelangen.

Sie können die Featurespalten auf verschiedene Weisen auswählen:

In der Schemaansicht und Datenansicht

In den Hauptansichten können Sie Folgendes tun:

Die Auswahl Alle verfügbaren Features einschließen aufheben und dann nur diejenigen auswählen, die Sie einschließen möchten.
Die Kontrollkästchen für die Features, die Sie nicht einschließen möchten, manuell deaktivieren.
Eine Suche durchführen und alle Features in Ihrem gefilterten Suchergebnis aus- oder einschließen.

Im Trainingsanpassungsfenster

Falls Sie den Fensterbereich zur Experimentkonfiguration erweitern, können Sie Folgendes tun:

Die Kontrollkästchen für die Features, die Sie nicht einschließen möchten, manuell deaktivieren.
Nachdem Sie die erste Version des Experiments ausgeführt haben, können Sie die Anzahl der obersten einzuschließenden Features definieren.

Abschnitt „Features“ im Trainingsanpassungsfenster von AutoML — Abschnitt Features im Fensterbereich zur Experimentkonfiguration

Wenn Sie Features auswählen, wird diesen automatisch ein Feature-Typ zugewiesen. Die möglichen Feature-Typen sind:

Kategorial
Numerisch
Datum
Freitext

Der Feature-Typ wird basierend auf den in der Feature-Spalte enthaltenen Daten zugewiesen. Wenn ein Feature bestimmte Kriterien erfüllt, kann es bereitgestellt werden, um als Grundlage für automatisch erstellte Features zu dienen. Bei Bedarf können Sie ändern, ob das Feature für automatische Feature-Erstellung verwendet wird. Genaue Einzelheiten zur automatischen technischen Planung von Features („Feature Engineering“) finden Sie unter Automatische technische Planung von Features.

Bestimmte Spalten in Ihrem Datensatz können möglicherweise nicht als Features für Ihr Experiment ausgewählt werden, oder es wurde eine bestimmte Verarbeitung darauf angewandt. Erläuterungen dazu, wie Ihre Daten interpretiert und verarbeitet werden, finden Sie im Verlauf des Experimenttrainings. Weitere Informationen finden Sie unter Interpretation von Datensatzeinblicken.

Auswählen von Algorithmen

Standardmäßig werden alle verfügbaren Algorithmen eingeschlossen. Sie können beliebige Algorithmen ausschließen, die Sie nicht verwenden möchten. In der Regel tun Sie dies im Rahmen der Modellverfeinerung, nachdem Sie die ersten Trainingsergebnisse erhalten haben. Weitere Informationen finden Sie in Verfeinern von Modellen.

Abschnitt „Algorithmen“ im Trainingsanpassungsfenster von AutoML — Abschnitt Algorithmen im Fensterbereich zur Experimentkonfiguration

Ändern der Feature-Typen

Wenn ein Datensatz geladen wird, werden die Spalten abhängig vom Datentyp und anderen Merkmalen als kategorial, numerisch, Datum oder Freitext behandelt. In einigen Fällen ist es ratsam, diese Einstellung zu ändern.

Beispiel: Wenn die Tage der Woche durch die Zahlen 1-7 dargestellt werden, steht jede Zahl für einen kategorialen Wert. Standardmäßig wird sie als numerischer Wert mit fortlaufendem Rang behandelt. Sie müssten also die Konfiguration manuell ändern, damit sie als kategorial behandelt wird.

Wenn eine Spalte dahingehend identifiziert wird, dass sie Datums- und Uhrzeitinformationen enthält, wird sie als Grundlage für neu erzeugte, automatisch erstellte Features genutzt. Wenn dies geschieht, wird die ursprüngliche Spalte (das übergeordnete Feature) so behandelt, als hätte sie den Feature-Typ „Datum“.

Sie können das übergeordnete Feature vom Datums-Feature in ein kategoriales oder numerisches Feature ändern. Dies ist z. B. nützlich, wenn ein Feature als Datum identifiziert wird, Sie es aber als String oder Zahl behandeln möchten. Wenn Sie dies tun, können Sie die automatisch erstellten Features im Experimenttraining nicht mehr verwenden.

Gehen Sie folgendermaßen vor:

Suchen Sie in der Schemaansicht nach dem Feature.
Klicken Sie in der Spalte Featuretyp für dieses Feature auf .
Wählen Sie einen Wert in der Liste aus.

Sie können alternativ Featuretypen über die Tabelle Datenansicht ändern. Suchen Sie das Feature und klicken Sie dann neben dem aktuellen Featuretyp auf Pfeil nach unten . Wählen Sie einen Wert in der Liste aus.

Sie können alle Spalten mit einem geänderten Featuretyp im Fensterbereich zur Experimentkonfiguration unter Datenbehandlung anzeigen.

Auswirkungen auf Vorhersagen

Wenn Sie den Featuretyp eines Features manuell ändern und dann ein entsprechendes Modell bereitstellen, werden die Überschreibungen des Featuretyps auf das Feature im Anwendungsdatensatz angewendet, der für die mit diesem Modell erstellten Vorhersagen verwendet wird.

Ändern des Datensatzes

Sie können den Trainingsdatensatz vor Ausführen der ersten Experimentversion und nach Ausführen jeder weiteren Version ändern.

Wenn Sie den Datensatz vor dem Ausführen der ersten Version ändern, geht jede vor dem Ändern des Datensatzes vorgenommene Konfiguration verloren.

Gehen Sie folgendermaßen vor:

Klicken Sie im Fensterbereich zur Experimentkonfiguration unter Trainingsdaten auf Datensatz ändern.
Wählen Sie einen neuen Datensatz aus.

Weitere Informationen zum Ändern und Aktualisieren des Datensatzes während der Modellverfeinerung (nach dem Ausführen einer Experimentversion) finden Sie unter Ändern oder Aktualisieren des Datensatzes.

Konfigurieren der Modelloptimierung

Die folgenden Einstellungen können zur Optimierung Ihrer Modelle angepasst werden:

Aktivierung oder Deaktivierung der intelligenten Modelloptimierung
Aktivieren oder Deaktivieren der Hyperparameteroptimierung
Aktivieren oder Deaktivieren des zeitbezogenen Trainings

Diese Optionen können für jede Version des Experiments, das Sie ausführen, aktiviert bzw. deaktiviert werden.

Konfiguration der intelligenten Optimierung

Das Experiment verwendet standardmäßig die intelligente Modelloptimierung. Mit der intelligenten Modelloptimierung übernimmt AutoML den Prozess der Modellverfeinerung für Sie, indem es die Featureauswahl iteriert und erweiterte Umwandlungen auf Ihre Daten anwendet.

Weitere Informationen zur intelligenten Optimierung finden Sie unter Intelligente Modelloptimierung.

Sie können diese Einstellung deaktivieren, um die Modelle, die Sie trainieren, manuell zu verfeinern. Beispielsweise möchten Sie möglicherweise Ihr Modelltraining mit der intelligenten Modelloptimierung beginnen und dann für die Version 2 zur manuellen Verfeinerung wechseln, um die Konfiguration weiter anzupassen.

Gehen Sie folgendermaßen vor:

Klicken Sie auf Konfiguration anzeigen.
Falls Sie bereits mindestens eine Version des Experiments ausgeführt haben, klicken Sie auf Neue Version.
Erweitern Sie im Fensterbereich die Option Modelloptimierung.
Wechseln Sie von Intelligent zu Manuell.
Legen Sie mit dem Schieberegler die maximale Ausführungsdauer für das Training fest.

Aktivieren der intelligenten Modelloptimierung unter „Modelloptimierung“ im Trainings-Anpassungsbereich von AutoML — Konfigurieren der Modelloptimierung

Konfigurieren der Hyperparameteroptimierung

Sie können die Modelle anhand von Hyperparameteroptimierung optimieren. Beachten Sie, dass dies eine erweiterte Option ist, durch die sich die Trainingszeit erheblich verlängern kann. Die Hyperparameteroptimierung ist verfügbar, wenn Sie die intelligente Optimierung deaktivieren.

Weitere Informationen finden Sie unter Hyperparameteroptimierung.

Gehen Sie folgendermaßen vor:

Klicken Sie auf Konfiguration anzeigen.
Falls Sie bereits mindestens eine Version des Experiments ausgeführt haben, klicken Sie auf Neue Version.
Erweitern Sie im Fensterbereich die Option Modelloptimierung.
Wechseln Sie von Intelligent zu Manuell.
Aktivieren Sie das Kontrollkästchen Hyperparameteroptimierung.
Legen Sie optional ein Zeitlimit für Ihre Optimierung fest. Das Standardzeitlimit ist eine Stunde.

Trainingsanpassungsfenster von AutoML mit aktivierter Hyperparameteroptimierung — Konfigurieren der Hyperparameteroptimierung

Konfigurieren des zeitbezogenen Trainings

Wenn Sie möchten, dass Ihre Modelle unter Berücksichtigung einer Zeitreihendimension trainiert werden, aktivieren Sie das zeitbezogene Training für die Experimentversion. Um diese Option zu verwenden, benötigen Sie in Ihrem Datensatz eine Spalte, die die relevanten Zeitreiheninformationen enthält.

Wenn zeitbezogenes Training aktiviert ist, verwendet AutoML spezielle Kreuzvalidierungs- und Null-Imputationsverfahren, um die Modelle zu trainieren.

Weitere Informationen finden Sie unter Erstellen von zeitbezogenen Modellen und Zeitbasierte Kreuzvalidierung.

Gehen Sie folgendermaßen vor:

Klicken Sie auf Konfiguration anzeigen.
Falls Sie bereits mindestens eine Version des Experiments ausgeführt haben, klicken Sie auf Neue Version.
Erweitern Sie im Fensterbereich die Option Modelloptimierung.
Wählen Sie unter Zeitbasierter Test-Train-Split den Datumsindex aus, der für die Sortierung der Daten verwendet werden soll.

AutoML-Trainingsanpassungsfenster mit ausgewählter Datumsspalte, um zeitbezogenes Training zu aktivieren — Konfigurieren Sie das zeitbezogene Training, indem Sie in den Trainingsdaten eine Spalte auswählen, die als Index verwendet werden soll.

Anzeigen von Einblicken in die Trainingsdaten

Sie können auf der Registerkarte Daten des Experiments Einblicke in die Verarbeitung der Trainingsdaten anzeigen. Diese Informationen stehen in der Spalte Einblicke in der Tabellenzeilen Schemaansicht zur Verfügung. Diese gezeigten Informationen hängen davon ab, ob Sie eine Version mit den aktuellen Trainingsdaten ausgeführt haben oder nicht. Die Änderungen in der Spalte Einblicke können dabei helfen zu ermitteln, warum Features möglicherweise nicht zur Nutzung zur Verfügung stehen oder warum sie automatisch weggelassen wurden.

Weitere Informationen zur Bedeutung der einzelnen Einblicke finden Sie unter Interpretation von Datensatzeinblicken.

VERWANDTE LERNINHALTE:

Weitere Informationen

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!

Geben Sie hier Ihr Feedback ab