Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Konfigurieren von Experimenten

Die Konfiguration von Experimenten besteht in der Auswahl des Ziels und der Features, die das Modell zum Vorhersagen des Ziels verwenden wird. Daneben können Sie eine Reihe optionaler Einstellungen konfigurieren.

Um Sie bei der Auswahl eines Ziels zu unterstützen, wird der Verlaufsdatensatz analysiert, und die zusammengefasste Statistik wird für jede Spalte im Datensatz angezeigt. Es werden mehrere automatische Vorverarbeitungsschritte auf den Datensatz angewendet, um zu gewährleisten, dass nur geeignete Daten eingeschlossen werden. Weitere Einzelheiten zur Datenvorverarbeitung finden Sie unter Automatische Datenvorbereitung und -umwandlung.

Nach dem Ausführen von v1 können Sie bei Bedarf neue Experimentversionen erstellen, um das Modelltraining weiter zu verfeinern. Weitere Informationen finden Sie unter Verfeinern von Modellen.

Anforderungen und Berechtigungen

Weitere Informationen über die Benutzeranforderungen für die Arbeit mit ML-Experimenten finden Sie unter Arbeiten mit Experimenten.

Die Benutzeroberfläche

Die folgenden Abschnitte geben Auskunft darüber, wie Sie sich durch die Experiment-Benutzeroberfläche bewegen, um Ihr Experiment zu konfigurieren. Weitere Informationen zur Benutzeroberfläche finden Sie unter Navigieren auf der Experiment-Benutzeroberfläche.

Registernavigation

Wenn Sie ein Experiment erstellen, wird die Registerkarte Daten geöffnet. Hier können Sie das Ziel und Features für das Experiment konfigurieren.

Nach dem Ausführen mindestens einer Experimentversion werden weitere Registerkarten verfügbar. Diese weiteren Registerkarten ermöglichen es Ihnen, die Modelle, die Sie gerade in der Version trainiert haben, zu analysieren. Falls Sie nachfolgende Versionen mit unterschiedlichen Featureauswahlen konfigurieren müssen, können Sie zur Registerkarte Daten zurückkehren.

Schemaansicht und Datenansicht

Auf der Registerkarte Daten können Sie zwischen den folgenden Ansichten hin- und herwechseln:

  • Schema Schemaansicht: Die Standardansicht. In dieser Ansicht wird jede Spalte in Ihrem Datensatz durch eine Zeile im Schema mit Informationen und Statistiken dargestellt.

  • Tabelle Datenansicht: Eine alternative Ansicht, die Sie für den Zugriff auf mehr Informationen und Beispieldaten für jede Spalte verwenden können.

Schemaansicht in einem ML-Experiment

Schemaansicht in einem ML-Experiment

Datenansicht in einem ML-Experiment

Datenansicht in einem ML-Experiment

Fenster Experimentkonfiguration

Klicken Sie auf Schema Konfiguration anzeigen, um einen Fensterbereich anzuzeigen, in dem Sie das Experimenttraining weiter anpassen können. Der Fensterbereich kann unabhängig davon, welche Registerkarte Sie gerade ansehen, geöffnet werden. Dieser Fensterbereich enthält eine Reihe zusätzlicher Konfigurationsoptionen.

Mit dem Fensterbereich zur Experimentkonfiguration können Sie Folgendes tun:

  • Ziel auswählen, bevor die erste Version trainiert wird

  • Features hinzufügen oder entfernen

  • Eine neue Version des Experiments konfigurieren

  • Auswählen, um den Trainingsdatensatz zu ändern oder zu aktualisieren

  • Algorithmen hinzufügen oder entfernen

  • Modelloptimierungseinstellungen ändern

Fenster Experimentkonfiguration

Erweitertes Anpassungsfenster in einem ML-Experiment

Auswählen eines Ziels

Die Zielspalte enthält die Werte, die vom Modell für maschinelles Lernen vorhergesagt werden sollen. Sie können die Zielspalte bis zum Start des ersten Trainings ändern. Danach ist sie für Änderungen gesperrt.

  1. Bewegen Sie in der Schema Schemaansicht oder der Tabelle Datenansicht den Mauszeiger über die Spalte.

  2. Klicken Sie auf das angezeigte Symbol Ziel.

    Die Zielspalte wird jetzt durch Ziel gekennzeichnet, und die anderen verfügbaren Spalten werden automatisch als Features ausgewählt.

Auswahl des Ziels in der Schemaansicht

Datensatzspalte mit Zielsymbol.

Das Ziel kann alternativ im Fensterbereich der Trainingskonfiguration ausgewählt werden.

Nachdem das Ziel ausgewählt wurde, können Sie mit der Ausführung der ersten Version des Experiments beginnen. Weitere Informationen finden Sie in Trainieren von Experimenten. An dieser Stelle können Sie wie unten beschrieben weitere Konfigurationen vornehmen, oder Sie können die Konfiguration anpassen, nachdem Sie die Trainingsergebnisse geprüft haben.

Erläuterungen dazu, wie Ihre Daten interpretiert und verarbeitet werden, finden Sie im Verlauf des Experimenttrainings. Weitere Informationen finden Sie unter Interpretation von Datensatzeinblicken.

Bestimmen des Typs des erstellten Modells

Die Spalte, die Sie als Ziel auswählen, bestimmt den Typ des Modells, das von Ihrem Experiment erstellt wird. Das spielt wiederum eine Rolle bei der Bestimmung, welche Algorithmen zum Trainieren des Modells verwendet werden. Bestimmte Spalten in Ihrem Datensatz können möglicherweise nicht als Ziel für Ihr Experiment ausgewählt werden, oder es wurde eine bestimmte Verarbeitung darauf angewendet.

Die Modelltypen sind:

  • Binärklassifikationsmodell

  • Mehrklassen-Klassifikationsmodell

  • Regressionsmodell

In der Tabelle unten sind die Faktoren im Ziel zusammengefasst, die den Typ des verwendeten Modells bestimmen.

Merkmale der Zielspalte, die den Modelltyp bestimmen
ModelltypAnzahl distinkter Werte in SpalteErforderlicher Feature-TypZusätzliche Informationen
Binäre Klassifizierung2Beliebig-
Mehrklassen-Klassifizierung3-10BeliebigEine Spalte mit mehr als 10 distinkten, nichtnumerischen Klassen kann als Ziel nicht ausgewählt werden.
RegressionMehr als 10Numerisch-

Um zu erfahren, welchen Modelltyp Ihr Experiment trainiert, klicken Sie auf Schema Konfiguration anzeigen und erweitern Sie Algorithmen. Der Modelltyp ist aus dem Titel des Abschnitt ersichtlich.

Auswählen von Featurespalten

Nachdem das Ziel festgelegt ist, können Sie wählen, welche der anderen verfügbaren Spalten in das Training des Modells eingeschlossen werden. Schließen Sie alle Features aus, die nicht Teil des Modells sein sollen. Beachten Sie, dass die Spalte im Datensatz bestehen bleibt, aber vom Trainingsalgorithmus nicht verwendet wird.

Oben im Fensterbereich der Experimentkonfiguration sehen Sie die Anzahl der Zellen in Ihrem Datensatz. Wenn die Zahl das Limit Ihres Datensatzes überschreibt, können Sie Features ausschließen, um unter das Limit zu gelangen.

Sie können die Featurespalten auf verschiedene Weisen auswählen:

In der Schemaansicht und Datenansicht

In den Hauptansichten können Sie Folgendes tun:

  • Die Auswahl Alle verfügbaren Features einschließen aufheben und dann nur diejenigen auswählen, die Sie einschließen möchten.

  • Die Kontrollkästchen für die Features, die Sie nicht einschließen möchten, manuell deaktivieren.

  • Eine Suche durchführen und alle Features in Ihrem gefilterten Suchergebnis aus- oder einschließen.

Im Trainingsanpassungsfenster

Falls Sie den Fensterbereich zur Experimentkonfiguration erweitern, können Sie Folgendes tun:

  • Die Kontrollkästchen für die Features, die Sie nicht einschließen möchten, manuell deaktivieren.

  • Nachdem Sie die erste Version des Experiments ausgeführt haben, können Sie die Anzahl der obersten einzuschließenden Features definieren.

Abschnitt Features im Fensterbereich zur Experimentkonfiguration

Abschnitt „Features“ im Trainingsanpassungsfenster von AutoML

Wenn Sie Features auswählen, wird diesen automatisch ein Feature-Typ zugewiesen. Die möglichen Feature-Typen sind:

  • Kategorial

  • Numerisch

  • Datum

  • Freitext

Der Feature-Typ wird basierend auf den in der Feature-Spalte enthaltenen Daten zugewiesen. Wenn ein Feature bestimmte Kriterien erfüllt, kann es bereitgestellt werden, um als Grundlage für automatisch erstellte Features zu dienen. Bei Bedarf können Sie ändern, ob das Feature für automatische Feature-Erstellung verwendet wird. Genaue Einzelheiten zur automatischen technischen Planung von Features („Feature Engineering“) finden Sie unter Automatische technische Planung von Features.

Bestimmte Spalten in Ihrem Datensatz können möglicherweise nicht als Features für Ihr Experiment ausgewählt werden, oder es wurde eine bestimmte Verarbeitung darauf angewandt. Erläuterungen dazu, wie Ihre Daten interpretiert und verarbeitet werden, finden Sie im Verlauf des Experimenttrainings. Weitere Informationen finden Sie unter Interpretation von Datensatzeinblicken.

Auswählen von Algorithmen

Standardmäßig werden alle verfügbaren Algorithmen eingeschlossen. Sie können beliebige Algorithmen ausschließen, die Sie nicht verwenden möchten. In der Regel tun Sie dies im Rahmen der Modellverfeinerung, nachdem Sie die ersten Trainingsergebnisse erhalten haben. Weitere Informationen finden Sie in Verfeinern von Modellen.

Abschnitt Algorithmen im Fensterbereich zur Experimentkonfiguration

Abschnitt „Algorithmen“ im Trainingsanpassungsfenster von AutoML

Ändern der Feature-Typen

Wenn ein Datensatz geladen wird, werden die Spalten abhängig vom Datentyp und anderen Merkmalen als kategorial, numerisch, Datum oder Freitext behandelt. In einigen Fällen ist es ratsam, diese Einstellung zu ändern.

Beispiel: Wenn die Tage der Woche durch die Zahlen 1-7 dargestellt werden, steht jede Zahl für einen kategorialen Wert. Standardmäßig wird sie als numerischer Wert mit fortlaufendem Rang behandelt. Sie müssten also die Konfiguration manuell ändern, damit sie als kategorial behandelt wird.

Wenn eine Spalte dahingehend identifiziert wird, dass sie Datums- und Uhrzeitinformationen enthält, wird sie als Grundlage für neu erzeugte, automatisch erstellte Features genutzt. Wenn dies geschieht, wird die ursprüngliche Spalte (das übergeordnete Feature) so behandelt, als hätte sie den Feature-Typ „Datum“. Sie können das übergeordnete Feature von Feature-Typ „Datum“ in einen Feature-Typ „Kategorial“ ändern. Wenn Sie dies tun, können Sie jedoch die automatisch erstellten Features im Experimenttraining nicht mehr verwenden.

  1. Suchen Sie in der Schema Schemaansicht nach dem Feature.

  2. Klicken Sie in der Spalte Featuretyp für dieses Feature auf .

  3. Wählen Sie einen Wert in der Liste aus.

Sie können alternativ Featuretypen über die Tabelle Datenansicht ändern. Suchen Sie das Feature und klicken Sie dann neben dem aktuellen Featuretyp auf . Wählen Sie einen Wert in der Liste aus.

Sie können alle Spalten mit einem geänderten Featuretyp im Fensterbereich zur Experimentkonfiguration unter Datenbehandlung anzeigen.

Ändern des Datensatzes

Sie können den Trainingsdatensatz vor Ausführen der ersten Experimentversion und nach Ausführen jeder weiteren Version ändern.

Wenn Sie den Datensatz vor dem Ausführen der ersten Version ändern, geht jede vor dem Ändern des Datensatzes vorgenommene Konfiguration verloren.

  1. Klicken Sie im Fensterbereich zur Experimentkonfiguration unter Trainingsdaten auf Datensatz ändern.

  2. Wählen Sie einen neuen Datensatz aus.

Weitere Informationen zum Ändern und Aktualisieren des Datensatzes während der Modellverfeinerung (nach dem Ausführen einer Experimentversion) finden Sie unter Ändern oder Aktualisieren des Datensatzes.

Konfigurieren der Modelloptimierung

Die folgenden Einstellungen können zur Optimierung Ihrer Modelle angepasst werden:

  • Aktivierung oder Deaktivierung der intelligenten Modelloptimierung

  • Aktivieren oder Deaktivieren der Hyperparameteroptimierung

  • Aktivieren oder Deaktivieren des zeitbezogenen Trainings

Diese Optionen können für jede Version des Experiments, das Sie ausführen, aktiviert bzw. deaktiviert werden.

Konfiguration der intelligenten Optimierung

Das Experiment verwendet standardmäßig die intelligente Modelloptimierung. Mit der intelligenten Modelloptimierung übernimmt AutoML den Prozess der Modellverfeinerung für Sie, indem es die Featureauswahl iteriert und erweiterte Umwandlungen auf Ihre Daten anwendet.

Weitere Informationen zur intelligenten Optimierung finden Sie unter Intelligente Modelloptimierung.

Sie können diese Einstellung deaktivieren, um die Modelle, die Sie trainieren, manuell zu verfeinern. Beispielsweise möchten Sie möglicherweise Ihr Modelltraining mit der intelligenten Modelloptimierung beginnen und dann für die Version 2 zur manuellen Verfeinerung wechseln, um die Konfiguration weiter anzupassen.

  1. Klicken Sie auf Schema Konfiguration anzeigen.

  2. Falls Sie bereits mindestens eine Version des Experiments ausgeführt haben, klicken Sie auf Neue Version.

  3. Erweitern Sie im Fensterbereich die Option Modelloptimierung.

  4. Wechseln Sie von Intelligent zu Manuell.

  5. Legen Sie mit dem Schieberegler die maximale Ausführungsdauer für das Training fest.

Konfigurieren der Modelloptimierung

Aktivieren der intelligenten Modelloptimierung unter „Modelloptimierung“ im Trainings-Anpassungsbereich von AutoML

Konfigurieren der Hyperparameteroptimierung

Sie können die Modelle anhand von Hyperparameteroptimierung optimieren. Beachten Sie, dass dies eine erweiterte Option ist, durch die sich die Trainingszeit erheblich verlängern kann. Die Hyperparameteroptimierung ist verfügbar, wenn Sie die intelligente Optimierung deaktivieren.

Weitere Informationen finden Sie unter Hyperparameteroptimierung.

  1. Klicken Sie auf Schema Konfiguration anzeigen.

  2. Falls Sie bereits mindestens eine Version des Experiments ausgeführt haben, klicken Sie auf Neue Version.

  3. Erweitern Sie im Fensterbereich die Option Modelloptimierung.

  4. Wechseln Sie von Intelligent zu Manuell.

  5. Aktivieren Sie das Kontrollkästchen Hyperparameteroptimierung.

  6. Legen Sie optional ein Zeitlimit für Ihre Optimierung fest. Das Standardzeitlimit ist eine Stunde.

Konfigurieren der Hyperparameteroptimierung

Trainingsanpassungsfenster von AutoML mit aktivierter Hyperparameteroptimierung

Konfigurieren des zeitbezogenen Trainings

Wenn Sie möchten, dass Ihre Modelle unter Berücksichtigung einer Zeitreihendimension trainiert werden, aktivieren Sie das zeitbezogene Training für die Experimentversion. Um diese Option zu verwenden, benötigen Sie in Ihrem Datensatz eine Spalte, die die relevanten Zeitreiheninformationen enthält.

Wenn zeitbezogenes Training aktiviert ist, verwendet AutoML spezielle Kreuzvalidierungs- und Null-Imputationsverfahren, um die Modelle zu trainieren.

Weitere Informationen finden Sie unter Erstellen von zeitbezogenen Modellen und Zeitbasierte Kreuzvalidierung.

  1. Klicken Sie auf Schema Konfiguration anzeigen.

  2. Falls Sie bereits mindestens eine Version des Experiments ausgeführt haben, klicken Sie auf Neue Version.

  3. Erweitern Sie im Fensterbereich die Option Modelloptimierung.

  4. Wählen Sie unter Zeitbasierter Test-Train-Split den Datumsindex aus, der für die Sortierung der Daten verwendet werden soll.

Konfigurieren Sie das zeitbezogene Training, indem Sie in den Trainingsdaten eine Spalte auswählen, die als Index verwendet werden soll.

AutoML-Trainingsanpassungsfenster mit ausgewählter Datumsspalte, um zeitbezogenes Training zu aktivieren

Anzeigen von Einblicken in die Trainingsdaten

Sie können auf der Registerkarte Daten des Experiments Einblicke in die Verarbeitung der Trainingsdaten anzeigen. Diese Informationen stehen in der Spalte Einblicke in der Tabellenzeilen Schemaansicht zur Verfügung. Diese gezeigten Informationen hängen davon ab, ob Sie eine Version mit den aktuellen Trainingsdaten ausgeführt haben oder nicht. Die Änderungen in der Spalte Einblicke können dabei helfen zu ermitteln, warum Features möglicherweise nicht zur Nutzung zur Verfügung stehen oder warum sie automatisch weggelassen wurden.

Weitere Informationen zur Bedeutung der einzelnen Einblicke finden Sie unter Interpretation von Datensatzeinblicken.

Weitere Informationen

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!