Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Anzeigen von Einblicken in Ihre Trainingsdaten

In dem Maße, wie Sie Ihre Trainingsdaten hinzufügen und Versionen des Trainings ausführen, können Sie Einblicke erhalten, wie Ihre Daten verarbeitet werden. Die Einblicke geben Informationen zum Ziel und zu Funktionen in Ihrem Experiment, wie beispielsweise Funktionen, die entfernt wurden, nicht zur Verfügung stehen oder mit spezieller Verarbeitung codiert werden.

Die Spalte Einblicke finden Sie auf der Registerkarte Daten, wenn Sie sich in der Schema-Schemaansicht befinden. Abgekürzte Einblicke stehen ebenfalls in der Tabelle Datenansicht zur Verfügung. Einblicke werden individuell für jedes Modell erstellt, das innerhalb des Experiments trainiert wird.

Spalte Einblicke in der Schemaansicht

Angezeigte Einblicke zu jeder Funktionsspalte im Trainingsdatensatz

Einblicke werden erzeugt:

  • Nachdem Sie Trainingsdaten hinzugefügt oder geändert, aber noch keine Experimentversionen ausgeführt haben.

  • Nachdem jede Eexperimentversion ausgeführt wurde. Ein separater Satz Einblicke wird für jedes trainierte Modell erstellt.

Die Einblicke sind vor und nach der Ausführung einer Version möglicherweise unterschiedlich. Dies liegt daran, dass AutoML im Verlauf des Trainings Ihre Daten vorverarbeiten und Probleme mit den Daten weiterdiagnostizieren kann. Weitere Informationen finden Sie unter Automatische Datenvorbereitung und -umwandlung.

Ansicht von Einblicken vor dem Training

Bevor Sie eine Version des Experiments ausführen, können Sie die Einblicke analysieren, um zu sehen, wie die aktuellen Trainingsdaten interpretiert werden. Diese Einblicke könnten sich nach der Ausführung der Version ändern.

  1. Stellen Sie in einem Experiment sicher, dass Sie die Trainingsdaten, die Sie für die Experimentversion verwenden möchten, hinzugefügt haben.

  2. Öffnen Sie die Registerkarte Daten.

  3. Stellen Sie sicher, dass Sie sich in der Ansicht Tabellenzeilen Schemaansicht befinden.

  4. Analysieren Sie die Spalte Einblicke. Quickinfos bieten zusätzlichen Kontext hinter den Einblicken. Weitere Erklärungen zur Bedeutung der einzelnen Einblicke finden Sie unter Interpretation von Datensatzeinblicken.

Ansicht der Einblicke für ein Modell

Nachdem die Modelle mit dem Training für eine Experimentversion fertig sind, wählen Sie ein Modell aus und überprüfen Sie, wie die Daten verarbeitet wurden.

  1. Führen Sie eine Experimentversion aus und öffnen Sie dann die Registerkarte Daten.

  2. Wählen Sie aus der Dropdown-Liste in der Symbolleiste ein Modell aus.

  3. Stellen Sie sicher, dass Sie sich in der Ansicht Tabellenzeilen Schemaansicht befinden.

  4. Analysieren Sie die Spalte Einblicke. Quickinfos bieten zusätzlichen Kontext hinter den Einblicken. Weitere Erklärungen zur Bedeutung der einzelnen Einblicke finden Sie unter Interpretation von Datensatzeinblicken.

Interpretation von Datensatzeinblicken

Die folgende Tabelle gibt mehr Einzelheiten zu den möglichen Einblicke, die im Schema angezeigt werden können.

Datensatzeinblicke in der Schemaansicht
EinblickBedeutungAuswirkung auf KonfigurationZeitpunkt der Festlegung des EinblicksZusätzliche Verweise
KonstanteDie Spalte hat für alle Zeilen den gleichen Wert.Die Spalte kann nicht als Ziel oder eingeschlossenes Feature verwendet werden.Vor und nach der Ausführung der VersionKardinalität
One-hot EncodedDer Featuretyp ist kategorial und die Spalte enthält weniger als 14 eindeutige Werte.Keine Auswirkung auf die Konfiguration.Vor und nach der Ausführung der VersionKategoriale Codierung
Impact EncodedDer Featuretyp ist kategorial und die Spalte enthält 14 oder mehr eindeutige Werte.Keine Auswirkung auf die Konfiguration.Vor und nach der Ausführung der VersionKategoriale Codierung
Hohe KardinalitätDie Spalte enthält zu viele eindeutige Werte, was sich negativ auf die Modellleistung auswirken kann, wenn sie als Feature verwendet wird.Die Spalte kann nicht als Ziel verwendet werden. Sie wird als Feature automatisch ausgeschlossen, kann aber bei Bedarf eingeschlossen werden. Vor und nach der Ausführung der VersionKardinalität
Spärliche DatenDie Spalte enthält zu viele Nullwerte.Die Spalte kann nicht als Ziel oder eingeschlossenes Feature verwendet werden.Vor und nach der Ausführung der VersionImputation von Nullwerten
Unterrepräsentierte KlasseDie Spalte enthält eine Klasse mit weniger als 10 Zeilen.Die Spalte kann nicht als Ziel verwendet, aber als Feature eingeschlossen werden.Vor und nach der Ausführung der Version-
<Anzahl der> automatisch erstellten FeaturesDie Spalte ist das übergeordnete Feature, das zur Erzeugung von automatisch erstellten Features verwendet werden kann.Wenn dieses übergeordnete Feature als Datums-Feature gedeutet wird, wird es automatisch aus der Konfiguration entfernt. Es wird empfohlen, stattdessen die automatisch erstellten Datums-Features zu verwende, die daraus erzeugt werden können. Es ist möglich, diese Einstellung zu überschreiben und das Feature statt der automatisch erstellten Features einzubeziehen.Vor und nach der Ausführung der VersionAutomatische technische Planung von Features
Automatisch erstelltes FeatureDie Spalte ist ein automatisch erstellte Feature, das aus einem übergeordneten Datums-Feature erzeugt werden kann oder erzeugt wurde. Es ist im ursprünglichen Datensatz nicht aufgetreten.Sie können eine oder mehrere dieser automatisch erstellten Features während des Experimenttrainings entfernen. Wenn Sie den Featuretyp des übergeordneten Features in kategorial ändern, werden alle automatisch erstellten Features entfernt.Vor und nach der Ausführung der VersionAutomatische technische Planung von Features
Konnte nicht als Datum verarbeitet werdenDie Spalte enthält möglicherweise Datums- und Uhrzeitinformationen, konnte jedoch nicht für die Erzeugung automatisch erstellter Datums-Features genutzt werden.Das Feature wird aus der Konfiguration genommen. Falls automatisch erstellte Features vorher aus diesem übergeordneten Feature erzeugt wurde, werden sie aus zukünftigen Experimentversionen entfernt. Sie können das Feature nach wie vor im Experiment verwenden, allerdings müssen Sie den entsprechenden Featuretyp in kategorial ändern.Nach der Ausführung der VersionTechnische Planung des Datums-Features
Möglicher FreitextDie Spalte könnte zur Verwendung als Freitext-Feature verfügbar sein.Der Freitext-Featuretyp wird der Spalte zugewiesen. Sie müssen eine Experimentversion ausführen, um zu bestätigen, ob das Feature als Freitext verarbeitet werden kann.Vor der Ausführung der VersionHandhabung von Freitextdaten
FreitextEs wurde bestätigt, dass die Spalte Freitext enthält. Sie kann als Freitext verarbeitet werden.Für das Feature ist keine weitere Konfiguration erforderlich.Nach der Ausführung der VersionHandhabung von Freitextdaten
Konnte nicht als Freitext verarbeitet werdenBei weiterer Analyse hat sich herausgestellt, dass die Spalte nicht als Freitext verarbeitet werden kann.Sie müssen das Feature für die nächste Experimentversion in der Konfiguration abwählen. Wenn das Feature keine hohe Kardinalität hat, können Sie alternativ den Feature-Typ zu „Kategorial“ ändern.Nach der Ausführung der VersionHandhabung von Freitextdaten
ZielleckEs wird vermutet, dass die Funktion von Ziellecks beeinträchtigt wird. In diesem Fall enthält sie Informationen zur Zielspalte, die Sie versuchen vorherzusagen. Funktionen mit Zielleck können Ihnen ein falsches Gefühl der Gewissheit über die Modellleistung vermitteln. In realen Vorhersagen performt das Modell dadurch sehr schlecht.Die Funktion wurde nicht zum Trainieren des Modells herangezogen.Nach der Ausführung der VersionDatenleck
Niedrige Permutation ImportanceDie Funktion hat, wenn überhaupt, wenig Einfluss auf die Modellvorhersagen. Durch das Entfernen dieser Funktionen wird die Modellleistung durch Verringerung von statistischem Rauschen verbessert.Die Funktion wurde nicht zum Trainieren des Modells herangezogen.Nach der Ausführung der VersionVerständnis der Permutation Importance
Hochgradig korreliertDie Funktion steht in enger Beziehung zu einer oder mehreren anderen Funktionen im Experiment. Funktionen, die in enger Beziehung zueinander stehen, setzen die Modellleistung herab.Die Funktion wurde nicht zum Trainieren des Modells herangezogen. Die Funktion, mit der sie in enger Beziehung steht, wurde wegen der hohen Korrelation nicht weggelassen, könnte jedoch aus einem anderen Grund entfernt worden sein, beispielsweise wegen geringer Permutation Importance.Nach der Ausführung der VersionKorrelation

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!