Anzeigen von Einblicken in Ihre Trainingsdaten
In dem Maße, wie Sie Ihre Trainingsdaten hinzufügen und Versionen des Trainings ausführen, können Sie Einblicke erhalten, wie Ihre Daten verarbeitet werden. Die Einblicke geben Informationen zum Ziel und zu Funktionen in Ihrem Experiment, wie beispielsweise Funktionen, die entfernt wurden, nicht zur Verfügung stehen oder mit spezieller Verarbeitung codiert werden.
Die Spalte Einblicke finden Sie auf der Registerkarte Daten, wenn Sie sich in der -Schemaansicht befinden. Abgekürzte Einblicke stehen ebenfalls in der Datenansicht zur Verfügung. Einblicke werden individuell für jedes Modell erstellt, das innerhalb des Experiments trainiert wird.
Einblicke werden erzeugt:
-
Nachdem Sie Trainingsdaten hinzugefügt oder geändert, aber noch keine Experimentversionen ausgeführt haben.
-
Nachdem jede Eexperimentversion ausgeführt wurde. Ein separater Satz Einblicke wird für jedes trainierte Modell erstellt.
Die Einblicke sind vor und nach der Ausführung einer Version möglicherweise unterschiedlich. Dies liegt daran, dass AutoML im Verlauf des Trainings Ihre Daten vorverarbeiten und Probleme mit den Daten weiterdiagnostizieren kann. Weitere Informationen finden Sie unter Automatische Datenvorbereitung und -umwandlung.
Ansicht von Einblicken vor dem Training
Bevor Sie eine Version des Experiments ausführen, können Sie die Einblicke analysieren, um zu sehen, wie die aktuellen Trainingsdaten interpretiert werden. Diese Einblicke könnten sich nach der Ausführung der Version ändern.
Gehen Sie folgendermaßen vor:
Stellen Sie in einem Experiment sicher, dass Sie die Trainingsdaten, die Sie für die Experimentversion verwenden möchten, hinzugefügt haben.
Öffnen Sie die Registerkarte Daten.
Stellen Sie sicher, dass Sie sich in der Ansicht Schemaansicht befinden.
Analysieren Sie die Spalte Einblicke. Quickinfos bieten zusätzlichen Kontext hinter den Einblicken. Weitere Erklärungen zur Bedeutung der einzelnen Einblicke finden Sie unter Interpretation von Datensatzeinblicken.
Ansicht der Einblicke für ein Modell
Nachdem die Modelle mit dem Training für eine Experimentversion fertig sind, wählen Sie ein Modell aus und überprüfen Sie, wie die Daten verarbeitet wurden.
Gehen Sie folgendermaßen vor:
Führen Sie eine Experimentversion aus und öffnen Sie dann die Registerkarte Daten.
Wählen Sie aus der Dropdown-Liste in der Symbolleiste ein Modell aus.
Stellen Sie sicher, dass Sie sich in der Ansicht Schemaansicht befinden.
Analysieren Sie die Spalte Einblicke. Quickinfos bieten zusätzlichen Kontext hinter den Einblicken. Weitere Erklärungen zur Bedeutung der einzelnen Einblicke finden Sie unter Interpretation von Datensatzeinblicken.
Interpretation von Datensatzeinblicken
Die folgende Tabelle gibt mehr Einzelheiten zu den möglichen Einblicke, die im Schema angezeigt werden können.
Einblick | Bedeutung | Auswirkung auf Konfiguration | Zeitpunkt der Festlegung des Einblicks | Zusätzliche Verweise |
---|---|---|---|---|
Konstante | Die Spalte hat für alle Zeilen den gleichen Wert. | Die Spalte kann nicht als Ziel oder eingeschlossenes Feature verwendet werden. | Vor und nach der Ausführung der Version | Kardinalität |
One-hot Encoded | Der Featuretyp ist kategorial und die Spalte enthält weniger als 14 eindeutige Werte. | Keine Auswirkung auf die Konfiguration. | Vor und nach der Ausführung der Version | Kategoriale Codierung |
Impact Encoded | Der Featuretyp ist kategorial und die Spalte enthält 14 oder mehr eindeutige Werte. | Keine Auswirkung auf die Konfiguration. | Vor und nach der Ausführung der Version | Kategoriale Codierung |
Hohe Kardinalität | Die Spalte enthält zu viele eindeutige Werte, was sich negativ auf die Modellleistung auswirken kann, wenn sie als Feature verwendet wird. | Die Spalte kann nicht als Ziel verwendet werden. Sie wird als Feature automatisch ausgeschlossen, kann aber bei Bedarf eingeschlossen werden. | Vor und nach der Ausführung der Version | Kardinalität |
Spärliche Daten | Die Spalte enthält zu viele Nullwerte. | Die Spalte kann nicht als Ziel oder eingeschlossenes Feature verwendet werden. | Vor und nach der Ausführung der Version | Imputation von Nullwerten |
Unterrepräsentierte Klasse | Die Spalte enthält eine Klasse mit weniger als 10 Zeilen. | Die Spalte kann nicht als Ziel verwendet, aber als Feature eingeschlossen werden. | Vor und nach der Ausführung der Version | - |
<Anzahl der> automatisch erstellten Features | Die Spalte ist das übergeordnete Feature, das zur Erzeugung von automatisch erstellten Features verwendet werden kann. | Wenn dieses übergeordnete Feature als Datums-Feature gedeutet wird, wird es automatisch aus der Konfiguration entfernt. Es wird empfohlen, stattdessen die automatisch erstellten Datums-Features zu verwende, die daraus erzeugt werden können. Es ist möglich, diese Einstellung zu überschreiben und das Feature statt der automatisch erstellten Features einzubeziehen. | Vor und nach der Ausführung der Version | Automatische technische Planung von Features |
Automatisch erstelltes Feature | Die Spalte ist ein automatisch erstellte Feature, das aus einem übergeordneten Datums-Feature erzeugt werden kann oder erzeugt wurde. Es ist im ursprünglichen Datensatz nicht aufgetreten. | Sie können eine oder mehrere dieser automatisch erstellten Features während des Experimenttrainings entfernen. Wenn Sie den Featuretyp des übergeordneten Features in kategorial ändern, werden alle automatisch erstellten Features entfernt. | Vor und nach der Ausführung der Version | Automatische technische Planung von Features |
Konnte nicht als Datum verarbeitet werden | Die Spalte enthält möglicherweise Datums- und Uhrzeitinformationen, konnte jedoch nicht für die Erzeugung automatisch erstellter Datums-Features genutzt werden. | Das Feature wird aus der Konfiguration genommen. Falls automatisch erstellte Features vorher aus diesem übergeordneten Feature erzeugt wurde, werden sie aus zukünftigen Experimentversionen entfernt. Sie können das Feature nach wie vor im Experiment verwenden, allerdings müssen Sie den entsprechenden Featuretyp in kategorial ändern. | Nach der Ausführung der Version | Technische Planung des Datums-Features |
Möglicher Freitext | Die Spalte könnte zur Verwendung als Freitext-Feature verfügbar sein. | Der Freitext-Featuretyp wird der Spalte zugewiesen. Sie müssen eine Experimentversion ausführen, um zu bestätigen, ob das Feature als Freitext verarbeitet werden kann. | Vor der Ausführung der Version | Handhabung von Freitextdaten |
Freitext | Es wurde bestätigt, dass die Spalte Freitext enthält. Sie kann als Freitext verarbeitet werden. | Für das Feature ist keine weitere Konfiguration erforderlich. | Nach der Ausführung der Version | Handhabung von Freitextdaten |
Konnte nicht als Freitext verarbeitet werden | Bei weiterer Analyse hat sich herausgestellt, dass die Spalte nicht als Freitext verarbeitet werden kann. | Sie müssen das Feature für die nächste Experimentversion in der Konfiguration abwählen. Wenn das Feature keine hohe Kardinalität hat, können Sie alternativ den Feature-Typ zu „Kategorial“ ändern. | Nach der Ausführung der Version | Handhabung von Freitextdaten |
Zielleck | Es wird vermutet, dass die Funktion von Ziellecks beeinträchtigt wird. In diesem Fall enthält sie Informationen zur Zielspalte, die Sie versuchen vorherzusagen. Funktionen mit Zielleck können Ihnen ein falsches Gefühl der Gewissheit über die Modellleistung vermitteln. In realen Vorhersagen performt das Modell dadurch sehr schlecht. | Die Funktion wurde nicht zum Trainieren des Modells herangezogen. | Nach der Ausführung der Version | Datenleck |
Niedrige Permutation Importance | Die Funktion hat, wenn überhaupt, wenig Einfluss auf die Modellvorhersagen. Durch das Entfernen dieser Funktionen wird die Modellleistung durch Verringerung von statistischem Rauschen verbessert. | Die Funktion wurde nicht zum Trainieren des Modells herangezogen. | Nach der Ausführung der Version | Verständnis der Permutation Importance |
Hochgradig korreliert | Die Funktion steht in enger Beziehung zu einer oder mehreren anderen Funktionen im Experiment. Funktionen, die in enger Beziehung zueinander stehen, setzen die Modellleistung herab. | Die Funktion wurde nicht zum Trainieren des Modells herangezogen. Die Funktion, mit der sie in enger Beziehung steht, wurde wegen der hohen Korrelation nicht weggelassen, könnte jedoch aus einem anderen Grund entfernt worden sein, beispielsweise wegen geringer Permutation Importance. | Nach der Ausführung der Version | Korrelation |