Anzeigen von Einblicken in Ihre Trainingsdaten

In dem Maße, wie Sie Ihre Trainingsdaten hinzufügen und Versionen des Trainings ausführen, können Sie Einblicke erhalten, wie Ihre Daten verarbeitet werden. Die Einblicke geben Informationen zum Ziel und zu Features in Ihrem Experiment, wie beispielsweise Features, die entfernt wurden, nicht zur Verfügung stehen oder mit spezieller Verarbeitung codiert werden.

Die Spalte Einblicke befindet sich in Schema Schemaansicht, wenn Sie die Registerkarte Konfiguration/Trainingsdaten anzeigen. Abgekürzte Einblicke stehen ebenfalls in der Tabelle Datenansicht zur Verfügung. Einblicke werden individuell für jedes Modell erstellt, das innerhalb des Experiments trainiert wird.

Angezeigte Einblicke zu jeder Feature-Spalte im Trainingsdatensatz — Spalte Einblicke in der Schemaansicht

Einblicke werden erzeugt:

Nachdem Sie Trainingsdaten hinzugefügt oder geändert, aber noch keine Experimentversionen ausgeführt haben.
Nachdem jede Experimentversion ausgeführt wurde. Ein separater Satz Einblicke wird für jedes trainierte Modell erstellt.

Die Einblicke sind vor und nach der Ausführung einer Version möglicherweise unterschiedlich. Dies liegt daran, dass Qlik Predict im Verlauf des Trainings Ihre Daten vorverarbeiten und Probleme mit den Daten weiter diagnostizieren kann. Weitere Informationen finden Sie unter Automatische Datenvorbereitung und -umwandlung.

Ansicht von Einblicken vor dem Training

Bevor Sie eine Version des Experiments ausführen, können Sie die Einblicke analysieren, um zu sehen, wie die aktuellen Trainingsdaten interpretiert werden. Diese Einblicke könnten sich nach der Ausführung der Version ändern.

Gehen Sie folgendermaßen vor:

Stellen Sie in einem Experiment sicher, dass Sie die Trainingsdaten, die Sie für die Experimentversion verwenden möchten, hinzugefügt haben.
Öffnen Sie die Registerkarte Konfiguration/Trainingsdaten.
Stellen Sie sicher, dass Sie sich in der Ansicht Schemaansicht befinden.
Analysieren Sie die Spalte Einblicke. Quickinfos bieten zusätzlichen Kontext hinter den Einblicken. Weitere Erklärungen zur Bedeutung der einzelnen Einblicke finden Sie unter Interpretation von Datensatzeinblicken.

Ansicht der Einblicke für ein Modell

Nachdem die Modelle mit dem Training für eine Experimentversion fertig sind, wählen Sie ein Modell aus und überprüfen Sie, wie die Daten verarbeitet wurden.

Gehen Sie folgendermaßen vor:

Führen Sie eine Experimentversion aus und öffnen Sie dann die Registerkarte Konfiguration/Trainingsdaten.
Wählen Sie aus der Dropdown-Liste in der Symbolleiste ein Modell aus.
Stellen Sie sicher, dass Sie sich in der Ansicht Schemaansicht befinden.
Analysieren Sie die Spalte Einblicke. Quickinfos bieten zusätzlichen Kontext hinter den Einblicken. Weitere Erklärungen zur Bedeutung der einzelnen Einblicke finden Sie unter Interpretation von Datensatzeinblicken.

Interpretation von Datensatzeinblicken

Die folgende Tabelle enthält mehr Einzelheiten zu den möglichen Einblicken, die im Schema angezeigt werden können.

Allgemeine Einblicke

Datensatzeinblicke — Allgemein
Einblick	Bedeutung	Auswirkung bei Konfiguration	Zeitpunkt der Festlegung des Einblicks	Zusätzliche Verweise
Konstante	Die Spalte hat für alle Zeilen den gleichen Wert.	Die Spalte kann nicht als Ziel oder eingeschlossenes Feature verwendet werden.	Vor und nach der Ausführung der Version	Kardinalität
One-hot Encoded	Der Feature-Typ ist kategorial und die Spalte enthält weniger als 14 eindeutige Werte.	Keine Auswirkung auf die Konfiguration.	Vor und nach der Ausführung der Version	Kategoriale Codierung
Impact Encoded	Der Feature-Typ ist kategorial und die Spalte enthält 14 oder mehr eindeutige Werte.	Keine Auswirkung auf die Konfiguration.	Vor und nach der Ausführung der Version	Kategoriale Codierung
Hohe Kardinalität	Die Spalte enthält zu viele eindeutige Werte, was sich negativ auf die Modellleistung auswirken kann, wenn sie als Feature verwendet wird.	Die Spalte kann nicht als Ziel verwendet werden. Sie wird als Feature automatisch ausgeschlossen, kann aber bei Bedarf eingeschlossen werden.	Vor und nach der Ausführung der Version	Kardinalität
Spärliche Daten	Die Spalte enthält zu viele Nullwerte.	Die Spalte kann nicht als Ziel oder eingeschlossenes Feature verwendet werden.	Vor und nach der Ausführung der Version	Imputation von Nullwerten
Unterrepräsentierte Klasse	Die Spalte enthält eine Klasse mit weniger als 10 Zeilen.	Die Spalte kann nicht als Ziel verwendet, aber als Feature eingeschlossen werden.	Vor und nach der Ausführung der Version	-
Feature-Umwandlung fehlgeschlagen	Der Feature-Typ eines Features wurde manuell von seinem Standardtyp geändert. Bei dieser Konfiguration ist ein Fehler aufgetreten.	Die Experimentversion kann mit dieser Feature-Umwandlung nicht erfolgreich ausgeführt werden. Setzen Sie den Feature-Typ des Features auf seinen früheren Wert zurück, oder schließen Sie das Feature vom Training aus.	Nach der Ausführung der Version	Ändern der Feature-Typen

Einblicke in die automatische technische Planung von Features

Datensatzeinblicke – Automatische technische Planung von Features
Einblick	Bedeutung	Auswirkung bei Konfiguration	Zeitpunkt der Festlegung des Einblicks	Zusätzliche Verweise
<Anzahl der> automatisch erstellten Features	Die Spalte ist das übergeordnete Feature, das zur Erzeugung von automatisch erstellten Features verwendet werden kann.	Wenn dieses übergeordnete Feature als Datums-Feature gedeutet wird, wird es automatisch aus der Konfiguration entfernt. Es wird empfohlen, stattdessen die automatisch erstellten Datums-Features zu verwende, die daraus erzeugt werden können. Es ist möglich, diese Einstellung zu überschreiben und das Feature statt der automatisch erstellten Features einzubeziehen.	Vor und nach der Ausführung der Version	Automatische technische Planung von Features
Automatisch erstelltes Feature	Die Spalte ist ein automatisch erstellte Feature, das aus einem übergeordneten Datums-Feature erzeugt werden kann oder erzeugt wurde. Es ist im ursprünglichen Datensatz nicht aufgetreten.	Sie können eine oder mehrere dieser automatisch erstellten Features während des Experimenttrainings entfernen. Wenn Sie den Feature-Typ des übergeordneten Features in kategorial ändern, werden alle automatisch erstellten Features entfernt.	Vor und nach der Ausführung der Version	Automatische technische Planung von Features
Konnte nicht als Datum verarbeitet werden	Die Spalte enthält möglicherweise Datums- und Uhrzeitinformationen, konnte jedoch nicht für die Erzeugung automatisch erstellter Datums-Features genutzt werden.	Das Feature wird aus der Konfiguration genommen. Falls automatisch erstellte Features vorher aus diesem übergeordneten Feature erzeugt wurde, werden sie aus zukünftigen Experimentversionen entfernt. Sie können das Feature nach wie vor im Experiment verwenden, allerdings müssen Sie den entsprechenden Feature-Typ in kategorial ändern.	Nach der Ausführung der Version	Automatische technische Planung von Features
Möglicher Freitext	Die Spalte könnte zur Verwendung als Freitext-Feature verfügbar sein.	Der Freitext-Feature-Typ wird der Spalte zugewiesen. Sie müssen eine Experimentversion ausführen, um zu bestätigen, ob das Feature als Freitext verarbeitet werden kann.	Vor der Ausführung der Version	Automatische technische Planung von Features
Freitext	Es wurde bestätigt, dass die Spalte Freitext enthält. Sie kann als Freitext verarbeitet werden.	Für das Feature ist keine weitere Konfiguration erforderlich.	Nach der Ausführung der Version	Automatische technische Planung von Features
Konnte nicht als Freitext verarbeitet werden	Bei weiterer Analyse hat sich herausgestellt, dass die Spalte nicht als Freitext verarbeitet werden kann.	Sie müssen das Feature für die nächste Experimentversion in der Konfiguration abwählen. Wenn das Feature keine hohe Kardinalität hat, können Sie alternativ den Feature-Typ zu „Kategorial“ ändern.	Nach der Ausführung der Version	Automatische technische Planung von Features

Einblicke in die intelligente Modelloptimierung

Datensatzeinblicke – Intelligente Modelloptimierung
Einblick	Bedeutung	Auswirkung bei Konfiguration	Zeitpunkt der Festlegung des Einblicks	Zusätzliche Verweise
Zielleck	Es wird vermutet, dass das Feature von Ziellecks beeinträchtigt wird. In diesem Fall enthält sie Informationen zur Zielspalte, die Sie versuchen vorherzusagen. Features mit Zielleck können Ihnen ein falsches Gefühl der Gewissheit über die Modellleistung vermitteln. In realen Vorhersagen performt das Modell dadurch sehr schlecht.	Das Feature wurde nicht zum Trainieren des Modells herangezogen.	Nach der Ausführung der Version	Datenleck
Niedrige Permutation Importance	Das Feature hat, wenn überhaupt, wenig Einfluss auf die Modellvorhersagen. Durch das Entfernen dieser Features wird die Modellleistung durch Verringerung von statistischem Rauschen verbessert.	Das Feature wurde nicht zum Trainieren des Modells herangezogen.	Nach der Ausführung der Version	Verständnis der Permutation Importance
Hochgradig korreliert	Das Feature steht in enger Beziehung zu einer oder mehreren anderen Features im Experiment. Features, die in enger Beziehung zueinander stehen, setzen die Modellleistung herab.	Das Feature wurde nicht zum Trainieren des Modells herangezogen. Das Feature, mit dem es in enger Beziehung steht, wurde wegen der hohen Korrelation nicht weggelassen, könnte jedoch aus einem anderen Grund entfernt worden sein, beispielsweise wegen geringer Permutation Importance.	Nach der Ausführung der Version	Korrelation

Einblicke in Zeitreihenprognosen

Datensatzeinblicke – Zeitreihenprognosen
Einblick	Bedeutung	Auswirkung bei Konfiguration	Zeitpunkt der Festlegung des Einblicks	Zusätzliche Verweise
Möglicher Datumsindex	Das Feature kann möglicherweise als Datumsindex für das Zeitreihenexperiment verwendet werden.	Wenn Daten in der Spalte als Zeitreihen-Datumsindex verwendet werden, können sie Aspekte der Zeitreihenkonfiguration beeinflussen, z. B. wie weit in die Zukunft Sie prognostizieren können. Werte im Datumsindex müssen mit jeder Zeile oder jedem eindeutigen Gruppenwert in einem festen Zeitintervall ansteigen.	Vor der Ausführung der Version	Arbeiten mit Zeitreihenexperimenten Datumsindex

Einblicke in die Verzerrungserkennung

Datensatzeinblicke – Verzerrungserkennung
Einblick	Bedeutung	Auswirkung bei Konfiguration	Zeitpunkt der Festlegung des Einblicks	Zusätzliche Verweise
Datenverzerrung erkannt	Hinsichtlich der Werte in der Zielspalte sind einige Gruppen (Werte) im Vergleich zu anderen unterrepräsentiert.	Analysieren Sie die Ergebnisse der Verzerrungserkennung, um die nächsten Schritte zu bestimmen – dazu gehören das Entfernen des Features, das Ändern des Datensatzes oder das Erstellen eines neuen Experiments mit einem überarbeiteten Framework.	Nach der Ausführung der Version	Verzerrungserkennung in Modellen für maschinelles Lernen
Repräsentationsverzerrung erkannt	Es wurde eine Verzerrung in der Art und Weise festgestellt, wie das trainierte Modell die Daten aus dem Feature zur Erstellung von Vorhersagen verwendet.	Analysieren Sie die Ergebnisse der Verzerrungserkennung, um die nächsten Schritte zu bestimmen – dazu gehören das Entfernen des Features, das Ändern des Datensatzes oder das Erstellen eines neuen Experiments mit einem überarbeiteten Framework.	Nach der Ausführung der Version	Verzerrungserkennung in Modellen für maschinelles Lernen

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!

Geben Sie hier Ihr Feedback ab