Arbeiten mit Vorhersagen für Zeitreihenmodelle
Nachdem Sie ein Zeitreihenmodell bereitgestellt haben, können Sie es verwenden, um Vorhersagen für neue Daten zu erstellen. Um Zeitreihenvorhersagen zu erstellen, bereiten Sie einen Anwendungsdatensatz vor, der die erforderlichen Daten und die Struktur enthält. Alle Einzelheiten dazu finden Sie unter Vorbereiten eines Anwendungsdatensatzes.
Vorhersagemechanismus
Der Prozess für Zeitreihenmodellvorhersagen weist einige Unterschiede zu Klassifizierungs- und Regressionsmodellen auf.
Klassifizierungs- und Regressionsmodelle prognostizieren zukünftige Werte für eine gesamte Spalte, die im Anwendungsdatensatz nicht vorhanden oder unbekannt ist. Angenommen, Sie verfügen über ein binäres Klassifizierungsmodell, das zukünftige Werte einer Spalte vom Typ Abgewandert prognostiziert. Der Anwendungsdatensatz enthält in der Regel keine Spalte vom Typ Abgewandert. Sollte dennoch eine solche Spalte vorhanden sein, wird sie ignoriert. Stattdessen werden die Werte für diese Spalte vom Modell als Prognosen erzeugt.
Bei einem Zeitreihenmodell hingegen werden die Prognosen als Zeilen statt als Spalten erstellt. Die Prognosen werden weiterhin für eine Zielspalte erzeugt, stellen jedoch Datensätze dar, die bestimmten zukünftigen Zeitpunkten entsprechen. Die Struktur der Spalten ändert sich nicht zwischen den Trainings- und Anwendungsdatensätzen.
Außerdem sollte ein Anwendungsdatensatz für ein Klassifizierungs- oder Regressionsmodell keinen Zielwert enthalten, für den Prognosen erstellt werden sollen. Andererseits muss der Anwendungsdatensatz für ein Zeitreihenmodell bestimmte historische Ziel- und Funktionswerte enthalten, die dem Anwendungsfenster für das Modell entsprechen. Diese Anforderungen werden in Arbeiten mit Vorhersagen für Zeitreihenmodelle näher erläutert.
Verfügbare Tools zum Erstellen eines Anwendungsdatensatzes
Die folgenden Tools sind in Qlik Cloud verfügbar und unterstützen Sie beim Erstellen und dynamischen Erzeugen Ihrer Datensätze:
-
Qlik Scripting, verfügbar im Dateneditor in Apps, sowie der eigenständige Skript-Editor, auf den über das Aktivitätscenter Analysen zugegriffen werden kann.
-
Tabellenrezept, verfügbar als eigenständiges Tool über das Aktivitätscenter Analysen. Tabellenrezepte sind für die Erstellung von Einzeltabellen-Datensätzen konzipiert, wie sie beispielsweise beim maschinellen Lernen verwendet werden.
-
Datenfluss, verfügbar als eigenständiges Tool über das Aktivitätscenter Analysen.
-
Datenmanager in Analyse-Apps.
Häufig benötigte Vorgänge
Ändern der Feature-Typen
Es ist möglich, dass Sie beim Vorbereiten Ihres Anwendungsdatensatzes Spalten umwandeln müssen, um deren Feature-Typen zu ändern.
Das häufigste Beispiel ist eine numerische Spalte, die Sie in Ihrem Modell als Gruppe konfiguriert haben. Wenn Sie ein Feature als Gruppe in Ihrem Experiment auswählen, wird dessen Feature-Typ automatisch in kategorial geändert, falls dies noch nicht geschehen ist, damit es als Gruppe behandelt werden kann. Wenn Sie Ihren Anwendungsdatensatz für Vorhersagen hinzufügen, enthalten die Spaltendaten wahrscheinlich immer noch numerische Feature-Daten. Sie müssen die Spalte daher in String-Daten ändern, damit sie als kategoriales Feature identifiziert wird. Diese Umwandlung kann einfach mit Qlik Skripten – unter Verwendung der Funktion text() – oder mit anderen Qlik Datenvorbereitungstools wie Tabellenrezept und Datenfluss durchgeführt werden.
Ein Beispiel für die Verwendung von Qlik Skripten finden Sie unter Vorbereiten des Datensatzes.
Beschränkungen
-
Die Überwachung von Veränderungen in der Datenverteilung (Data Drift) ist für Zeitreihenmodelle nicht verfügbar.
-
SHAP-Datensätze können während Prognosen nicht mit Zeitreihenmodellen erzeugt werden.
-
Der Qlik Predict Analytics-Konnektor bietet keine Unterstützung für Zeitreihenmodelle.
Einschränkungen im Zusammenhang mit Zeitreihenexperimenten finden Sie unter Einschränkungen und Überlegungen.