Arbeiten mit multivariaten Zeitreihenprognosen
Mit Qlik Predict können Sie ML-Modelle trainieren, um zeitspezifische Metriken vorherzusagen. Mithilfe auf neuronalen Netzen basierter Methoden lernen und prognostizieren Modelle komplexe Muster, die zeitspezifische Assoziationen, gruppierte Zieldaten, historische Features und bekannte zukünftige Variablen umfassen. Um eine Zeitreihenprognose zu erstellen, bereiten Sie einen Trainingsdatensatz vor, verwenden Sie ihn in einem Zeitreihenexperiment, stellen Sie ein Modell bereit und erstellen Sie dann Anwendungsdatensätze, die Sie zur Generierung von Vorhersagen verwenden können.
Komponenten einer Zeitreihenaufgabe
Bei der Zeitreihenprognose sollen Zielwerte für bestimmte zukünftige Termine vorhergesagt werden. Zum Beispiel möchten Sie den Umsatz für die nächste Woche, den nächsten Monat oder das nächste Quartal vorhersagen.
Bei der Entwicklung der Zeitreihenaufgabe definieren Sie die folgenden Komponenten:
-
Ziel und Gruppen
-
Datumsindex
-
Prognosehorizont
-
Kovariaten
Vereinfachte Darstellung der Komponenten einer Zeitreihenprognoseaufgabe in Qlik Predict.

Ziel
Wie bei anderen Experimenttypen ist das Ziel die Spalte, für die das Modell zukünftige Werte vorhersagen soll. Für Zeitreihenexperimente muss das Ziel numerische Daten enthalten – zum Beispiel Umsatzzahlen oder Lagerbestände.
Wenn Sie Gruppen in der Zeitreihenprognose verwenden, sagen Modelle einen Zielwert pro Gruppe pro Zeitschritt im Prognosefenster vorher. Wenn Sie keine Gruppen verwenden, sagen die trainierten Modelle einen Zielwert pro Zeitschritt im Prognosefenster vorher.
Datumsindex
Der Datumsindex verfolgt die Zeitreihenmetriken über ein kontinuierliches Zeitintervall (Zeitschritt). Sie müssen Ihren Zeitschritt frühzeitig festlegen: Wie oft müssen Sie zukünftige Werte vorhersagen?
Insbesondere ist der Datumsindex eine Spalte, die in Ihren Trainings- und Anwendungsdatensätzen für Zeitreihenaufgaben angezeigt wird. Der Datumsindex bestimmt die Struktur beider dieser Anwendungsdatensätze – jede Zeile stellt einen Zeitschritt dar (bzw. bei Gruppen einen Zeitschritt für jede eindeutige Gruppierung).
Wenn Sie den Trainingsdatensatz in einem Zeitreihenexperiment hinzufügen, werden mögliche Datumsindexspalten automatisch identifiziert und Ihnen als Einblicke auf Spaltenebene präsentiert. Sie können sie anhand des Einblicks Möglicher Datumsindex in der Schemaansicht identifizieren.
Gruppen
Gruppen sind Features, die kategoriale Informationen enthalten, für die Sie Vorhersagen separat generieren möchten. Klassische Beispiele für Gruppen sind Filialnummer und Produkt, die verwendet werden könnten, um Daten für ein Ziel wie Umsatz zu organisieren. Durch die Auswahl von Filialnummer und Produkttyp als Gruppen liefern Ihre Zeitreihenmodelle Vorhersagen für jeden einzelnen Wert in diesen Spalten. Wenn Sie beispielsweise Umsatz als Ziel haben, generiert Ihr Modell im Fall von drei Filialnummern – 1, 2 und 3 – und zwei Produkttypen – Lebensmittel und Frischwaren – Umsatzprognosen für jede eindeutige Kombination dieser Werte.
Sie sollten Gruppen in Ihre Zeitreihenaufgabe integrieren, wenn Sie über die entsprechenden Daten verfügen und individuelle Vorhersagen nach Kategorie benötigen. Ein weiterer Vorteil von Gruppen ist, dass Modelle global lernen können, wodurch sie die Muster, die zwischen den von Ihnen definierten verschiedenen Gruppierungen bestehen, besser verstehen.
Sie können für jede Experimentversion zu verwendende Gruppen konfigurieren. Wenn Sie keine Gruppen angeben, aber Gruppen im Trainingsdatensatz identifiziert werden, verwendet das Training Gruppen.
Gruppen werden durch duplizierte Werte in der Datumsindexspalte identifiziert – zum Beispiel haben Sie für das Datum 14.01.2025 zwei Datensätze: einen für Filiale A und den anderen für Filiale B.
Jede Gruppe in einem Zeitreihenexperiment – einschließlich des Ziels allein – wird als separate Zeitreihe innerhalb Ihres Datensatzes betrachtet. Weitere Informationen finden Sie unter Was ist eine Zeitreihe?.
Prognosehorizont
Der Prognosehorizont gibt an, wie weit in die Zukunft Sie vorhersagen möchten. Der Prognosehorizont setzt sich zusammen aus dem Prognosefenster (der Anzahl der Zeitschritte, für die Sie Vorhersagen benötigen) und der Prognoselücke (einer optionalen Anzahl von Zeitschritten nach Ihren Verlaufsdaten, für die Sie keine Vorhersagen wünschen).
Sie legen das Prognosefenster und die Lückengröße fest, wenn Sie eine Experimentversion konfigurieren. Diese Werte werden sowohl während des Modelltrainings als auch bei der Generierung von Vorhersagen aus Modellen verwendet, die als ML-Bereitstellungen bereitgestellt werden.
Das Prognosefenster ist die Anzahl der Zeitschritte, für die Sie in die Zukunft vorhersagen möchten. Wenn Ihr Zeitschritt beispielsweise ein Tag ist und Sie die Umsatzzahlen für die nächsten zwei Wochen vorhersagen möchten, legen Sie das Prognosefenster auf 14 fest.
Die Prognoselücke ist der Zeitraum in der Zukunft, für den Sie keine Vorhersagen benötigen. Das Festlegen einer Prognoselücke ist optional, da sie je nach Fall erforderlich sein kann oder nicht. Die Prognoselücke beginnt am Ende der von Ihnen bereitgestellten aufgezeichneten Verlaufstrainingsdaten. Das Prognosefenster beginnt dort, wo die Prognoselücke endet.
Zum Beispiel möchten Sie zukünftige Umsätze vorhersagen, aber Sie sind nur an zukünftigen Umsätzen für Zeitpunkte interessiert, die später als eine Woche nach dem Ende Ihrer Eingabedaten liegen. In diesem Fall könnten Sie bei einem Zeitschritt von Tagen Ihre Prognoselückengröße auf sieben Zeitschritte festlegen.
Zusätzlich zu Ihrer Menge an Trainingsdaten begrenzt das ausgewählte Prognosefenster, wie weit in die Zukunft Sie vorhersagen können. Weitere Informationen finden Sie unter Maximales Prognosefenster.
Kovariaten
Bei Zeitreihenaufgaben werden Features oft als Kovariaten bezeichnet. Ähnlich wie bei anderen ML-Aufgaben sind Kovariaten die anderen Variablen, von denen Sie vermuten, dass sie einen Einfluss auf das Ergebnis des Ziels haben. Jede Kovariate wird als einzelne Spalte in Ihrem Trainingsdatensatz dargestellt.
Bei der Zeitreihenprognose gibt es verschiedene Arten von Kovariaten, die einige wichtige Unterschiede aufweisen:
-
Statische Kovariaten: Spalten, die im Verlauf einer Zeitreihe nicht variieren. Statische Kovariaten sind in Zeitreihenexperimenten anwendbar, in denen Gruppen verwendet werden. Angenommen, Sie haben Gruppen für Produkt und Filialnummer, und es ist ein Feature „Standardrabatt“ vorhanden. Wenn Produkt A in Filiale 1 einen Standardrabatt von 10 % und Produkt B in Filiale 2 einen Standardrabatt von 20 % aufweist, ist „Standardrabatt“ eine statische Kovariate. Das heißt, sie variiert nicht innerhalb der Daten für die Gruppe, innerhalb derer sie erscheint.
Statische Kovariaten werden automatisch in historischen Features erkannt, die Sie in das Experiment einschließen. Sie müssen nicht angeben, welche Features statische Kovariaten sind.
-
Vergangene Kovariaten: Zeitabhängige Variablen, die nur in den Verlaufsdaten verfügbar sind und die über diese Daten hinweg variieren. Vergangene Kovariaten werden automatisch in historischen Features erkannt, die Sie in das Experiment einschließen. Sie müssen nicht ausdrücklich angeben, welche Features vergangene Kovariaten sind.
-
Zukünftige Kovariaten: Zukünftige Kovariaten, auch bekannt als zukünftige Features, sind zeitabhängige Variablen, für die Sie die zukünftigen Werte innerhalb des Prognosehorizonts kennen werden. Wenn Sie zukünftige Kovariaten im Training verwenden, müssen Sie diese als zukünftige Features in der Trainingskonfiguration angeben.
Zukünftige Features
Mit zukünftigen Features können Sie Ihren Modellen zusätzliche Daten über zukünftige Informationen bereitstellen, die Sie bereits kennen oder vernünftigerweise erwarten können. Insbesondere haben Sie Zugang zu zukünftigen Werten für dieses Feature, die Ihren ausgewählten Prognosehorizont umfassen. Beim Definieren zukünftiger Features müssen Sie sowohl Verlaufs- als auch zukünftige Daten bereitstellen.
Für ein Modell, das Metriken vorhersagt, die durch zukünftige Rabatte eines Geschäfts beeinflusst werden könnten, könnten Sie beispielsweise die historisch beobachteten Rabatte sowie die Rabatte für zukünftige Zeiträume innerhalb des Prognosefensters einbeziehen. Weitere Beispiele für zukünftige Features könnten Wetter- oder Kalenderinformationen sein.
Weitere wichtige Konzepte
Dieser Abschnitt beschreibt Konzepte, die für Ihre Zeitreihenaufgabe relevant sind, die Sie jedoch nicht direkt in einem Experiment oder einer ML-Bereitstellung konfigurieren. Dies sind Eigenschaften, die durch Ihre Daten oder durch andere für das Modell konfigurierte Eigenschaften definiert werden.
Zeitschritte
Der Zeitschritt wird durch Ihren Trainingsdatensatz definiert und ist sowohl für das Training als auch für Vorhersagen wichtig.
Im Trainingsdatensatz ist der Zeitschritt das Intervall, in dem die Daten im Datumsindex aufgezeichnet werden. Der Zeitschritt kann beispielsweise täglich, stündlich, minütlich oder sekündlich sein.
Es ist wichtig, den in Ihren Trainingsdaten verwendeten Zeitschritt zu kennen. Andere von Ihnen definierte Experimentparameter, wie z. B. Prognosefenster und Prognoselückenlänge, orientieren sich an diesem Zeitschrittintervall.
Nachdem Sie das Modell bereitgestellt haben, müssen die Anwendungsdaten, für die Sie Vorhersagen erstellen möchten, demselben Zeitschritt folgen, der im Trainingsdatensatz definiert ist.
Qualität
Wenn Sie einen Trainingsdatensatz auswählen, leitet das System den verwendeten Zeitschritt ab. Wenn im Datumsindex Werte fehlen oder Lücken vorhanden sind, können Spalten wie Ziel, Gruppen und Kovariaten vom System automatisch interpoliert werden. Wenn die Daten jedoch Zeitintervalle enthalten, die so inkonsistent sind, dass unterschiedliche Zeitschritte erkannt werden, müssen die Daten zuerst korrigiert werden. Wenn Sie beispielsweise Daten über mehrere Monate haben, die einmal täglich aufgezeichnet wurden, es aber einen Abschnitt gibt, in dem Daten konsistent wöchentlich aufgezeichnet werden, kann der Datensatz nicht verwendet werden, da mehrere Zeitschritte erkannt werden.
Anwendungsfenster
Das Anwendungsfenster oder der Rückblickzeitraum ist der Teil der Trainingsdaten, den der Algorithmus verwenden kann, um die Vorhersagen für das angegebene Prognosefenster bereitzustellen.
Das Anwendungsfenster wird vom System berechnet und festgelegt. Es wird in Zeitschritten gemessen. Das Anwendungsfenster wird durch das definiert, was Sie als Prognosefenster und -lücke (Prognosehorizont) festlegen. Ihre Anwendungsfenstergröße wird im Experimentkonfigurationsfenster und der Modelltrainingsübersicht angezeigt, nachdem mindestens eine Experimentversion ausgeführt wurde. Es wird auch in einem ML-Bereitstellungs-Modellschema beim Erstellen oder Bearbeiten einer Batch-Vorhersagekonfiguration angezeigt.
Das Anwendungsfenster wird automatisch über die Trainingskonfiguration identifiziert. Um Vorhersagen für ein bestimmtes Prognosefenster zu generieren, müssen Sie die Verlaufsdaten bereitstellen, die mindestens das Anwendungsfenster abdecken. Diese Daten werden in Ihrem Anwendungsdatensatz bereitgestellt. Weitere Informationen finden Sie unter Vorbereiten eines Anwendungsdatensatzes.
Maximales Prognosefenster
Das maximale Prognosefenster wird geschätzt, während Sie das Zeitreihenexperiment konfigurieren. Nachdem Sie eine Version des Trainings ausgeführt haben, wird das maximale Prognosefenster mit Sicherheit bestätigt. Das maximale Prognosefenster wird Ihnen als Geschätzte maximale Prognose oder Maximale Prognose unter Basierend auf Ihren Daten angezeigt, wenn Sie Ziel und Experimenttyp im Experimentkonfigurationsfenster öffnen. Das maximale Prognosefenster ist die maximale Anzahl von Zeitschritten, für die Sie Prognosen generieren können, unter Berücksichtigung des gewählten Prognosefensters, der Menge der von Ihnen bereitgestellten Verlaufsdaten und der vom System erwarteten Mindeststichprobengröße. Je mehr Verlaufsdaten Sie bereitstellen, desto weiter in die Zukunft können Sie vorhersagen. Es ist jedoch wichtig, ein angemessenes Prognosefenster auszuwählen, um zuverlässige Vorhersagen zu generieren.
Das maximale Prognosefenster kann bis zu 180 Zeitschritte umfassen.
Prognosestichtag
Der Prognosestichtag ist besonders wichtig, wenn Sie den Anwendungsdatensatz während Vorhersagen definieren. Der Prognosestichtag ist das letzte Datum in Ihrer Stichprobe, für das Sie einen Zielwert haben. Im Wesentlichen sind Daten nach diesem Stichtag die Daten, für die Sie Vorhersagen generieren möchten.
Was ist eine Zeitreihe?
In Qlik Predict Zeitreihenprognosen wird jede Gruppe – einschließlich des Ziels allein – als separate Zeitreihe innerhalb des Trainingsdatensatzes betrachtet. Angenommen, Ihr Trainingsdatensatz enthält Umsatzmetriken. Diese Umsatzmetriken sind für jede Filiale und jeden Produkttyp definiert. Wenn die Spalten „Store“ (Filiale) und „Product Type“ (Produkttyp) als Gruppen definiert sind, enthält der Trainingsdatensatz drei Zeitreihen.
Vorbereiten eines Trainingsdatensatzes
Für multivariate Zeitreihenprognosen muss Ihr Trainingsdatensatz die folgenden Spalten enthalten:
-
Datumsindex
-
Zielspalte
-
Gruppenspalten (optional)
-
Feature-Spalten (optional – ohne Features trainieren Sie ein univariates Prognosemodell)
Abbildungen, die die erforderlichen Spalten und Daten für Zeitreihen-Trainingsdatensätze zeigen. Szenarien ohne Gruppen, mit einer Gruppe und mit zwei Gruppen werden beschrieben.

Lineares Diagramm, das die benötigten Komponenten und den Zeitplan eines Trainingsdatensatzes für ein Zeitreihenprognosemodell darstellt.

Spalte „Datumsindex“
Sie benötigen einen Datumsindex, der vollständige Datumsangaben oder Zeitstempel enthält. Diese Spalte ist der chronologische Index, entlang dessen die Ziel- und Kovariatenmetriken verfolgt werden. Die Spalte „Datumsindex“ organisiert die zeitbasierten Messungen sequenziell entlang eines konsistenten Zeitintervalls (des Zeitschritts).
Die Spalte „Datumsindex“ ist wie folgt organisiert, je nachdem, ob Sie Gruppen verwenden oder nicht:
-
Keine Gruppen: Ein einzelner Datensatzeintrag für jeden Zeitschritt. Zum Beispiel stellt bei einer täglichen Prognose jede Zeile einen einzelnen Tag dar.
-
Mit Gruppen: Ein oder mehrere duplizierte Einträge für jeden Zeitschritt, abhängig von den verwendeten Gruppen.
Wenn ein multivariater Trainingsdatensatz verwendet wird, gibt es einen oder mehrere duplizierte Einträge für jeden Zeitschritt, abhängig von den verwendeten Gruppen. Es besteht Flexibilität bei dem von Ihnen verwendeten Zeitschritt – Sie könnten zum Beispiel Daten ein- oder mehrmals auf täglicher, wöchentlicher oder monatlicher Basis und so weiter aufzeichnen.
Fehlende oder inkonsistent aufgezeichnete Werte in dieser Spalte sind manchmal akzeptabel, wenn sie interpoliert werden können. Allerdings dürfen die Datumsindexwerte nicht mehrere unterschiedliche Zeitschritte enthalten. Wenn beispielsweise das Intervall als einmal täglich festgelegt wird, aber zu einem bestimmten Zeitpunkt ein Intervall von zweimal täglich identifiziert wird, tritt während des Trainings ein Fehler auf.
Zielspalte und Gruppenspalten
Der Datensatz muss eine Zielspalte enthalten, die eine numerische Metrik enthält, die Sie prognostizieren möchten. Ein gängiges Beispiel sind Umsatzzahlen.
Wenn Sie Gruppen verwenden, geben Sie historische Zielwerte für jeden möglichen Wert in Gruppen an, die Sie hinzufügen. Wenn Ihr Ziel beispielsweise „Umsatz“ ist und Sie eine Gruppe „Filialnummer“ hinzufügen, die Daten für Filiale A und Filiale B enthält, muss Ihr Datensatz für jeden Zeitschritt zwei separate Datensatzeinträge enthalten: einen mit dem Umsatzwert für Filiale A und den anderen mit dem Umsatzwert für Filiale B.
Feature-Spalten
Sie können ein Zeitreihenmodell ohne Kovariaten trainieren. Wenn Sie jedoch Kovariaten einschließen, geben Sie für jedes Feature eine Spalte im Datensatz an. Feature-Daten sollten im Allgemeinen historisch erfasste Daten sein, es sei denn, Sie fügen zukünftige Features hinzu. Spalten für zukünftige Features können sowohl historische als auch zukünftige Daten enthalten. Sie sollten Daten zukünftiger Features nur dann in den Trainingsdatensatz aufnehmen, wenn Sie sicher sind, dass die zukünftigen Werte dieser Spalte bekannt sein werden, wenn Sie Vorhersagen erstellen.
Merken Sie sich, welche Features Sie als zukünftige Features verwenden werden, da Sie sie als solche in der Trainingskonfiguration auswählen müssen.
Datenvolumen
Der Datensatz muss genügend Einträge enthalten. Das Volumen Ihrer Verlaufsdaten spielt eine Rolle bei der Bestimmung, wie weit Sie in die Zukunft vorhersagen können. Das gewünschte Prognosefenster beeinflusst ebenfalls, wie viele Verlaufsdaten Sie benötigen.
Generell sind mehr Verlaufsdaten besser als weniger. Allerdings müssen die Daten von guter Qualität sein und die gewünschten Trends erfassen. Wenn die Daten irrelevante Informationen liefern oder Ungenauigkeiten enthalten, ist es nicht hilfreich, sie in das Modell aufzunehmen. Halten Sie die Balance zwischen der Optimierung des Volumens und der Aufrechterhaltung von Qualität und Relevanz.
Beispiele
Vorbereiten eines Anwendungsdatensatzes
Nachdem Sie ein Zeitreihenmodell bereitgestellt haben, müssen Sie einen Anwendungsdatensatz entwickeln, für den Vorhersagen getroffen werden.
Anwendungsdatensatz — Anforderungen und Validierung
Für Zeitreihenmodelle benötigt der Anwendungsdatensatz Folgendes:
-
Spalten und Spaltenüberschriften für alle Spalten, die in dem Trainingsdatensatz enthalten sind.
-
Der gleiche Zeitschritt wie der Trainingsdatensatz.
-
Für jedes Ziel und jede Gruppe müssen vor dem Prognose-Stichtag mindestens genauso viele historische Datensätze vorliegen wie im Anwendungsfenster für das Modell. Hierbei muss es sich um vollständige Datensätze handeln, die die historisch beobachteten Datums- oder Zeitstempel, das Ziel und Kovariatenwerte enthalten. Das Anwendungsfenster wird durch das während des Trainings konfigurierte Prognosefenster und die Lücke bestimmt – je weiter die Prognose in die Zukunft liegt, desto mehr historische Daten werden in Ihrem Anwendungsdatensatz benötigt, um Prognosen zu erstellen.
-
Datensätze für alle zukünftigen Zeitschritte innerhalb Ihres Prognosehorizonts. Fügen Sie für diese zukünftigen Datensätze nur die Werte für die Datumsindexspalte sowie alle zukünftigen Funktionen hinzu. Lassen Sie die Werte für die anderen Spalten leer.
Abbildungen, die die erforderlichen Spalten und Daten für Anwendungsdatensätze zeigen, die zur Generierung von Vorhersagen aus Zeitreihenprognosemodellen verwendet werden. Szenarien ohne Gruppen, mit einer Gruppe und mit zwei Gruppen werden beschrieben.

Lineares Diagramm, das die benötigten Komponenten und den Zeitplan eines Anwendungsdatensatzes darstellt, der zum Erstellen von Vorhersagen mit einem Zeitreihenprognosemodell verwendet wird.
