Prognozowanie szeregów czasowych
Użytkownicy biznesowi i analitycy często monitorują miary jako trend w czasie, a dzięki prognozowaniu szeregów czasowych mogą oszacować, jak historyczna sekwencja obserwacji będzie kontynuowana w przyszłości. Umiejętność przewidywania prawdopodobnej ewolucji linii trendów może wpływać na strategię i podejmowanie decyzji. W Qlik Cloud opcja prognozowania szeregów czasowych tworzy wizualizacje rozszerzające linie trendu o przewidywane wartości wygenerowane i zaprezentowane na wykresie liniowym. W zależności od zastosowanej metody zacieniony obszar reprezentujący przedział pewności wyświetla możliwe wartości na konfigurowanym poziomie pewności. Prognozy szeregów czasowych są tworzone przy użyciu zaufanych algorytmów predykcyjnych. SSA (analiza widma pojedynczego) zapewnia przedział ufności, a metoda OLS (zwykłych najmniejszych kwadratów) zapewnia prostą linię regresji liniowej.
Prognoza szeregów czasowych wyraźnie odróżnia przewidywane wartości od wartości historycznych. Wizualizacja wyświetla prognozę przyrostowo, zgodnie z konfiguracją na podstawie wybranych mnożników Kroki prognozy i Rozmiar kroku we właściwościach wymiaru. Po wybraniu w mierze metody SSA wyświetlany jest zacieniony obszar reprezentujący przedział ufności prognozy. Ten przedział jest konfigurowany za pomocą właściwości miary: Pokaż pewność i Poziom pewności. Zacieniony obszar przedstawia przedział prawdopodobnych wartości (np. 95%), co oznacza, że zgodnie z oczekiwaniami przyszłe wartości będą leżeć w zacienionym obszarze z prawdopodobieństwem 95%.
Wymagania i działanie właściwości
Przełącznik Prognoza pojawia się we właściwościach miary w opcjach zaawansowanych, gdy spełnione są następujące wymagania:
- Wymiar liczbowy lub czasowy
- Jedna miara i jeden wymiar
- Oś wymiaru musi być ciągła
Należy zauważyć, że ustawienie przełącznika Prognoza pojawia się we właściwościach miary tylko wtedy, gdy miara jest wymiarem czasu, a oś wymiaru jest ciągła. Gdy ustawienie to jest włączone, właściwości szeregów czasowych prognozy są wyświetlane na panelach zarówno wymiarów, jak i miar. Właściwości wymiaru odnoszą się do ustawień odległości horyzontu i przyrostu. Metoda ustawiania właściwości pomiaru, stylizacja linii i cieniowania, ustawienie ufności i poziom.
Metody OLS i SSA
Metoda najmniejszych kwadratów (Ordinary Least Square, OLS) to prosta metoda modelu regresji, która służy do obliczania linii trendu przez minimalizację sumy kwadratów różnic między obserwowaną a przewidywaną zmienną zależną. Ta opcja prognozy szeregów czasowych przydaje się, gdy użytkownik chce zobaczyć liniowy trend swoich danych. Nie kontroluje ona szumu ani wartości odstających, lecz po prostu wykorzystuje wszystkie dane do wygenerowania linii regresji liniowej.
W porównaniu z OLS analiza widma pojedynczego (Singular Spectrum Analysis, SSA) jest zaawansowanym algorytmem zdolnym do identyfikowania szumu i sezonowości, a także trendów. SSA wymaga, aby dane były odpowiednio regularnie próbkowane. Jeśli przekroczą pewien limit, zwracany jest błąd wskazujący, że dane są zbyt nieregularne. SSA to najlepsza opcja do prognozowania trendów o charakterze cyklicznym lub oscylacyjnym.
Kiedy do wykonania prognozy stosuje się metodę SSA, algorytm ten szacuje środek zakresu możliwych wartości, jakie przyjmuje miara zależna. Linia jest powiększona o przedział przewidywania obejmujący zakres wartości, które może ona przyjąć. Zamiast wyświetlania wielu możliwych wartości przedział przewidywania jest wyświetlany jako obszar zacieniony.
Ograniczenia prognoz szeregów czasowych
Prognozowanie szeregów czasowych ma następujące ograniczenia:
- Prognoza nie jest dostępna w przypadku wymiarów hierarchicznych.
- Prognoza nie jest dostępna w przypadku wykresów z więcej niż jednym wymiarem. W przypadku jednego wymiaru i wielu miar tylko jedna miara może mieć włączoną prognozę.
- Prognoza działa tylko wtedy, gdy obowiązuje domyślne sortowanie. Więcej informacji zawiera temat Zmiana sposobu sortowania wizualizacji.
- Minimum punktów danych: OLS wymaga co najmniej 2 punktów danych. SSA wymaga co najmniej 6 punktów danych.
-
Maksimum punktów danych: nie zaleca się używania algorytmów w zestawach danych zawierających ponad 5000 punktów danych. Użytkownicy zaczną odczuwać problemy z wydajnością podczas prognozowania szeregów czasowych w przypadku zestawów danych zawierających ponad 5000 punktów danych. Użytkownicy i projektanci aplikacji powinni używać warunku obliczeń zgodnie z wymaganiami, aby po zmniejszeniu zestawu danych przez wybory wyświetlił się wykres. Wybory powinny być ciągłe — patrz następny punkt dotyczący nieregularnego pobierania próbek w czasie.
-
W pewnych okolicznościach prognoza będzie działać z nieregularnym próbkowaniem w czasie: OLS będzie działać zawsze, ponieważ nie ogranicza się do prognoz szeregów czasowych lub regularnych danych. SSA wymaga, aby próbkowanie danych było wystarczająco regularne i jeśli przekroczy narzucony limit, zwracany jest błąd wskazujący, że dane były zbyt nieregularne.
-
Prognoza nie będzie działać w Qlik Cloud Mobile for SaaS w trybie offline.
-
Jeśli aplikacja z prognozą zostanie wyeksportowana z Qlik Cloud i zaimportowana do QSEoW, wykres prognozy nie zostanie wyświetlony. Prognoza nie jest obsługiwana w QSEoW.
-
Po pobraniu wykresu liniowego jako pliku programu Microsoft Excel prognozowane wartości nie są uwzględniane w pliku.
-
Po kliknięciu wykresu liniowego prawym przyciskiem myszy i wybraniu polecenia Wyświetl dane prognozowane wartości nie są wyświetlane.
-
Prognozowanie szeregów czasowych jest niedostępne, jeżeli którekolwiek wymiary lub miary na wykresie liniowym stosują warunek wyświetlania.