Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Tworzenie modeli uwzględniających czas

Dzięki uczeniu z uwzględnieniem czasu możesz budować modele, które są przystosowane do przewidywania danych względem kolumny opartej na czasie, która istnieje w Twoich danych do uczenia. Aktywuj uczenie z uwzględnieniem czasu, jeśli musisz tworzyć predykcje dla celu, o którym wiadomo, że kolumna oparta na czasie ma na niego wpływ.

Uczenie z uwzględnieniem czasu pomaga zmniejszyć wyciek danych przez zastosowanie specjalistycznego przetwarzania danych do danych do uczenia. Przetwarzanie to pozwala algorytmom uczenia maszynowego lepiej interpretować dane i kontekst predykcji jako zależny od konkretnej daty i godziny.

Aby uczyć modele uwzględniające czas, potrzebna jest kolumna w zestawie danych do uczenia, która zawiera dane daty lub znacznika czasu. Kolumna ta jest indeksem daty, który jest używany w celu sortowania zestawu danych przed uczeniem. Więcej informacji na temat indeksu dat zawiera temat Wymagania dotyczące indeksu danych..

Kiedy stosować uczenie z uwzględnieniem czasu

Uczenie modeli z uwzględnieniem czasu jest idealne dla modeli, które prognozują zmiany we wskaźniku czasowym, który jest już obecny w uczeniu. Na przykład:

  • Chcesz przewidzieć sprzedaż na następny miesiąc i masz kolumnę Data transakcji w zestawie danych.

  • Chcesz przewidzieć wskaźniki dotyczące opóźnionych dostaw i masz kolumnę Data dostarczenia w zestawie danych.

Jak działa uczenie z uwzględnieniem czasu?

Częstym problemem w uczeniu maszynowym jest znalezienie sposobu na upewnienie się, że modele są uczone tylko na informacjach, które byłyby dostępne w czasie uczenia. Jeśli dane do uczenia zawierają istotne informacje o datach i godzinach, mogą być używane do zapobiegania wyciekom danych.

Wymagania dotyczące indeksu danych.

Aby aktywować uczenie z uwzględnieniem czasu, musisz mieć kolumnę w zestawie danych zawierającą informacje o dacie i godzinie, od których zależy uczenie modelu. Kolumnę tę wybiera się podczas konfigurowania optymalizacji modelu dla uczenia.

Aby można było użyć kolumny jako indeksu daty podczas uczenia, kolumna musi mieć wszystkie z poniższych cech:

  • Pełne daty. Na przykład nie można używać kolumn składających się z wartości miesiąca lub dnia.

  • Typ danych daty lub znacznika czasu.

  • Typ cechy data.

Wstrzymanie i walidacja krzyżowa

Podczas wybierania sposobu rozdzielenia danych dla procesu wstrzymania i walidacji krzyżowej metody losowego wyboru mogą wprowadzić przyszłe dane do uczenia modelu. Gdy aktywujesz uczenie z uwzględnieniem czasu, Qlik Predict zamiast tego stosuje następujący proces:

  • Zestaw danych do uczenia jest sortowany według wybranej kolumny indeksu, zanim zostanie podzielony na dane do uczenia i wstrzymania.

  • Każda iteracja uczenia wykorzystuje stały rozmiar danych do testowania oraz stopniowo rosnący rozmiar danych do uczenia. Z każdą iteracją dane stają się coraz bardziej aktualne.

Pełne informacje zawiera temat Walidacja krzyżowa oparta na czasie.

Inne przetwarzanie

Uczenie modeli z uwzględnieniem czasu wykorzystuje również inne procesy, które różnią się od domyślnych procesów uczenia. Na przykład uczenie z uwzględnieniem czasu wykorzystuje zmodyfikowany proces imputacji wartości null. Więcej informacji zawiera temat Imputacja wartości null.

Włączanie uczenia z uwzględnieniem czasu

Uczenie modelu z uwzględnieniem czasu można włączyć lub wyłączyć albo ponownie skonfigurować dla każdej wersji uruchomionej w eksperymencie.

  1. W eksperymencie kliknij Schemat Wyświetl konfigurację.

  2. Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.

  3. W panelu rozwiń pozycję Optymalizacja modelu.

  4. W sekcji Czasowy podział test/uczenie wybierz Indeks daty, który ma zostać użyty do sortowania danych.

Uczenie z uwzględnieniem czasu można zmienić podczas ulepszania modelu. Można na przykład wyłączyć to ustawienie lub wybrać nową kolumnę jako indeks daty. Więcej informacji zawiera temat Ulepszanie modeli.

Ograniczenia i uwagi

W zależności od zastosowania uczenie modeli z uwzględnieniem czasu może pomóc w tworzeniu lepszych modeli. W innych przypadkach lepsze wyniki można uzyskać za pomocą modeli szeregów czasowych lub domyślnego procesu uczenia dla modeli klasyfikacji i regresji. Uczenie z uwzględnieniem czasu jest przydatne, gdy nie chcesz uczyć modelu szeregów czasowych, ale nadal musisz uwzględnić pewien aspekt czasowy w wynikowym modelu. Na przykład uczenie z uwzględnieniem czasu może być odpowiednią alternatywną dla uczenia modeli szeregów czasowych, gdy dane wejściowe nie pozwalają na grupowanie.

Uczenie z uwzględnieniem czasu nie wykonuje zautomatyzowanej inżynierii cech w celu generowania cech opóźnionych dla problemów szeregów czasowych.

Trenowanie z uwzględnieniem czasu nie jest dostępne dla eksperymentów szeregów czasowych.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!