Inżynieria cech daty
Qlik Predict generuje automatycznie opracowane cechy z kwalifikujących się kolumn o typie cechy daty, które zostały zidentyfikowane jako zawierające informacje o dacie i godzinie. Automatycznie opracowane cechy daty oraz cechy nadrzędne, z których pochodzą, są oznaczone ikoną .
Gdy Qlik Cloud Analytics profiluje zbiór danych treningowych wybrany do użycia w Qlik Predict, łączy określone typy danych z typem cechy daty. Obejmuje to następujące typy danych:
-
Data
-
Data i godzina
-
Godzina
-
Znacznik czasu
Cechom, którym podczas profilowania przypisano dowolny z tych typów danych, nadawany jest typ cechy daty. Informacje o dostępnych statystykach profilu, które można wyświetlić dla pól danych, zawiera sekcja Widok listy.
Jeśli to możliwe, Qlik Predict wyświetla listę automatycznie opracowanych cech daty, które można utworzyć z kwalifikujących się cech nadrzędnych o typie cechy daty. Automatycznie opracowane cechy daty są domyślnie uwzględniane w eksperymencie. Jeśli zdecydujesz się je uwzględnić, nowe cechy zostaną wygenerowane po wersji v1 eksperymentu.
Automatycznie opracowane cechy daty mają numeryczny typ cechy. Są one domyślnie uwzględniane w eksperymencie, ale są opcjonalne. Możesz usunąć niektóre lub wszystkie z nich przed rozpoczęciem trenowania eksperymentu lub podczas konfigurowania kolejnej wersji eksperymentu. Gdy automatycznie opracowane cechy daty są uwzględnione, oryginalna nadrzędna cecha daty jest usuwana z eksperymentu.
Zamiast tego możesz uwzględnić nadrzędną cechę daty jako cechę kategoryczną lub numeryczną. W takim przypadku automatycznie opracowane cechy daty nie będą już mogły być używane. W większości przypadków zaleca się korzystanie z dostępnych automatycznie opracowanych cech w eksperymencie, ponieważ zapewniają one lepszą wydajność modeli uczenia maszynowego. Mogą jednak wystąpić scenariusze, w których kolumna zostanie zidentyfikowana jako cecha daty, ale konieczne będzie traktowanie jej jako kategorycznej lub numerycznej. W takich przypadkach można ręcznie zmienić typ cechy.
Automatycznie opracowane cechy daty nie wliczają się do rozmiaru zbioru danych Qlik Predict (maksymalnej liczby komórek w zbiorach danych treningowych i zbiorach danych stosowania) określonego w subskrypcji Qlik Cloud. Liczone są tylko komórki oryginalnej kolumny daty.
Widok schematu przedstawiający automatycznie opracowane cechy, które można wygenerować z nadrzędnej cechy daty „Invoice Date”. Zwróć uwagę na różnicę między wartościami Typ danych i Typ cechy dla każdej cechy.

Używanie cechy daty jako celu eksperymentu
W rzadkich przypadkach, gdy chcesz użyć cechy zawierającej informacje o dacie i godzinie jako celu eksperymentu, typ cechy kolumny zostanie przełączony z daty na kategoryczny, a automatycznie opracowane cechy zostaną usunięte. Jeśli wybierzesz inny cel, a później zechcesz dodać cechę daty i godziny jako zwykłą cechę, w razie potrzeby musisz ręcznie zmienić jej typ z powrotem na typ cechy daty. Jeśli przywrócisz typ cechy daty, automatycznie opracowane cechy daty zostaną wygenerowane ponownie.
Więcej informacji o sposobie zmiany typów cech zawiera sekcja Zmiana typów cech.
Dostępne automatycznie opracowane cechy daty
Podczas generowania automatycznie opracowanych cech daty z kolumny w zbiorze danych Qlik Predict wyodrębnia i oblicza określone składniki każdej wartości daty oraz daty i godziny, izolując każdy składnik w osobnej kolumnie. Poniższa tabela zawiera listę automatycznie opracowanych cech, które mogą być generowane przez Qlik Predict.
| Automatycznie opracowana cecha | Typ danych | Typ cechy | Opis |
|---|---|---|---|
| YEAR | Integer | Numeric | Pole roku przeanalizowane bezpośrednio z daty źródłowej lub znacznika czasu. |
| MONTH | Integer | Numeric | Pole miesiąca przeanalizowane bezpośrednio z daty źródłowej lub znacznika czasu. |
| DAY | Integer | Numeric | Pole dnia przeanalizowane bezpośrednio z daty źródłowej lub znacznika czasu. |
| HOUR | Integer | Numeric | Pole godziny przeanalizowane bezpośrednio ze źródłowego znacznika czasu. |
| MINUTE | Integer | Numeric | Pole minuty przeanalizowane bezpośrednio ze źródłowego znacznika czasu. |
| SECOND | Integer | Numeric | Pole sekundy przeanalizowane bezpośrednio ze źródłowego znacznika czasu. |
| DAYOFWEEK | Integer | Numeric | Dzień tygodnia, obliczony na podstawie źródłowego dnia, miesiąca i roku. |
| WEEK | Integer | Numeric | Tydzień roku, obliczony na podstawie źródłowego dnia, miesiąca i roku. |
Dla każdej nowo utworzonej cechy do oryginalnej nazwy kolumny dodawany jest sufiks z odpowiednią automatycznie opracowaną cechą.
Automatycznie opracowane cechy daty w panelu konfiguracji eksperymentu

Automatycznie opracowane cechy daty i modele szeregów czasowych
Kiedy wybierzesz kolumnę indeksu daty dla eksperymentu szeregów czasowych, typ cechy daty jest używany dla tej kolumny. Jednakże, inżynieria cech daty nie jest obsługiwana dla modeli szeregów czasowych. Automatycznie zaprojektowane cechy daty nie są dostępne do wyprowadzenia z kolumny.
Więcej informacji o modelach szeregów czasowych zawierają sekcje Praca z eksperymentami szeregów czasowych oraz Praca z prognozowaniem szeregów czasowych wielu zmiennych.
Automatycznie opracowane cechy daty w predykcjach
Informacje o sposobie pracy z cechami daty podczas uruchamiania predykcji zawiera sekcja Praca z cechami dat w predykcjach.