Inżynieria cechy daty
Qlik Predict generuje cechy przy użyciu automatycznej inżynierii z kwalifikujących się kolumn z typem cechy data, które zostały zidentyfikowane jako zawierające informacje o dacie i godzinie. Cechy daty uzyskane w wyniku automatycznej inżynierii oraz cechy nadrzędne, z których pochodzą, są oznaczone ikoną .
Kiedy Qlik Cloud Analytics profiluje zestaw danych do uczenia wybrany do użycia w Qlik Predict, łączy pewne typy danych z typem cechy data. Obejmuje to następujące typy danych:
-
Data
-
DATETIME
-
Czas
-
Znacznik czasu
Cechom, którym podczas profilowania zostanie przypisany którykolwiek z tych typów danych, przypisywany jest typ cechy data. Aby uzyskać informacje na temat dostępnych statystyk profilu, które można przeglądać dla pól danych, zobacz temat Widok listy.
Jeśli to możliwe, Qlik Predict wyświetla listę cech uzyskanych w wyniku automatycznej inżynierii, które można utworzyć z kwalifikujących się cech nadrzędnych mających typ cechy data. Cechy uzyskane w wyniku automatycznej inżynierii są domyślnie uwzględniane w eksperymencie. Jeśli zdecydujesz się je uwzględnić, nowe cechy zostaną wygenerowane po wersji 1 eksperymentu.
Cechy uzyskane w wyniku automatycznej inżynierii mają typ liczbowy. Są one domyślnie uwzględniane w eksperymencie, ale opcjonalne. Możesz usunąć niektóre lub wszystkie z nich przed rozpoczęciem uczenia w ramach eksperymentu lub podczas konfigurowania kolejnej wersji eksperymentu. Jeśli uzyskane w wyniku automatycznej inżynierii cechy typu data zostaną uwzględnione, oryginalna nadrzędna cecha typu data zostanie usunięta z eksperymentu.
Zamiast tego można dołączyć cechę daty nadrzędnej jako cechę kategorialnną lub numeryczną. Gdy to zrobisz, poddane automatycznej inżynierii cechy daty przestaną być użyteczne. W większości przypadków zaleca się korzystanie w eksperymencie z dostępnych cech uzyskanych w wyniku automatycznej inżynierii, ponieważ zapewniają one lepszą wydajność modeli uczenia maszynowego. Mogą jednak wystąpić sytuacje, w których kolumna zidentyfikowana jako cecha daty musi być traktowana jako kategorialna lub numeryczna. W takich przypadkach można ręcznie zmienić typ cechy.
Cechy typu data uzyskane w wyniku automatycznej inżynierii nie są wliczane do wielkości zestawu danych Qlik Predict (maksymalnej liczby komórek w zestawach danych do uczenia i stosowania) określonej w subskrypcji Qlik Cloud. Liczone są tylko oryginalne komórki kolumny daty.
Widok schematu przedstawiający cechy uzyskane w wyniku inżynierii automatycznej, które można wygenerować na podstawie nadrzędnej cechy typu data „Invoice Date”. Zwróć uwagę na różnicę między typem danych i typem cechy każdej z cech.

Używanie cechy typu data jako celu eksperymentu
W rzadkich przypadkach, gdy jako celu eksperymentu chcesz użyć cechy zawierającej informacje o dacie i godzinie, typ cechy w kolumnie zostanie zmieniony z daty na kategorialny, a cechy uzyskane w wyniku inżynierii automatycznej zostaną usunięte. Jeżeli wybierzesz inny cel, a później zechcesz dodać cechę daty i godziny jako zwykłą cechę, w razie potrzeby trzeba będzie ją zmienić z powrotem na typ cechy data i godzina ręcznie. Jeśli przywrócisz typ cechy data, uzyskane w wyniku inżynierii automatycznej cechy typu data zostaną wygenerowane ponownie.
Aby uzyskać więcej informacji na temat zmiany typów cech, zobacz temat Zmiana typów danych cech.
Dostępne cechy poddawane automatycznej inżynierii
Podczas generowania uzyskiwanych w wyniku inżynierii automatycznej cech typu data z kolumny w zestawie danych Qlik Predict wyodrębnia i oblicza określone składniki każdej wartości typu data oraz data i godzina, izolując każdy składnik w osobnej kolumnie. Poniższa tabela zawiera listę cech uzyskiwanych w wyniku inżynierii automatycznej, które mogą być generowane przez Qlik Predict.
| Cecha poddana automatycznej inżynierii | Typ danych | Typ cechy | Opis |
|---|---|---|---|
| ROK | Liczba całkowita | Liczbowe | Pole roku uzyskane w wyniku bezpośredniej analizy źródłowej daty lub znacznika czasu. |
| MIESIĄC | Liczba całkowita | Liczbowe | Pole miesiąca uzyskane w wyniku bezpośredniej analizy źródłowej daty lub znacznika czasu. |
| DZIEŃ | Liczba całkowita | Liczbowe | Pole dnia uzyskane w wyniku bezpośredniej analizy źródłowej daty lub znacznika czasu. |
| GODZINA | Liczba całkowita | Liczbowe | Pole godziny uzyskane w wyniku bezpośredniej analizy źródłowego znacznika czasu. |
| MINUTA | Liczba całkowita | Liczbowe | Pole minuty uzyskane w wyniku bezpośredniej analizy źródłowego znacznika czasu. |
| SEKUNDA | Liczba całkowita | Liczbowe | Pole sekundy uzyskane w wyniku bezpośredniej analizy źródłowego znacznika czasu. |
| DZIEŃTYGODNIA | Liczba całkowita | Liczbowe | Dzień tygodnia obliczony ze źródłowego dnia, miesiąca i roku. |
| TYDZIEŃ | Liczba całkowita | Liczbowe | Tydzień roku obliczony ze źródłowego dnia, miesiąca i roku. |
Dla każdej nowo utworzonej cechy do oryginalnej nazwy kolumny dodawany jest sufiks odpowiedniej cechy uzyskanej w wyniku inżynierii automatycznej.
Uzyskane w wyniku inżynierii automatycznej cechy typu data w panelu konfiguracji eksperymentu

Automatycznie generowane cechy daty i modele szeregów czasowych
Kiedy wybierzesz kolumnę indeksu daty dla eksperymentu szeregów czasowych, typ cechy daty jest używany dla tej kolumny. Jednakże, inżynieria cech daty nie jest obsługiwana dla modeli szeregów czasowych. Automatycznie zaprojektowane cechy daty nie są dostępne do wyprowadzenia z kolumny.
Aby uzyskać więcej informacji na temat modeli szeregów czasowych, zobacz Praca z eksperymentami szeregów czasowych i Praca z prognozowaniem wielowymiarowych szeregów czasowych.
Cechy typu data uzyskane w wyniku inżynierii automatycznej w predykcjach
Aby uzyskać informacje na temat pracy z cechami typu data podczas uruchamiania predykcji, zobacz Praca z cechami dat w predykcjach.
Dowiedz się więcej
Cechy typu data uzyskane w wyniku inżynierii automatycznej w predykcjach
Cechy typu data uzyskane w wyniku inżynierii automatycznej są generowane podczas korzystania z zestawu danych do uczenia w celu utworzenia modelu, który jest wdrażany i używany jako wdrożenie uczenia maszynowego w celu przewidywania nowych danych (zestaw danych do zastosowania).
Jeśli do tworzenia predykcji zostanie wdrożony model uczony przy użyciu cech typu data uzyskanych w wyniku inżynierii automatycznej, zestaw danych do zastosowania, na podstawie którego generowane są prognozy, nie musi zawierać cech typu data uzyskanych w wyniku inżynierii automatycznej. Qlik Predict generuje cechy uzyskiwane w wyniku inżynierii automatycznej dla zestawu danych do zastosowania przed tworzeniem predykcji. Zestaw danych do zastosowania musi jednak zawierać nadrzędną cechę daty, a kolumna musi być profilowana jako mająca typ danych Data, Data i godzina, Znacznik czasu lub Czas.
Zestawy danych predykcyjnych utworzone przez wdrożenie uczenia maszynowego, w tym zestawy danych SHAP i danych do zastosowania, będą zawierać poddane automatycznej inżynierii cechy daty.
Poddane automatycznej inżynierii cechy daty w predykcjach w czasie rzeczywistym
Aby punkt końcowy predykcji w czasie rzeczywistym interfejsu Machine Learning API mógł przetwarzać pola daty i znaczników czasu, ładunek JSON wysyłany do tego punktu końcowego musi spełniać poniższe wymagania:
-
Wartości daty oraz daty i godziny muszą być ciągami znaków sformatowanymi zgodnie ze standardami ISO 8601. Przykłady:
-
2020-01-14
-
2020-01-14T00:00:00.000Z
-
-
Data nadrzędna—cecha, z której pochodziły części daty—musi być uwzględniona w całości. Na przykład, Twój model może używać tylko cechy Year, ale nadal musisz podać datę w formacie zgodnym z ISO 8601.
-
Dane w każdej kolumnie muszą pochodzić z tej samej strefy czasowej.
API predykcji w czasie rzeczywistym jest przestarzałe i zostało zastąpione przez punkt końcowy predykcji w czasie rzeczywistym w API uczenia maszynowego. Sama funkcjonalność nie została wycofana. Do predykcji w czasie rzeczywistym należy używać w przyszłości punktu końcowego predykcji w czasie rzeczywistym w API uczenia maszynowego. Aby uzyskać pomoc w migracji z API prognoz w czasie rzeczywistym do API uczenia maszynowego, zapoznaj się z przewodnikiem po migracji na portalu dla deweloperów Qlik Cloud.