Inżynieria cech daty | Qlik Cloud Pomoc
Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Inżynieria cech daty

Qlik Predict generuje automatycznie opracowane cechy z kwalifikujących się kolumn o typie cechy daty, które zostały zidentyfikowane jako zawierające informacje o dacie i godzinie. Automatycznie opracowane cechy daty oraz cechy nadrzędne, z których pochodzą, są oznaczone ikoną Automatycznie opracowane.

Gdy Qlik Cloud Analytics profiluje zbiór danych treningowych wybrany do użycia w Qlik Predict, łączy określone typy danych z typem cechy daty. Obejmuje to następujące typy danych:

  • Data

  • Data i godzina

  • Godzina

  • Znacznik czasu

Cechom, którym podczas profilowania przypisano dowolny z tych typów danych, nadawany jest typ cechy daty. Informacje o dostępnych statystykach profilu, które można wyświetlić dla pól danych, zawiera sekcja Widok listy.

Jeśli to możliwe, Qlik Predict wyświetla listę automatycznie opracowanych cech daty, które można utworzyć z kwalifikujących się cech nadrzędnych o typie cechy daty. Automatycznie opracowane cechy daty są domyślnie uwzględniane w eksperymencie. Jeśli zdecydujesz się je uwzględnić, nowe cechy zostaną wygenerowane po wersji v1 eksperymentu.

InformacjaZaleca się ponowne wytrenowanie modeli wytrenowanych przed 29 sierpnia 2023 r., jeśli zawierają one cechy obejmujące daty lub znaczniki czasu.

Automatycznie opracowane cechy daty mają numeryczny typ cechy. Są one domyślnie uwzględniane w eksperymencie, ale są opcjonalne. Możesz usunąć niektóre lub wszystkie z nich przed rozpoczęciem trenowania eksperymentu lub podczas konfigurowania kolejnej wersji eksperymentu. Gdy automatycznie opracowane cechy daty są uwzględnione, oryginalna nadrzędna cecha daty jest usuwana z eksperymentu.

Zamiast tego możesz uwzględnić nadrzędną cechę daty jako cechę kategoryczną lub numeryczną. W takim przypadku automatycznie opracowane cechy daty nie będą już mogły być używane. W większości przypadków zaleca się korzystanie z dostępnych automatycznie opracowanych cech w eksperymencie, ponieważ zapewniają one lepszą wydajność modeli uczenia maszynowego. Mogą jednak wystąpić scenariusze, w których kolumna zostanie zidentyfikowana jako cecha daty, ale konieczne będzie traktowanie jej jako kategorycznej lub numerycznej. W takich przypadkach można ręcznie zmienić typ cechy.

Automatycznie opracowane cechy daty nie wliczają się do rozmiaru zbioru danych Qlik Predict (maksymalnej liczby komórek w zbiorach danych treningowych i zbiorach danych stosowania) określonego w subskrypcji Qlik Cloud. Liczone są tylko komórki oryginalnej kolumny daty.

Widok schematu przedstawiający automatycznie opracowane cechy, które można wygenerować z nadrzędnej cechy daty „Invoice Date”. Zwróć uwagę na różnicę między wartościami Typ danych i Typ cechy dla każdej cechy.

Widok schematu w trenowaniu eksperymentu, przedstawiający cechę nadrzędną zidentyfikowaną jako cecha daty wraz z możliwymi automatycznie opracowanymi cechami, które można z niej utworzyć. Dla każdej cechy (kolumny) w zbiorze danych zdefiniowany jest „Typ cechy”, który różni się od wartości „Typ danych” wyświetlanej dla każdej cechy (kolumny), ale może być od niej zależny

Używanie cechy daty jako celu eksperymentu

W rzadkich przypadkach, gdy chcesz użyć cechy zawierającej informacje o dacie i godzinie jako celu eksperymentu, typ cechy kolumny zostanie przełączony z daty na kategoryczny, a automatycznie opracowane cechy zostaną usunięte. Jeśli wybierzesz inny cel, a później zechcesz dodać cechę daty i godziny jako zwykłą cechę, w razie potrzeby musisz ręcznie zmienić jej typ z powrotem na typ cechy daty. Jeśli przywrócisz typ cechy daty, automatycznie opracowane cechy daty zostaną wygenerowane ponownie.

Więcej informacji o sposobie zmiany typów cech zawiera sekcja Zmiana typów cech.

Dostępne automatycznie opracowane cechy daty

Podczas generowania automatycznie opracowanych cech daty z kolumny w zbiorze danych Qlik Predict wyodrębnia i oblicza określone składniki każdej wartości daty oraz daty i godziny, izolując każdy składnik w osobnej kolumnie. Poniższa tabela zawiera listę automatycznie opracowanych cech, które mogą być generowane przez Qlik Predict.

Lista automatycznie opracowanych cech, które można uzyskać z cechy daty i godziny
Automatycznie opracowana cecha Typ danych Typ cechy Opis
YEAR Integer Numeric Pole roku przeanalizowane bezpośrednio z daty źródłowej lub znacznika czasu.
MONTH Integer Numeric Pole miesiąca przeanalizowane bezpośrednio z daty źródłowej lub znacznika czasu.
DAY Integer Numeric Pole dnia przeanalizowane bezpośrednio z daty źródłowej lub znacznika czasu.
HOUR Integer Numeric Pole godziny przeanalizowane bezpośrednio ze źródłowego znacznika czasu.
MINUTE Integer Numeric Pole minuty przeanalizowane bezpośrednio ze źródłowego znacznika czasu.
SECOND Integer Numeric Pole sekundy przeanalizowane bezpośrednio ze źródłowego znacznika czasu.
DAYOFWEEK Integer Numeric Dzień tygodnia, obliczony na podstawie źródłowego dnia, miesiąca i roku.
WEEK Integer Numeric Tydzień roku, obliczony na podstawie źródłowego dnia, miesiąca i roku.

Dla każdej nowo utworzonej cechy do oryginalnej nazwy kolumny dodawany jest sufiks z odpowiednią automatycznie opracowaną cechą.

Automatycznie opracowane cechy daty w panelu konfiguracji eksperymentu

Sekcja cech w panelu konfiguracji eksperymentu, przedstawiająca automatycznie opracowane cechy.

Automatycznie opracowane cechy daty i modele szeregów czasowych

Kiedy wybierzesz kolumnę indeksu daty dla eksperymentu szeregów czasowych, typ cechy daty jest używany dla tej kolumny. Jednakże, inżynieria cech daty nie jest obsługiwana dla modeli szeregów czasowych. Automatycznie zaprojektowane cechy daty nie są dostępne do wyprowadzenia z kolumny.

Więcej informacji o modelach szeregów czasowych zawierają sekcje Praca z eksperymentami szeregów czasowych oraz Praca z prognozowaniem szeregów czasowych wielu zmiennych.

Automatycznie opracowane cechy daty w predykcjach

Informacje o sposobie pracy z cechami daty podczas uruchamiania predykcji zawiera sekcja Praca z cechami dat w predykcjach.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!