Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Inżynieria cechy daty

Qlik Predict generuje cechy przy użyciu automatycznej inżynierii z kwalifikujących się kolumn z typem cechy data, które zostały zidentyfikowane jako zawierające informacje o dacie i godzinie. Cechy daty uzyskane w wyniku automatycznej inżynierii oraz cechy nadrzędne, z których pochodzą, są oznaczone ikoną Poddane automatycznej inżynierii.

Kiedy Qlik Cloud Analytics profiluje zestaw danych do uczenia wybrany do użycia w Qlik Predict, łączy pewne typy danych z typem cechy data. Obejmuje to następujące typy danych:

  • Data

  • DATETIME

  • Czas

  • Znacznik czasu

Cechom, którym podczas profilowania zostanie przypisany którykolwiek z tych typów danych, przypisywany jest typ cechy data. Aby uzyskać informacje na temat dostępnych statystyk profilu, które można przeglądać dla pól danych, zobacz temat Widok listy.

Jeśli to możliwe, Qlik Predict wyświetla listę cech uzyskanych w wyniku automatycznej inżynierii, które można utworzyć z kwalifikujących się cech nadrzędnych mających typ cechy data. Cechy uzyskane w wyniku automatycznej inżynierii są domyślnie uwzględniane w eksperymencie. Jeśli zdecydujesz się je uwzględnić, nowe cechy zostaną wygenerowane po wersji 1 eksperymentu.

InformacjaZaleca się ponowne uczenie modeli uczonych przed 29 sierpnia 2023 r., jeśli zawierają cechy obejmujące daty lub znaczniki czasu.

Cechy uzyskane w wyniku automatycznej inżynierii mają typ liczbowy. Są one domyślnie uwzględniane w eksperymencie, ale opcjonalne. Możesz usunąć niektóre lub wszystkie z nich przed rozpoczęciem uczenia w ramach eksperymentu lub podczas konfigurowania kolejnej wersji eksperymentu. Jeśli uzyskane w wyniku automatycznej inżynierii cechy typu data zostaną uwzględnione, oryginalna nadrzędna cecha typu data zostanie usunięta z eksperymentu.

Zamiast tego można dołączyć cechę daty nadrzędnej jako cechę kategorialnną lub numeryczną. Gdy to zrobisz, poddane automatycznej inżynierii cechy daty przestaną być użyteczne. W większości przypadków zaleca się korzystanie w eksperymencie z dostępnych cech uzyskanych w wyniku automatycznej inżynierii, ponieważ zapewniają one lepszą wydajność modeli uczenia maszynowego. Mogą jednak wystąpić sytuacje, w których kolumna zidentyfikowana jako cecha daty musi być traktowana jako kategorialna lub numeryczna. W takich przypadkach można ręcznie zmienić typ cechy.

Cechy typu data uzyskane w wyniku automatycznej inżynierii nie są wliczane do wielkości zestawu danych Qlik Predict (maksymalnej liczby komórek w zestawach danych do uczenia i stosowania) określonej w subskrypcji Qlik Cloud. Liczone są tylko oryginalne komórki kolumny daty.

Widok schematu przedstawiający cechy uzyskane w wyniku inżynierii automatycznej, które można wygenerować na podstawie nadrzędnej cechy typu data „Invoice Date”. Zwróć uwagę na różnicę między typem danych i typem cechy każdej z cech.

Widok schematu w szkoleniu w ramach eksperymentu, pokazujący cechę nadrzędną zidentyfikowaną jako cecha typu data wraz z możliwymi, uzyskanymi w wyniku automatycznej inżynierii cechami, które można z niej utworzyć.

Używanie cechy typu data jako celu eksperymentu

W rzadkich przypadkach, gdy jako celu eksperymentu chcesz użyć cechy zawierającej informacje o dacie i godzinie, typ cechy w kolumnie zostanie zmieniony z daty na kategorialny, a cechy uzyskane w wyniku inżynierii automatycznej zostaną usunięte. Jeżeli wybierzesz inny cel, a później zechcesz dodać cechę daty i godziny jako zwykłą cechę, w razie potrzeby trzeba będzie ją zmienić z powrotem na typ cechy data i godzina ręcznie. Jeśli przywrócisz typ cechy data, uzyskane w wyniku inżynierii automatycznej cechy typu data zostaną wygenerowane ponownie.

Aby uzyskać więcej informacji na temat zmiany typów cech, zobacz temat Zmiana typów danych cech.

Dostępne cechy poddawane automatycznej inżynierii

Podczas generowania uzyskiwanych w wyniku inżynierii automatycznej cech typu data z kolumny w zestawie danych Qlik Predict wyodrębnia i oblicza określone składniki każdej wartości typu data oraz data i godzina, izolując każdy składnik w osobnej kolumnie. Poniższa tabela zawiera listę cech uzyskiwanych w wyniku inżynierii automatycznej, które mogą być generowane przez Qlik Predict.

Lista cech uzyskiwanych w wyniku inżynierii automatycznej, które można wyprowadzić z cechy typu data i godzina
Cecha poddana automatycznej inżynierii Typ danych Typ cechy Opis
ROK Liczba całkowita Liczbowe Pole roku uzyskane w wyniku bezpośredniej analizy źródłowej daty lub znacznika czasu.
MIESIĄC Liczba całkowita Liczbowe Pole miesiąca uzyskane w wyniku bezpośredniej analizy źródłowej daty lub znacznika czasu.
DZIEŃ Liczba całkowita Liczbowe Pole dnia uzyskane w wyniku bezpośredniej analizy źródłowej daty lub znacznika czasu.
GODZINA Liczba całkowita Liczbowe Pole godziny uzyskane w wyniku bezpośredniej analizy źródłowego znacznika czasu.
MINUTA Liczba całkowita Liczbowe Pole minuty uzyskane w wyniku bezpośredniej analizy źródłowego znacznika czasu.
SEKUNDA Liczba całkowita Liczbowe Pole sekundy uzyskane w wyniku bezpośredniej analizy źródłowego znacznika czasu.
DZIEŃTYGODNIA Liczba całkowita Liczbowe Dzień tygodnia obliczony ze źródłowego dnia, miesiąca i roku.
TYDZIEŃ Liczba całkowita Liczbowe Tydzień roku obliczony ze źródłowego dnia, miesiąca i roku.

Dla każdej nowo utworzonej cechy do oryginalnej nazwy kolumny dodawany jest sufiks odpowiedniej cechy uzyskanej w wyniku inżynierii automatycznej.

Uzyskane w wyniku inżynierii automatycznej cechy typu data w panelu konfiguracji eksperymentu

Sekcja Cechy w panelu konfiguracji eksperymentu, pokazująca cechy uzyskane w wyniku inżynierii automatycznej.

Automatycznie generowane cechy daty i modele szeregów czasowych

Kiedy wybierzesz kolumnę indeksu daty dla eksperymentu szeregów czasowych, typ cechy daty jest używany dla tej kolumny. Jednakże, inżynieria cech daty nie jest obsługiwana dla modeli szeregów czasowych. Automatycznie zaprojektowane cechy daty nie są dostępne do wyprowadzenia z kolumny.

Aby uzyskać więcej informacji na temat modeli szeregów czasowych, zobacz Praca z eksperymentami szeregów czasowych i Praca z prognozowaniem wielowymiarowych szeregów czasowych.

Cechy typu data uzyskane w wyniku inżynierii automatycznej w predykcjach

Aby uzyskać informacje na temat pracy z cechami typu data podczas uruchamiania predykcji, zobacz Praca z cechami dat w predykcjach.

Dowiedz się więcej

 

Cechy typu data uzyskane w wyniku inżynierii automatycznej w predykcjach

Cechy typu data uzyskane w wyniku inżynierii automatycznej są generowane podczas korzystania z zestawu danych do uczenia w celu utworzenia modelu, który jest wdrażany i używany jako wdrożenie uczenia maszynowego w celu przewidywania nowych danych (zestaw danych do zastosowania).

Jeśli do tworzenia predykcji zostanie wdrożony model uczony przy użyciu cech typu data uzyskanych w wyniku inżynierii automatycznej, zestaw danych do zastosowania, na podstawie którego generowane są prognozy, nie musi zawierać cech typu data uzyskanych w wyniku inżynierii automatycznej. Qlik Predict generuje cechy uzyskiwane w wyniku inżynierii automatycznej dla zestawu danych do zastosowania przed tworzeniem predykcji. Zestaw danych do zastosowania musi jednak zawierać nadrzędną cechę daty, a kolumna musi być profilowana jako mająca typ danych Data, Data i godzina, Znacznik czasu lub Czas.

Zestawy danych predykcyjnych utworzone przez wdrożenie uczenia maszynowego, w tym zestawy danych SHAP i danych do zastosowania, będą zawierać poddane automatycznej inżynierii cechy daty.

Poddane automatycznej inżynierii cechy daty w predykcjach w czasie rzeczywistym

Aby punkt końcowy predykcji w czasie rzeczywistym interfejsu Machine Learning API mógł przetwarzać pola daty i znaczników czasu, ładunek JSON wysyłany do tego punktu końcowego musi spełniać poniższe wymagania:

  • Wartości daty oraz daty i godziny muszą być ciągami znaków sformatowanymi zgodnie ze standardami ISO 8601. Przykłady:

    • 2020-01-14

    • 2020-01-14T00:00:00.000Z

  • Data nadrzędna—cecha, z której pochodziły części daty—musi być uwzględniona w całości. Na przykład, Twój model może używać tylko cechy Year, ale nadal musisz podać datę w formacie zgodnym z ISO 8601.

  • Dane w każdej kolumnie muszą pochodzić z tej samej strefy czasowej.

InformacjaDane używane do uczenia modelu nie muszą spełniać tych wymagań.
Informacja

API predykcji w czasie rzeczywistym jest przestarzałe i zostało zastąpione przez punkt końcowy predykcji w czasie rzeczywistym w API uczenia maszynowego. Sama funkcjonalność nie została wycofana. Do predykcji w czasie rzeczywistym należy używać w przyszłości punktu końcowego predykcji w czasie rzeczywistym w API uczenia maszynowego. Aby uzyskać pomoc w migracji z API prognoz w czasie rzeczywistym do API uczenia maszynowego, zapoznaj się z przewodnikiem po migracji na portalu dla deweloperów Qlik Cloud.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!