Automatyczna inżynieria cech
Dzięki automatycznej inżynierii cech Qlik Predict może wykorzystywać istniejące cechy w danych do uczenia w celu tworzenia nowych cech. Te nowe, uzyskane w wyniku automatycznej inżynierii cechy umożliwiają odkrywanie nowych wzorców w danych i mogą znacznie poprawić wydajność modeli uczenia maszynowego. Qlik Predict obsługuje inżynierię cech daty i inżynierię cech tekstu swobodnego.
Tło
Inżynieria cech to proces tworzenia nowych kolumn cech z bieżących. Qlik Predict może automatycznie dokonywać inżynierii cech w celu lepszej obsługi niektórych typów danych. Aby uzyskać ogólne informacje na temat inżynierii cech, zobacz temat Tworzenie nowych kolumn cech.
Identyfikowanie, kiedy możliwa jest automatyczna inżynieria cech
Po wybraniu zbioru danych do wykorzystania w eksperymencie zestaw danych jest analizowany, a zawarte w nim kolumny identyfikowane jako zawierające określone typy danych. Te typy danych umożliwiają Qlik Predict przypisanie typu cechy do każdej kolumny w zestawie danych. Każdej kolumnie jest przypisany jeden z następujących typów cech:
-
Kategorialne
-
Liczbowe
-
Data
-
Dowolny tekst
Jeśli to możliwe, Qlik Predict wyświetla listę cech uzyskanych w wyniku automatycznej inżynierii, które można utworzyć z kwalifikujących się cech nadrzędnych. Ta lista cech uzyskiwanych w wyniku automatycznej inżynierii jest dalej udoskonalana i zawężana, gdy rozpoczyna się przetwarzanie wstępne. Uwzględnianie w eksperymencie cech uzyskanych w wyniku automatycznej inżynierii jest zalecane, ale opcjonalne. Poszczególne cechy uzyskane w wyniku automatycznej inżynierii można usunąć przed rozpoczęciem uczenia i podczas konfigurowania każdej nowej wersji eksperymentu.
Aby uzyskać więcej informacji na temat procesów wykonywanych przed rozpoczęciem uczenia w ramach eksperymentu, zobacz temat Automatyczne przygotowanie i przekształcanie danych.
Inżynieria cechy daty
Gdy w danych treningowych zostaną wykryte kolumny daty i daty/godziny, nowe cechy daty mogą zostać automatycznie utworzone z tych kolumn. Więcej informacji zawiera temat Inżynieria cechy daty.
Obsługa tekstu swobodnego
Specjalna obsługa danych tekstowych swobodnych jest obsługiwana podczas trenowania modeli. Więcej informacji zawiera temat Obsługa danych typu dowolny tekst.