Tworzenie predykcji z zestawu danych
Wdrożenie uczenia maszynowego możesz wykorzystać do przewidywania przyszłych wyników na podstawie nowych danych. W przypadku predykcji zbiorczych użytkownik tworzy konfiguracje predykcji w ramach wdrożenia uczenia maszynowego, a następnie używa ich do generowania predykcji jako zestawów danych. W wygenerowanych zestawach danych każdy wiersz zawiera przewidywaną wartość dla tego konkretnego wiersza. W przypadku predykcji zbiorczych jest generowana predykcja dla każdego wiersza w zestawie danych do zastosowania.
Aby rozpocząć tworzenie konfiguracji predykcji, otwórz wdrożenie uczenia maszynowego i przejdź do panelu Predykcje zestawu danych. Zobacz temat Nawigacja po interfejsie wdrożenia uczenia maszynowego..
W przypadku predykcji zbiorczych można tworzyć predykcje na podstawie zestawów danych w katalogu, na przykład codzienne predykcje dotyczące nowych transakcji. Predykcji można zamiast tego dokonywać w czasie rzeczywistym przy użyciu punktu końcowego predykcji w czasie rzeczywistym w Machine Learning API. Informacje na temat predykcji w czasie rzeczywistym zawiera temat Tworzenie predykcji w czasie rzeczywistym.
API predykcji w czasie rzeczywistym jest przestarzałe i zostało zastąpione przez punkt końcowy predykcji w czasie rzeczywistym w Machine Learning API. Sama funkcjonalność nie została wycofana. Do predykcji w czasie rzeczywistym należy używać w przyszłości punktu końcowego predykcji w czasie rzeczywistym w Machine Learning API.
Predykcje są generowane w zestawie danych z predykcjami i — w przypadku modeli klasyfikacyjnych — kolumną z prawdopodobieństwem każdej klasy. Opcjonalnie można również generować zestawy danych z wartościami SHAP lub błędami oraz kopią zestawu danych do zastosowania. Zestawy danych mogą być w formacie Parquet, CSV lub QVD.
Podczas generowania predykcji można załadować wnioski predykcyjne do aplikacji Qlik Sense. Umożliwia to wizualizację danych i interakcję z nimi oraz tworzenie scenariuszy „co by było, gdyby”.
Zanim rozpoczniesz
Przed rozpoczęciem generowania predykcji za pomocą wdrożenia uczenia maszynowego należy aktywować model źródłowy. Więcej informacji zawiera temat Zatwierdzanie wdrożonych modeli.
Główne pojęcia
Zestaw danych do zastosowania
Podczas uczenia eksperymentu wdraża się model używany do generowania predykcji na podstawie nowego zestawu danych. Ten zestaw danych nazywany jest zestawem danych do zastosowania. Predykcje są generowane w zestawie danych z predykcjami i — w przypadku modeli klasyfikacyjnych — kolumną z prawdopodobieństwem każdej klasy. Opcjonalnie można również generować zestawy danych z wartościami SHAP lub błędami.
W Qlik AutoML jest obsługiwany każdy plik płaski, który można przesłać i sprofilować w Qlik Cloud.
W przypadku plików z wieloma tabelami, takich jak pliki programu Microsoft Excel z wieloma arkuszami, zaimportowana zostanie tylko pierwsza tabela. Jeśli profilowanie danych nie powiedzie się w przypadku tabeli (na przykład, kiedy jest pusta), plik nie jest obsługiwany.
Zestaw danych do zastosowania musi mieć te same cechy i typy danych co zestaw danych używany do uczenia wdrożenia uczenia maszynowego. Kolumna celu określona w eksperymencie uczenia maszynowego nie musi być uwzględniona w zestawie danych do zastosowania. Należy zauważyć, że dodatkowe kolumny, które nie były uwzględniane w uczeniu modelu, mogą nadal znajdować się w zestawie danych do zastosowania. AutoML po prostu zignoruje te dodatkowe kolumny podczas generowania predykcji.
Konfiguracja predykcji
Zestawy danych do predykcji są generowane na podstawie konfiguracji predykcji. Każde wdrożenie uczenia maszynowego może mieć wiele konfiguracji predykcji. Konfigurację predykcji można ustawić tak, aby działała z harmonogramem lub bez niego.
Własność konfiguracji predykcji
Gdy użytkownik tworzy konfigurację predykcji, jest mu przypisywana automatycznie rola jej właściciela.
Na poniższej liście znajdują się wymagania dotyczące dostępu związane z uruchamianiem konfiguracji przewidywania. Jeśli predykcja jest uruchamiana ręcznie, wymagania musi spełniać dany użytkownik. W przypadku zaplanowanych predykcji wymagania musi spełniać właściciel konfiguracji predykcji.
Uprawnienie profesjonalne lub Full User i rola Automl Deployment Contributor w dzierżawie. Zobacz: Kto może pracować z Qlik AutoML
Wymagane uprawnienia w przestrzeni do uruchamiania predykcji z wdrożenia uczenia maszynowego.
Wymagane uprawnienia do tworzenia źródeł danych w przestrzeni, w której zapisywane są dane predykcyjne.
Może się zdarzyć, że właściciel konfiguracji predykcji utraci dostęp do dzierżawy lub przestanie spełniać inne wymagania dotyczące pracy z wdrożeniami uczenia maszynowego. W takim przypadku użytkownik z wymaganymi uprawnieniami może kliknąć Ustaw mnie jako właściciela, aby przejąć na własność zaplanowaną predykcję i umożliwić jej uruchomienie. Robi się to w panelu konfiguracji predykcji lub wybierając odpowiednie działanie w oknie Predykcje zestawu danych.
Informacje na temat wymagań dotyczących uprawnień do przestrzeni w kontekście dowolnych działań wymienionych w tej sekcji zawierają tematy Zarządzanie uprawnieniami w przestrzeniach udostępnionychi Zarządzanie uprawnieniami w przestrzeniach zarządzanych.
Automatyczna inżynieria cech
Informacje o generowaniu predykcji za pomocą modeli uczonych przy użyciu automatycznej inżynierii cech zawiera temat Automatyczna inżynieria cech.
Uwagi dotyczące zestawów danych do zastosowania
Wpływ ręcznej zmiany typu cechy
Po ręcznej zmianie typu cechy, a następnie wdrożeniu modelu wynikowego nadpisanie typu cechy zostanie zastosowane do cechy w zestawie danych do zastosowania, który jest używany do predykcji wykonywanych przy użyciu tego modelu.
Wymagania i uprawnienia
Więcej informacji na temat wymagań dotyczących uprawnień w kontekście pracy z wdrożeniami i predykcjami uczenia maszynowego zawiera temat Praca z predykcjami uczenia maszynowego.
Tworzenie nowych predykcji zbiorczych
Nowe konfiguracje predykcji można tworzyć zarówno w panelu Przegląd wdrożenia, jak i w panelu Predykcje zestawu danych.
Wykonaj następujące czynności:
Otwórz wdrożenie uczenia maszynowego z katalogu.
W prawym dolnym rogu kliknij Utwórz predykcję.
W panelu Konfiguracja predykcji rozwiń Dane do zastosowania modelu i kliknij opcję Wybierz zestaw danych do zastosowania.
Wybierz zestaw danych, dla którego chcesz wygenerować predykcje. Zestaw danych musi mieć takie same cechy i typy danych jak Schemat modelu.
Zestawy danych można przesyłać ze strony Utwórz centrum aktywności Analytics. Możesz również przesłać nowy zestaw danych bezpośrednio do Katalogu ze strony wyboru zestawu danych do predykcji. Ten zestaw danych zostanie następnie automatycznie wybrany jako zestaw danych do wykorzystania w predykcji. Aby to zrobić, kliknij Dodaj zestaw danych do zastosowania i wybierz plik do przesłania.
W obszarze Zestaw danych predykcyjnych kliknij opcję Nazwij zestaw danych predykcyjnych.
Wprowadź nazwę (lub zaakceptuj nazwę domyślną).
Qlik AutoML obsługuje dynamiczne nazewnictwo plików zestawów danych predykcji. Więcej informacji zawiera temat Używanie zmiennych w nazwach plików zestawu danych predykcji.
Wybierz format dla generowanych zestawów danych. Domyślnym formatem jest Parquet. Zestawy danych mogą być również generowane w formacie CSV lub QVD.
Wybierz przestrzeń.
Kliknij Potwierdź.
W obszarze Opcje predykcji wybierz dodatkowe zestawy danych, które chcesz wygenerować.
Zestaw danych Błędy: wygeneruj zestaw danych z błędami rekordów w zestawie danych do zastosowania. Dzięki temu można się dowiedzieć, czy rekord został usunięty i z jakiego powodu.
SHAP: wygeneruj zestaw danych z wartościami SHAP dla każdego rekordu. Zestaw danych ma kolumny index i <feature>_SHAP dla każdej cechy w modelu.
InformacjaTa opcja jest niedostępna w przypadku predykcji z modeli klasyfikacji wieloklasowej. W przypadku tych modeli można zamiast tego użyć opcji Koordynuj SHAP.Koordynuj SHAP: wygeneruj zestaw danych z wartościami SHAP dla każdego rekordu. Daje to te same wartości co zestaw danych SHAP, ale inaczej uporządkowane. Zestaw danych ma kolumny index, automl_feature i SHAP_value. Dodatkowa kolumna Predicted_class zawiera predykcje z wieloklasowego modelu klasyfikacji.
Wybierz, czy chcesz automatycznie generować kolumnę indeksu, czy użyć istniejącej kolumny w zestawie danych do zastosowania.
Możesz także uruchomić predykcję zgodnie z harmonogramem. W obszarze Harmonogram predykcji kliknij Utwórz harmonogram i dostosuj ustawienia w wyświetlonym oknie dialogowym. Więcej informacji zawiera temat Planowanie predykcji.
Kliknij przycisk Zapisz i zamknij, aby zapisać konfigurację predykcji i powrócić do panelu Predykcje zestawu danych bez uruchamiania predykcji. Możesz preferować tę opcję, jeśli chcesz, aby predykcje były uruchamiane tylko zgodnie z harmonogramem.
Zamiast tego można kliknąć ikonę
obok pozycji Zapisz i zamknij. Wybierz Zapisz i przewiduj teraz. Powoduje to zapisanie konfiguracji predykcji i ręczne uruchomienie predykcji.
Kiedy Ostatni status pokazuje „Powodzenie”, predykcje są ukończone.
Przejdź do katalogu, aby zobaczyć wygenerowane zestawy danych.
Edytowanie konfiguracji predykcji
Istniejące konfiguracje predykcji można edytować w panelu Predykcje zestawu danych.
Wykonaj następujące czynności:
W panelu Predykcje zestawu danych kliknij ... na konfiguracji predykcji, którą chcesz edytować.
Wybierz opcję Edytuj konfigurację predykcji z menu Działania.
W okienku Konfiguracja predykcji możesz edytować następujące sekcje:
Dane do zastosowania modelu: zestaw danych do zastosowania można zmienić.
Zestaw danych predykcyjnych: nazwę i przestrzeń zestawu danych predykcyjnych można zmienić.
Opcje predykcji: wybory dodatkowych generowanych zestawów danych można zmienić.
Harmonogram predykcji: jeśli chcesz, możesz ustawić harmonogram, według którego będzie uruchamiana Twoja predykcja. Więcej informacji zawiera temat Planowanie predykcji.
Kliknij przycisk Zapisz i zamknij, aby zapisać konfigurację predykcji i powrócić do panelu Predykcje zestawu danych bez uruchamiania predykcji.
Zamiast tego można kliknąć ikonę
obok pozycji Zapisz i zamknij. Wybierz Zapisz i przewiduj teraz. Powoduje to zapisanie konfiguracji predykcji i ręczne uruchomienie predykcji.
Kiedy Ostatni status pokazuje „Powodzenie”, predykcje są ukończone.
Uruchamianie predykcji zbiorczych
Predykcje związane z istniejącymi konfiguracjami predykcji można edytować w panelu Predykcje zestawu danych. Zamiast tego możesz uruchomić swoje predykcje zgodnie z dostosowywanym harmonogramem. Możesz łączyć ręczne i zaplanowane przebiegi predykcji, aby jak najlepiej dopasować je do swoich potrzeb.
Ręczne uruchamianie predykcji
Konfigurację predykcji można rozpocząć bezpośrednio, wybierając tę opcję w menu kontekstowym w panelu Predykcje zestawu danych.
Aby użytkownik mógł ręcznie uruchomić prognozę, musi spełniać wymagania dotyczące dostępu do danego działania. Zobacz temat Własność konfiguracji predykcji.
Wykonaj następujące czynności:
W panelu Predykcje zestawu danych kliknij ... na konfiguracji predykcji, które chcesz uruchamiać.
Wybierz opcję Uruchom predykcje teraz z menu Czynności, aby rozpocząć generowanie predykcje.
Kiedy Ostatni status pokazuje „Powodzenie”, predykcje są ukończone.
Planowanie predykcji
Predykcje można ustawić tak, aby uruchamiały się automatycznie na podstawie harmonogramu. Możesz utworzyć jeden harmonogram dla każdej utworzonej konfiguracji predykcji. Dostęp do menu Harmonogram predykcji można uzyskać podczas tworzenia lub edytowania konfiguracji predykcji.
Aby zaplanowana predykcja została uruchomiona pomyślnie, właściciel konfiguracji predykcji musi spełnić kilka wymagań dotyczących uprawnień. W przeciwnym razie nie będzie można uruchomić predykcji. Więcej informacji zawiera temat Własność konfiguracji predykcji.
Okno dialogowe Harmonogram predykcji umożliwia określenie następujących parametrów harmonogramu:
Uruchom predykcje: dostosuj ogólny harmonogram, zgodnie z którym będzie uruchamiana predykcja (codziennie, co tydzień lub co miesiąc). Ustaw interwał, dzień tygodnia lub dzień miesiąca w zależności od dokonanego wyboru.
Czas: skonfiguruj porę dnia, o której będzie uruchamiana predykcja.
Jeśli planujesz według godzin (w przypadku prognoz dziennych lub tygodniowych), będzie można również określić czas rozpoczęcia i zakończenia, pomiędzy którymi będą uruchamiane predykcje.
Data rozpoczęcia: ustaw datę, od której zacznie obowiązywać harmonogram predykcji.
Data zakończenia: ustaw datę, kiedy predykcje przestaną być uruchamiane zgodnie z harmonogramem. Harmonogram będzie domyślnie działać w nieskończoność, ale możesz określić datę końcową harmonogramu.
Uruchom tylko w razie zmiany zestawu danych do zastosowania: jeśli od czasu uruchomienia ostatniej predykcji nie wprowadzono żadnych zmian w zestawie danych aplikacji, zaplanowana predykcja nie zostanie uruchomiona. Możesz wyłączyć to ustawienie, jeśli chcesz zawsze uruchamiać zaplanowaną predykcję niezależnie od zmian w danych.
Usuwanie konfiguracji predykcji
Istniejące konfiguracje predykcji można usuwać w panelu Predykcje zestawu danych.
Wykonaj następujące czynności:
W panelu Predykcje zestawu danych kliknij ... na konfiguracji predykcji, którą chcesz usunąć.
Wybierz opcję Usuń konfigurację predykcji z menu Działania.
Kliknij Usuń, aby potwierdzić.
Zarządzanie zadaniami predykcji
Administratorzy dzierżawy mogą zatrzymywać lub anulować zadania predykcji z centrum aktywności Administrowanie. Więcej informacji zawiera temat Administrowanie Qlik AutoML.
Konfigurowanie powiadomień
Możesz otrzymywać powiadomienia, kiedy predykcje zostaną utworzone z wdrożenia uczenia maszynowego. Więcej informacji zawiera temat Konfigurowanie powiadomień dla Qlik AutoML.
Wyświetlanie szczegółów zdarzeń dryfu danych i predykcji
Po uruchomieniu predykcji przejdź do panelu Monitorowanie dryfu danych, aby wyświetlić następujące szczegóły:
Poziom dryfu danych dla każdej cechy w zestawie danych do zastosowania. Porównanie jest dokonywane między zestawem danych do zastosowania a zestawem danych do uczenia.
Szczegółowe informacje o zdarzeniu predykcji, takie jak powodzenie lub niepowodzenie oraz liczba wygenerowanych predykcji.
Więcej informacji zawiera temat Monitorowanie wydajności i wykorzystania wdrożonych modeli.