Dopracowywanie modeli
Po utworzeniu początkowych modeli ważne jest ich dopracowanie w celu zwiększenia ich efektywności i potencjalnej dokładności. Wyniki modeli wskazują na różne miary tej wydajności. Choć celem dopracowywania modeli jest zwiększenie tych wyników, wyższy wynik nie zawsze oznacza lepszy model.
Możesz dopracować swoje modele, wykluczając lub dołączając cechy, zmieniając dane treningowe i modyfikując inne parametry konfiguracji. W ten sposób możesz porównać różne wersje, aby zobaczyć, jaki wpływ mają Twoje zmiany.
Interpretując wyniki, dowiesz się, jak dopracować model. Wartości różnych metryk mogą dostarczyć wskazówek, jakie działania podjąć, aby poprawić rezultat.
Wymagania i uprawnienia
Aby dowiedzieć się więcej o wymaganiach użytkownika dotyczących pracy z eksperymentami ML, zapoznaj się z sekcją Praca z eksperymentami.
Konfigurowanie nowej wersji
Po uruchomieniu wersji eksperymentu możesz w razie potrzeby dopracować swoje modele, tworząc nową wersję.
Wykonaj następujące czynności:
-
Na karcie Dane treningowe, Modele lub Analizuj wybierz model, który ma posłużyć jako podstawa dla kolejnej wersji.
-
Kliknij Wyświetl konfigurację.
Otworzy się panel konfiguracji eksperymentu.
-
Kliknij Utwórz nową wersję.
Po utworzeniu nowej wersji możesz wprowadzić zmiany w jej konfiguracji, takie jak:
-
Wykluczanie istniejących cech
-
Dołączanie wcześniej wykluczonych cech
-
Zmiana lub odświeżanie zestawu danych
-
Wybieranie lub odznaczanie algorytmów
Więcej informacji na temat tych opcji znajduje się w sekcjach poniżej.
Podczas przygotowywania wersji roboczej nowej wersji kliknij ikonę filtru pod pozycją Cechy w panelu konfiguracji eksperymentu. Podczas filtrowania możesz łatwiej zwizualizować, które cechy zostały wprowadzone od czasu zmiany treningowego zestawu danych. Możesz także zobaczyć, które cechy są zaprojektowane automatycznie, a które nie.
Ulepszanie zestawu danych
Jeśli Twój model nie uzyskuje dobrych wyników, warto przejrzeć zestaw danych, aby rozwiązać ewentualne problemy. Przeczytaj więcej o tym, jak ulepszyć zestaw danych w sekcji Przygotowanie zestawu danych do trenowania.
Wykluczanie cech
Większa liczba cech niekoniecznie przekłada się na lepszy model. Aby dopracować model, należy wykluczyć niewiarygodne i nieistotne cechy, takie jak:
-
Cechy o zbyt wysokiej korelacji. Z dwóch skorelowanych cech wyklucz tę o mniejszym znaczeniu cechy.
-
Cechy o zbyt niskim znaczeniu cechy. Te cechy nie mają żadnego wpływu na to, czego próbujesz się dowiedzieć.
-
Cechy o zbyt wysokim znaczeniu cechy. Może to być spowodowane wyciekiem danych.
Przetestuj usunięcie cechy z danych treningowych, a następnie uruchom szkolenie ponownie i sprawdź, czy to poprawi model. Czy robi to dużą różnicę, czy nie ma żadnego wpływu na wynik modelu?
Wykonaj następujące czynności:
-
Otwórz eksperyment z poziomu Catalog.
-
Na karcie Dane treningowe, Modele lub Analizuj wybierz model, który ma posłużyć jako podstawa dla kolejnej wersji.
-
Kliknij Wyświetl konfigurację.
Otworzy się panel konfiguracji eksperymentu.
-
Kliknij Utwórz nową wersję, aby skonfigurować nową wersję eksperymentu.
-
W sekcji Cechy wyczyść pola wyboru dla wszystkich cech, których nie chcesz używać w szkoleniu.
Dodawanie cech
Jeśli Twój model nadal nie uzyskuje dobrych wyników, może to wynikać z faktu, że cechy mające związek z celem nie zostały jeszcze uwzględnione w zestawie danych. Możesz ponownie przetworzyć i dostosować zestaw danych, aby zoptymalizować jakość danych oraz dodać nowe cechy i informacje. Gdy nowy zestaw danych będzie gotowy, będzie można go dodać do przyszłych wersji eksperymentu. Zobacz Zmiana i odświeżanie zestawu danych.
Przeczytaj więcej o tym, jak przechwytywać lub projektować nowe cechy w sekcji Tworzenie nowych kolumn cech.
Zmiana ustawień wykrywania stronniczości
Możesz zmienić cechy, dla których ma być uruchamiane wykrywanie stronniczości. Na przykład, jeśli do zestawu danych dodano nowe cechy, możesz włączyć wykrywanie stronniczości dla tych cech.
Wykonaj następujące czynności:
-
Otwórz eksperyment z katalogu.
-
Na karcie Dane treningowe, Modele lub Analizuj wybierz model, który ma posłużyć jako podstawa dla kolejnej wersji.
-
Kliknij Wyświetl konfigurację.
Otworzy się panel konfiguracji eksperymentu.
-
Kliknij Utwórz nową wersję, aby skonfigurować nową wersję eksperymentu.
-
Rozwiń pozycję Stronniczość w panelu konfiguracji szkolenia.
-
Opcjonalnie kliknij Pobierz rekomendacje, aby użyć generatywnej sztucznej inteligencji do zasugerowania cech, które mogą zawierać stronnicze dane. Zobacz Wykorzystywanie generatywnej sztucznej inteligencji do rekomendowania cech do wykrywania stronniczości.
-
Zaznacz lub odznacz cechy, dla których chcesz uruchomić wykrywanie stronniczości.
Alternatywnie możesz skonfigurować ustawienia wykrywania stronniczości w Widok schematu.
Więcej informacji na temat wykrywania stronniczości znajduje się w sekcji Wykrywanie stronniczości w modelach uczenia maszynowego.
Wybieranie algorytmów
Na podstawie typu danych kolumny docelowej automatycznie wybierane są odpowiednie algorytmy do szkolenia. Możesz wykluczyć algorytmy, które nie działają tak dobrze lub są wolniejsze. W ten sposób nie musisz marnować na nie czasu podczas szkolenia.
Więcej informacji o sposobie wyboru algorytmów znajduje się w sekcji Omówienie algorytmów modeli.
Wykonaj następujące czynności:
-
Otwórz eksperyment z poziomu Catalog.
-
Na karcie Dane, Modele lub Analizuj wybierz model, który ma posłużyć jako podstawa dla kolejnej wersji.
-
Kliknij Wyświetl konfigurację.
Otworzy się panel konfiguracji eksperymentu.
-
Kliknij Utwórz nową wersję, aby skonfigurować nową wersję eksperymentu.
-
W sekcji Algorytmy wyczyść pola wyboru dla wszystkich algorytmów, których nie chcesz używać w szkoleniu.
Zmiana i odświeżanie zestawu danych
Jeśli Twoje dane treningowe uległy zmianie od czasu ostatniej wersji eksperymentu, możesz zmienić lub odświeżyć zestaw danych dla przyszłych wersji eksperymentu.
Może to być pomocne, jeśli chcesz porównać metryki i wydajność modeli dla różnych zestawów danych w ramach tego samego eksperymentu. Na przykład jest to pomocne, jeśli:
-
Dostępny jest nowy zestaw rekordów danych lub wprowadzono aktualizacje do oryginalnego zestawu rekordów danych. Na przykład transakcje z ostatniego miesiąca mogły stać się dostępne i odpowiednie do użycia w szkoleniu lub zidentyfikowano i rozwiązano problem z gromadzeniem danych.
-
Oryginalny treningowy zestaw danych został ponownie przetworzony lub dostosowany, być może w celu usprawnienia szkolenia modelu. Na przykład mogłeś ulepszyć logikę definiowania wartości kolumn cech, a nawet dodać nowe kolumny cech.
Zmiana lub odświeżenie zestawu danych nie wpływa na istniejące modele, które zostały już przeszkolone w poprzednich wersjach eksperymentu. W ramach danej wersji eksperymentu modele są szkolone wyłącznie na danych treningowych zdefiniowanych w tej konkretnej wersji.
Wymagania
W przypadku zmiany lub odświeżenia zestawu danych dla nowej wersji eksperymentu nowy zestaw danych musi spełniać następujące wymagania:
-
Nazwa i typ cechy kolumny docelowej muszą być takie same jak w przypadku celu w oryginalnym treningowym zestawie danych.
- Liczba unikalnych wartości w kolumnie docelowej musi mieścić się w tym samym zakresie, jaki jest wymagany dla danego typu eksperymentu. Na przykład w przypadku eksperymentu klasyfikacji wieloklasowej kolumna docelowa w nowym zestawie danych musi nadal zawierać od trzech do dziesięciu unikalnych wartości. Szczegółowe zakresy można znaleźć w sekcji Konfigurowanie eksperymentów.
Pozostałe kolumny cech mogą być całkowicie nowe, mieć inne nazwy i zawierać inne dane.
Zmiana zestawu danych
Wykonaj następujące czynności:
-
Na karcie Dane treningowe, Modele lub Analizuj wybierz model, który ma posłużyć jako podstawa dla kolejnej wersji.
-
Kliknij Wyświetl konfigurację.
Otworzy się panel konfiguracji eksperymentu.
-
Kliknij Utwórz nową wersję, aby skonfigurować nową wersję eksperymentu.
-
W sekcji Dane treningowe > Przejrzyj zestaw danych kliknij Zmień zestaw danych.
-
Wybierz lub prześlij nowy zestaw danych. Możesz wybrać spośród następujących opcji:
-
Zestawy danych: Wybierz zestaw danych w dowolnej przestrzeni, do której masz dostęp. Zobacz Wskazówki i wytyczne dotyczące przesyłania i wybierania zestawów danych.
-
Produkty danych: Wybierz zestaw danych z aktywnego produktu danych, do którego masz dostęp. Więcej informacji o produktach danych znajduje się w sekcji Creating data products.
-
Odświeżanie zestawu danych
Wykonaj następujące czynności:
-
Na karcie Dane treningowe, Modele lub Analizuj wybierz model, który ma posłużyć jako podstawa dla kolejnej wersji.
-
Kliknij Wyświetl konfigurację.
Otworzy się panel konfiguracji eksperymentu.
-
Kliknij Utwórz nową wersję, aby skonfigurować nową wersję eksperymentu.
-
W sekcji Dane treningowe kliknij Odśwież zestaw danych.
Otrzymasz powiadomienie, jeśli dostępne będzie odświeżenie zestawu danych. Zestaw danych jest zazwyczaj odświeżany, gdy istniejący plik danych zostanie nadpisany przez utworzenie nowego pliku o tej samej nazwie.
Wskazówki i wytyczne dotyczące przesyłania i wybierania zestawów danych
-
Zestawy danych można przesyłać ze strony Utwórz w centrum aktywności Analytics i są widoczne w Katalogu. Możesz również przesłać nowy zestaw danych bezpośrednio do Katalogu ze strony wyboru zestawu danych do eksperymentu. Aby to zrobić, kliknij Prześlij plik i wybierz plik do przesłania.
-
W Qlik Predict jest obsługiwany każdy plik płaski, który można przesłać i sprofilować w Qlik Cloud.
W przypadku plików z wieloma tabelami, takich jak pliki programu Microsoft Excel z wieloma arkuszami, zaimportowana zostanie tylko pierwsza tabela. Jeśli profilowanie danych nie powiedzie się w przypadku tabeli (na przykład, kiedy jest pusta), plik nie jest obsługiwany.
Uruchamianie dopracowanej wersji
Po zakończeniu konfigurowania wersji możesz ją uruchomić.
Wykonaj następujące czynności:
-
Kliknij Uruchom v2 w prawym dolnym rogu ekranu.
(Tekst na przycisku zależy od liczby uruchomionych wersji).
Porównywanie wersji eksperymentu
Po zakończeniu szkolenia nowej wersji porównaj ją ze starą wersją, aby zobaczyć efekt wprowadzonych zmian. Masz do dyspozycji szereg opcji porównywania modeli w różnych wersjach eksperymentu.
Szybka analiza
Użyj kart Modele i Dane treningowe w eksperymencie, aby porównać tę wersję ze starszymi wersjami. Na karcie Modele możesz:
-
Wyświetlić wyniki w tabeli Metryki modelu.
-
Wyświetlić zalecane modele na podstawie typowych wymagań analizy predykcyjnej, w tym dokładności i szybkości prognozowania.
-
Przełączać się między modelami, aby wyświetlić różnice w Podsumowanie szkolenia modelu i innych automatycznie generowanych wykresach.
Więcej informacji na temat szybkiej analizy modeli znajduje się w sekcji Przeprowadzanie szybkiej analizy modelu.
Szczegółowa analiza
Możesz zagłębić się w analizę modeli, przechodząc do kart Porównaj i Analizuj w eksperymencie. Karty te oferują wbudowane środowisko analityczne, w którym można interaktywnie oceniać modele na bardziej szczegółowym poziomie.
Karta Porównaj oferuje porównanie wyników modeli i hiperparametrów we wszystkich modelach. Karta Analizuj pozwala skupić się na konkretnym modelu w celu oceny dokładności prognozowania, ważności cech i innych szczegółów.
Więcej informacji można znaleźć w sekcjach Porównanie modeli i Szczegółowa analiza modelu.
Zmiana ustawień optymalizacji modelu
Możesz wyłączyć inteligentną optymalizację po uruchomieniu wersji, w której była ona aktywna. Pozwala to na korzystanie ze spostrzeżeń dostarczanych przez inteligentną optymalizację, dając jednocześnie niezbędną kontrolę nad wprowadzaniem drobnych, minimalnych poprawek. Alternatywnie możesz włączyć inteligentną optymalizację modelu po uruchomieniu jednej lub kilku wersji z wyłączonym tym ustawieniem.
Optymalizacja hiperparametrów to ustawienie, którego włączenie może być pomocne podczas procesu dopracowywania modelu. Zazwyczaj nie zaleca się włączania tego ustawienia dla pierwszej wersji eksperymentu.
Możesz także zmienić, czy chcesz używać szkolenia uwzględniającego czas, lub zmienić kolumnę używaną jako indeks daty.
Wykonaj następujące czynności:
-
Kliknij Wyświetl konfigurację.
-
W razie potrzeby kliknij Utwórz nową wersję, aby skonfigurować nową wersję eksperymentu.
-
W panelu rozwiń pozycję Optymalizacja modelu.
-
Przełączaj się między ustawieniami Inteligentna i Ręczna, aby włączyć lub wyłączyć inteligentną optymalizację modelu.
-
Jeśli chcesz aktywować optymalizację hiperparametrów, zaznacz pole wyboru Optymalizacja hiperparametrów i ustaw maksymalny czas szkolenia.
-
W sekcji Podział na dane testowe i treningowe na podstawie czasu możesz zmienić ustawienia szkolenia uwzględniającego czas:
-
Aby włączyć szkolenie uwzględniające czas, zmień domyślną wartość Brak, wybierając konkretną kolumnę Indeks daty w zestawie danych.
-
Aby wyłączyć szkolenie uwzględniające czas, ustaw wartość kolumny Indeks daty na Brak.
-
Zmień wybraną kolumnę Indeks daty na inną kolumnę.
-
Usuwanie wersji eksperymentu
Możesz usunąć wersje eksperymentu, których nie chcesz zachować. Pamiętaj, że wszystkie modele w tych wersjach eksperymentu również zostaną usunięte i nie będzie można ich odzyskać.
Wykonaj następujące czynności:
-
Przejdź do karty Modele.
-
W tabeli Metryki modelu wybierz model z wersji eksperymentu, którą chcesz usunąć.
WskazówkaMożesz również wybrać model, będąc na karcie Dane treningowe lub Analizuj, korzystając z menu rozwijanego na pasku narzędzi. -
W prawym dolnym rogu kliknij Usuń <numer wersji>.
-
W oknie dialogowym potwierdzenia kliknij Usuń.