Ulepszanie modeli
Po utworzeniu kilku początkowych modeli trzeba je ulepszyć, aby zwiększyć ich efektywność i potencjalną dokładność. Wyniki modelu wskazują różne miary tej efektywności. Chociaż celem ulepszania modeli jest zwiększanie tych wyników, wyższy wynik nie zawsze oznacza lepszy model.
Możesz udoskonalić swoje modele, wykluczając lub uwzględniając cechy, zmieniając dane do uczenia i modyfikując inne parametry konfiguracyjne. W ten sposób możesz porównać różne wersje, aby zobaczyć, jaki wpływ przyniosą wprowadzone zmiany.
Interpretując wyniki, dowiesz się, jak ulepszyć model. Wartości różnych wskaźników mogą dać wgląd w to, co trzeba zrobić, aby poprawić wynik.
Wymagania i uprawnienia
Więcej informacji na temat wymagań dotyczących użytkowników w kontekście pracy z eksperymentami uczenia maszynowego zawiera temat Praca z eksperymentami.
Konfiguracja nowej wersji
Po uruchomieniu wersji eksperymentu możesz w razie potrzeby udoskonalić modele, tworząc nową wersję.
Wykonaj następujące czynności:
-
W tabeli Wskaźniki modelu wybierz model do ulepszenia.
-
W prawym dolnym rogu kliknij Wyświetl konfigurację, aby otworzyć panel Konfiguracja eksperymentu.
-
Kliknij Nowa wersja.
Po utworzeniu nowej wersji możesz wprowadzić zmiany w jej konfiguracji, takie jak:
-
Wykluczanie istniejących cech
-
Uwzględnianie poprzednio wykluczonych cech
-
Zmiana lub odświeżenie zestawu danych
-
Wybór lub usuwanie wyboru algorytmów
Więcej informacji na temat tych opcji znajduje się w poniższych sekcjach.
Podczas tworzenia nowej wersji kliknij ikonę filtru w obszarze Cechy w panelu Konfiguracja eksperymentu. Podczas filtrowania możesz łatwiej zwizualizować, które cechy zostały wprowadzone od czasu zmiany zestawu danych do uczenia. Możesz także zobaczyć, które cechy zostały poddane inżynierii automatycznej, a które nie.
Ulepszanie zestawu danych
Jeśli model nie osiąga dobrych wyników, warto przejrzeć zestaw danych, aby rozwiązać ewentualne problemy. Więcej informacji o ulepszaniu zestawu danych zawiera temat Przygotowywanie zestawu danych do uczenia.
Wykluczanie cech
Więcej cech niekoniecznie oznacza lepszy model. Aby ulepszyć model, trzeba wykluczyć niewiarygodne i nieistotne cechy, takie jak:
-
Cechy ze zbyt wysoką korelacją. Spośród dwóch skorelowanych cech wyklucz tę, która ma mniejszą ważność.
-
Cechy o zbyt niskiej ważności. Te cechy nie mają żadnego wpływu na to, czego próbujesz się dowiedzieć.
-
Cechy o zbyt wysokim znaczeniu. Może ono być spowodowane wyciekiem danych.
Przeprowadź test, aby usunąć cechę z danych do uczenia, a następnie ponownie uruchom uczenie i sprawdź, czy ulepszy to model. Czy ma to duży wpływ na wynik modelu czy nie ma żadnego?
Wykonaj następujące czynności:
-
Otwórz eksperyment z Katalogu.
-
Wybierz model, który chcesz ulepszyć.
-
W prawym dolnym rogu kliknij Wyświetl konfigurację, aby otworzyć panel Konfiguracja eksperymentu.
-
Kliknij Nowa wersja, aby skonfigurować nową wersję eksperymentu.
-
W obszarze Cechy wyczyść pole wyboru każdej cechy, której nie chcesz używać podczas uczenia.
Dodawanie cech
Jeśli model nadal nie osiąga dobrych wyników, być może cechy, które mają związek z celem, nie zostały jeszcze przechwycone w zestawie danych. Możesz ponownie przetworzyć zestaw danych i zmienić jego przeznaczenie, aby zoptymalizować jakość danych oraz dodać nowe funkcje i informacje. Gdy nowy zbiór danych będzie gotowy, można będzie go dodać do przyszłych wersji eksperymentu. Zobacz Zmiana i odświeżenie zestawu danych.
Więcej informacji o przechwytywaniu i inżynierii nowych cech zawiera temat Tworzenie nowych kolumn cech.
Wybór algorytmów
W oparciu o typ danych kolumny celu automatycznie wybierane są odpowiednie algorytmy do uczenia. Warto wykluczyć algorytmy, które nie działają tak dobrze lub są wolniejsze. Dzięki temu nie musisz tracić na nie czasu potrzebnego na uczenie.
Więcej informacji na temat wybierania algorytmów zawiera temat Algorytmy.
Wykonaj następujące czynności:
-
Otwórz eksperyment z Katalogu.
-
Wybierz model, który chcesz ulepszyć.
-
W prawym dolnym rogu kliknij Wyświetl konfigurację, aby otworzyć panel Konfiguracja eksperymentu.
-
Kliknij Nowa wersja, aby skonfigurować nową wersję eksperymentu.
-
W obszarze Algorytmy wyczyść pola wyboru wszystkich algorytmów, których nie chcesz używać do uczenia.
Zmiana i odświeżenie zestawu danych
Jeśli dane do uczenia zmieniły się od czasu ostatniej wersji eksperymentu, możesz zmienić lub odświeżyć zestaw danych na potrzeby przyszłych wersji eksperymentu.
Może się to przydać, gdy zechcesz porównać wskaźniki i skuteczność modelu dla różnych zbiorów danych w ramach tego samego eksperymentu. Przydaje się to na przykład, jeśli:
-
Dostępny jest nowy zestaw rekordów danych lub wprowadzono aktualizacje pierwotnego zestawu rekordów danych. Na przykład transakcje z ostatniego miesiąca mogły stać się dostępne i mogą się nadawać do wykorzystania do uczenia lub mógł zostać zidentyfikowany i rozwiązany problem z gromadzeniem danych.
-
Oryginalny zestaw danych do uczenia został ponownie przetworzony lub dostosowany do innych celów, być może w celu ulepszenia uczenia modeli. Na przykład mogła zostać ulepszona logika definiowania wartości kolumn cech lub nawet dodano nowe kolumny cech.
Zmiana lub odświeżenie zestawu danych nie powoduje zmiany istniejących modeli, które zostały już nauczone na podstawie poprzednich wersji eksperymentu. W wersji eksperymentu modele są uczone wyłącznie na danych do uczenia zdefiniowanych w tej konkretnej wersji.
Wymagania
Gdy zmienisz lub odświeżysz zestaw danych dla nowej wersji eksperymentu, nowy zestaw danych musi spełniać następujące wymagania:
-
Nazwa i typ cechy kolumny celu muszą być takie same jak celu w oryginalnym zestawie danych do uczenia.
- Liczba odrębnych wartości w kolumnie celu musi mieścić się w tym samym zakresie, jaki jest wymagany dla danego typu eksperymentu. Na przykład w przypadku eksperymentu klasyfikacji wieloklasowej kolumna celu w nowym zestawie danych musi nadal zawierać od trzech do dziesięciu unikatowych wartości. Informacje o konkretnych zakresach zawiera temat Określanie typu tworzonego modelu.
Pozostałe kolumny cech mogą być zupełnie nowe, mieć inne nazwy i zawierać inne dane.
Zmiana zestawu danych
Wykonaj następujące czynności:
-
W tabeli Wskaźniki modelu w eksperymencie wybierz model.
-
W prawym dolnym rogu kliknij Wyświetl konfigurację, aby otworzyć panel Konfiguracja eksperymentu.
-
Kliknij Nowa wersja, aby skonfigurować nową wersję eksperymentu.
-
W obszarze Dane do uczenia kliknij Zmień zestaw danych.
-
Wybierz lub prześlij nowy zestaw danych.
Odświeżanie zestawu danych
Wykonaj następujące czynności:
-
W tabeli Wskaźniki modelu w eksperymencie wybierz model.
-
W prawym dolnym rogu kliknij Wyświetl konfigurację, aby otworzyć panel Konfiguracja eksperymentu.
-
Kliknij Nowa wersja, aby skonfigurować nową wersję eksperymentu.
-
W obszarze Dane do uczenia kliknij Odśwież zestaw danych.
Jeśli odświeżenie zestawu danych będzie dostępne, otrzymasz powiadomienie. Zestaw danych jest zwykle odświeżany, gdy istniejący plik danych zostanie zastąpiony przez utworzenie nowego pliku o tej samej nazwie.
Porównywanie wersji eksperymentu
Po dokonaniu zmian uruchom uczenie ponownie i porównaj nową wersję z poprzednią, aby zobaczyć efekty wprowadzonych zmian.
Wykonaj następujące czynności:
-
Kliknij Uruchom wersję 2 w prawym dolnym rogu ekranu, aby nauczyć inną wersję eksperymentu.
(Tekst na przycisku zależy od liczby uruchomionych dotychczas wersji).
-
W tabeli Wskaźniki modelu można filtrować modele za pomocą menu rozwijanych algorytmu, wersji i innych właściwości. Tabelę można również sortować według poszczególnych kolumn wskaźników.
Usuwanie wersji eksperymentu
Wersje eksperymentu, których nie chcesz zachować, możesz usunąć. Zwróć uwagę, że wszystkie modele w wersjach eksperymentu również zostaną usunięte i nie będzie można ich odzyskać.
Wykonaj następujące czynności:
-
W tabeli Wskaźniki modelu wybierz model z wersji eksperymentu, którą chcesz usunąć.
-
W prawym dolnym rogu kliknij Usuń <numer wersji>.
-
W oknie dialogowym potwierdzenia kliknij Usuń.