Wyświetlanie statystyk dotyczących danych do uczenia
Po dodaniu danych do uczenia i uruchomieniu wersji uczenia możesz uzyskać dostęp do szczegółowych informacji na temat sposobu przetwarzania danych. Wnioski dostarczają informacji o celu i cechach eksperymentu, takich jak cechy, które zostały odrzucone, są niedostępne lub zostaną zakodowane przy użyciu specjalnego przetwarzania.
Kolumnę Wnioski znajdziesz na karcie Dane w Widoku schematu. Skrócone wnioski są także dostępne w Widoku danych. Wnioski są tworzone indywidualnie dla każdego modelu uczonego w ramach eksperymentu.
Wnioski są generowane:
-
Po dodaniu lub zmianie danych do uczenia, ale kiedy nie uruchomiono jeszcze żadnej wersji eksperymentu.
-
Po uruchomieniu każdej wersji eksperymentu. Dla każdego nauczonego modelu jest tworzony oddzielny zestaw wniosków.
Wnioski mogą być inne przed uruchomieniem wersji i po jej uruchomieniu. Jest tak dlatego, że na początku uczenia AutoML jest w stanie wstępnie przetworzyć dane i dokładniej zdiagnozować problemy z nimi. Więcej informacji zawiera temat Automatyczne przygotowanie i przekształcanie danych.
Przeglądanie wniosków przed uczeniem
Przed uruchomieniem wersji eksperymentu możesz przeanalizować wnioski, aby zobaczyć, jak interpretowane są bieżące dane szkoleniowe. Te informacje mogą ulec zmianie po uruchomieniu wersji.
Wykonaj następujące czynności:
W eksperymencie sprawdź, czy zostały dodane te dane szkoleniowe, których chcesz użyć w wersji eksperymentu.
Otwórz kartę Dane.
Sprawdź, czy jesteś w Widoku schematu .
Przeanalizuj kolumnę Wnioski. Etykietki dostarczają dodatkowych informacji kontekstowych związanych z wnioskami. Dodatkowe wyjaśnienia poszczególnych wniosków zawiera temat Interpretowanie wniosków z zestawu danych.
Wyświetlanie wniosków dotyczących modelu
Po zakończeniu uczenia modeli do wersji eksperymentu wybierz model i sprawdź, jak postąpiono z danymi.
Wykonaj następujące czynności:
Uruchom wersję eksperymentu, a następnie otwórz kartę Dane.
Wybierz model z listy rozwijanej na pasku narzędzi.
Sprawdź, czy jesteś w Widoku schematu .
Przeanalizuj kolumnę Wnioski. Etykietki dostarczają dodatkowych informacji kontekstowych związanych z wnioskami. Dodatkowe wyjaśnienia poszczególnych wniosków zawiera temat Interpretowanie wniosków z zestawu danych.
Interpretowanie wniosków z zestawu danych
W poniższej tabeli przedstawiono więcej informacji o możliwych wnioskach, które mogą być wyświetlane w schemacie.
Wniosek | Znaczenie | Wpływ na konfigurację | Kiedy wniosek zostanie określony | Zasoby dodatkowe |
---|---|---|---|---|
Stała | Kolumna ma tę samą wartość we wszystkich wierszach. | Kolumny nie można używać jako celu ani uwzględnionej cechy. | Przed uruchomieniem i po uruchomieniu wersji | Kardynalność |
One-hot encoded | Typ cechy jest kategorialny, a kolumna ma mniej niż 14 unikatowych wartości. | Brak wpływu na konfigurację. | Przed uruchomieniem i po uruchomieniu wersji | Kodowanie kategorialne |
Kodowane średnią | Typ cechy jest kategorialny, a kolumna ma 14 lub więcej unikatowych wartości. | Brak wpływu na konfigurację. | Przed uruchomieniem i po uruchomieniu wersji | Kodowanie kategorialne |
Wysoka kardynalność | Kolumna ma zbyt wiele unikatowych wartości i może negatywnie wpłynąć na wydajność modelu, jeśli będzie używana jako cecha. | Kolumny nie można użyć jako celu. Zostanie ona automatycznie wykluczona jako cecha, ale w razie potrzeby nadal będzie mogła zostać uwzględniona. | Przed uruchomieniem i po uruchomieniu wersji | Kardynalność |
Dane rzadkie | Kolumna zawiera zbyt wiele wartości pustych. | Kolumny nie można używać jako celu ani uwzględnionej cechy. | Przed uruchomieniem i po uruchomieniu wersji | Imputacja wartości null |
Klasa niedostatecznie reprezentowana | Kolumna ma klasę zawierającą mniej niż 10 wierszy. | Kolumny nie można używać jako celu, ale można ją uwzględnić jako cechę. | Przed uruchomieniem i po uruchomieniu wersji | – |
<liczba> cech poddanych automatycznej inżynierii | Kolumna jest cechą nadrzędną, której można użyć do wygenerowania elementów poddanych inżynierii automatycznej. | Jeśli ta cecha nadrzędna zostanie zinterpretowana jako cecha daty, zostanie automatycznie usunięta z konfiguracji. Zamiast tego zaleca się używanie poddanych inżynierii automatycznej cech daty, które można wygenerować na jej podstawie. Można zastąpić to ustawienie i uwzględnić tę cechę zamiast cech poddanych inżynierii automatycznej. | Przed uruchomieniem i po uruchomieniu wersji | Automatyczna inżynieria cech |
Cecha poddana automatycznej inżynierii | Kolumna ta jest cechą poddaną inżynierii automatycznej, która może zostać lub została wygenerowana na podstawie nadrzędnej cechy daty. Nie pojawiła się ona w oryginalnym zestawie danych. | Podczas uczenia w ramach eksperymentu możesz usunąć jedną lub więcej z tych cech poddanych inżynierii automatycznej. Jeśli zmienisz typ cechy nadrzędnej na kategorialny, wszystkie cechy poddane inżynierii automatycznej zostaną usunięte. | Przed uruchomieniem i po uruchomieniu wersji | Automatyczna inżynieria cech |
Nie można przetworzyć jako daty | Kolumna prawdopodobnie zawiera informacje o dacie i godzinie, ale nie można jej użyć do utworzenia cech daty poddanych inżynierii automatycznej. | Cecha ta zostaje usunięta z konfiguracji. Jeśli na podstawie tej cechy nadrzędnej wygenerowano wcześniej cechy poddane inżynierii automatycznej, zostaną one usunięte z przyszłych wersji eksperymentu. Nadal możesz korzystać z tej cechy w eksperymencie, ale musisz zmienić jej typ na kategorialny. | Po uruchomieniu wersji | Inżynieria cechy daty |
Ewentualny dowolny tekst | Kolumna mogłaby być ewentualnie dostępna do wykorzystania jako cecha typu dowolny tekst. | Do kolumny jest przypisany typ cechy dowolnego tekstu. Aby sprawdzić, czy funkcja może być przetwarzana jako dowolny tekst, musisz uruchomić wersję eksperymentu. | Przed uruchomieniem wersji | Obsługa danych typu dowolny tekst |
Dowolny tekst | Potwierdzono, że kolumna zawiera dowolny tekst. Może być przetwarzana jako dowolny tekst. | Ta cecha nie wymaga żadnych dodatkowych konfiguracji. | Po uruchomieniu wersji | Obsługa danych typu dowolny tekst |
Nie można przetworzyć jako dowolnego tekstu | Dalsza analiza wykazała, że kolumny nie można przetwarzać jako dowolnego tekstu. | Usuń zaznaczenie tej cechy w konfiguracji dla kolejnej wersji eksperymentu. Jeżeli cecha nie ma dużej kardynalności, można alternatywnie zmienić typ cechy na kategorialny. | Po uruchomieniu wersji | Obsługa danych typu dowolny tekst |
Wyciek danych celu | Podejrzewa się, że na tę cechę wpływa wyciek danych celu. Jeśli tak, zawiera informacje o kolumnie celu, którą próbujesz przewidzieć. Cechy z wyciekiem danych celu mogą dawać fałszywe poczucie pewności co do wydajności modelu. W rzeczywistych predykcjach powodują one bardzo słabe wyniki modeli. | Ta cecha nie została użyta do uczenia modelu. | Po uruchomieniu wersji | Wyciek danych |
Niska ważność permutacji | Ta cecha nie ma dużego wpływu na predykcje modelu lub nie ma go wcale. Usunięcie tych cech poprawia wydajność modelu poprzez redukcję szumu statystycznego. | Ta cecha nie została użyta do uczenia modelu. | Po uruchomieniu wersji | Omówienie ważności permutacji |
Ścisła korelacja | Cecha jest silnie skorelowana z jedną lub większą liczbą innych cech w eksperymencie. Występowanie cech, które są ze sobą silnie skorelowane, zmniejsza wydajność modelu. | Ta cecha nie została użyta do uczenia modelu. Cecha, z którą jest silnie skorelowana, nie została odrzucona ze względu na wysoką korelację, ale mogła zostać odrzucona z innego powodu, na przykład niskiej ważności permutacji. | Po uruchomieniu wersji | Korelacja |