Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Wyświetlanie statystyk dotyczących danych do uczenia

Po dodaniu danych do uczenia i uruchomieniu wersji uczenia możesz uzyskać dostęp do szczegółowych informacji na temat sposobu przetwarzania danych. Wnioski dostarczają informacji o celu i cechach eksperymentu, takich jak cechy, które zostały odrzucone, są niedostępne lub zostaną zakodowane przy użyciu specjalnego przetwarzania.

Kolumnę Wnioski znajdziesz na karcie Dane w Schemat Widoku schematu. Skrócone wnioski są także dostępne w Tabela Widoku danych. Wnioski są tworzone indywidualnie dla każdego modelu uczonego w ramach eksperymentu.

Kolumna Wnioski w Widoku schematu

Wnioski wyświetlane na temat każdej kolumny cech w zestawie danych do uczenia

Wnioski są generowane:

  • Po dodaniu lub zmianie danych do uczenia, ale kiedy nie uruchomiono jeszcze żadnej wersji eksperymentu.

  • Po uruchomieniu każdej wersji eksperymentu. Dla każdego nauczonego modelu jest tworzony oddzielny zestaw wniosków.

Wnioski mogą być inne przed uruchomieniem wersji i po jej uruchomieniu. Jest tak dlatego, że na początku uczenia AutoML jest w stanie wstępnie przetworzyć dane i dokładniej zdiagnozować problemy z nimi. Więcej informacji zawiera temat Automatyczne przygotowanie i przekształcanie danych.

Przeglądanie wniosków przed uczeniem

Przed uruchomieniem wersji eksperymentu możesz przeanalizować wnioski, aby zobaczyć, jak interpretowane są bieżące dane szkoleniowe. Te informacje mogą ulec zmianie po uruchomieniu wersji.

  1. W eksperymencie sprawdź, czy zostały dodane te dane szkoleniowe, których chcesz użyć w wersji eksperymentu.

  2. Otwórz kartę Dane.

  3. Sprawdź, czy jesteś w Widoku schematuWiersze tabeli .

  4. Przeanalizuj kolumnę Wnioski. Etykietki dostarczają dodatkowych informacji kontekstowych związanych z wnioskami. Dodatkowe wyjaśnienia poszczególnych wniosków zawiera temat Interpretowanie wniosków z zestawu danych.

Wyświetlanie wniosków dotyczących modelu

Po zakończeniu uczenia modeli do wersji eksperymentu wybierz model i sprawdź, jak postąpiono z danymi.

  1. Uruchom wersję eksperymentu, a następnie otwórz kartę Dane.

  2. Wybierz model z listy rozwijanej na pasku narzędzi.

  3. Sprawdź, czy jesteś w Widoku schematuWiersze tabeli .

  4. Przeanalizuj kolumnę Wnioski. Etykietki dostarczają dodatkowych informacji kontekstowych związanych z wnioskami. Dodatkowe wyjaśnienia poszczególnych wniosków zawiera temat Interpretowanie wniosków z zestawu danych.

Interpretowanie wniosków z zestawu danych

W poniższej tabeli przedstawiono więcej informacji o możliwych wnioskach, które mogą być wyświetlane w schemacie.

Wnioski z zestawu danych w widoku schematu
WniosekZnaczenieWpływ na konfiguracjęKiedy wniosek zostanie określonyZasoby dodatkowe
StałaKolumna ma tę samą wartość we wszystkich wierszach.Kolumny nie można używać jako celu ani uwzględnionej cechy.Przed uruchomieniem i po uruchomieniu wersjiKardynalność
One-hot encodedTyp cechy jest kategorialny, a kolumna ma mniej niż 14 unikatowych wartości.Brak wpływu na konfigurację.Przed uruchomieniem i po uruchomieniu wersjiKodowanie kategorialne
Kodowane średniąTyp cechy jest kategorialny, a kolumna ma 14 lub więcej unikatowych wartości.Brak wpływu na konfigurację.Przed uruchomieniem i po uruchomieniu wersjiKodowanie kategorialne
Wysoka kardynalnośćKolumna ma zbyt wiele unikatowych wartości i może negatywnie wpłynąć na wydajność modelu, jeśli będzie używana jako cecha.Kolumny nie można użyć jako celu. Zostanie ona automatycznie wykluczona jako cecha, ale w razie potrzeby nadal będzie mogła zostać uwzględniona.Przed uruchomieniem i po uruchomieniu wersjiKardynalność
Dane rzadkieKolumna zawiera zbyt wiele wartości pustych.Kolumny nie można używać jako celu ani uwzględnionej cechy.Przed uruchomieniem i po uruchomieniu wersjiImputacja wartości null
Klasa niedostatecznie reprezentowanaKolumna ma klasę zawierającą mniej niż 10 wierszy.Kolumny nie można używać jako celu, ale można ją uwzględnić jako cechę.Przed uruchomieniem i po uruchomieniu wersji
<liczba> cech poddanych automatycznej inżynieriiKolumna jest cechą nadrzędną, której można użyć do wygenerowania elementów poddanych inżynierii automatycznej.Jeśli ta cecha nadrzędna zostanie zinterpretowana jako cecha daty, zostanie automatycznie usunięta z konfiguracji. Zamiast tego zaleca się używanie poddanych inżynierii automatycznej cech daty, które można wygenerować na jej podstawie. Można zastąpić to ustawienie i uwzględnić tę cechę zamiast cech poddanych inżynierii automatycznej.Przed uruchomieniem i po uruchomieniu wersjiAutomatyczna inżynieria cech
Cecha poddana automatycznej inżynieriiKolumna ta jest cechą poddaną inżynierii automatycznej, która może zostać lub została wygenerowana na podstawie nadrzędnej cechy daty. Nie pojawiła się ona w oryginalnym zestawie danych.Podczas uczenia w ramach eksperymentu możesz usunąć jedną lub więcej z tych cech poddanych inżynierii automatycznej. Jeśli zmienisz typ cechy nadrzędnej na kategorialny, wszystkie cechy poddane inżynierii automatycznej zostaną usunięte.Przed uruchomieniem i po uruchomieniu wersjiAutomatyczna inżynieria cech
Nie można przetworzyć jako datyKolumna prawdopodobnie zawiera informacje o dacie i godzinie, ale nie można jej użyć do utworzenia cech daty poddanych inżynierii automatycznej.Cecha ta zostaje usunięta z konfiguracji. Jeśli na podstawie tej cechy nadrzędnej wygenerowano wcześniej cechy poddane inżynierii automatycznej, zostaną one usunięte z przyszłych wersji eksperymentu. Nadal możesz korzystać z tej cechy w eksperymencie, ale musisz zmienić jej typ na kategorialny.Po uruchomieniu wersjiInżynieria cechy daty
Ewentualny dowolny tekstKolumna mogłaby być ewentualnie dostępna do wykorzystania jako cecha typu dowolny tekst.Do kolumny jest przypisany typ cechy dowolnego tekstu. Aby sprawdzić, czy funkcja może być przetwarzana jako dowolny tekst, musisz uruchomić wersję eksperymentu.Przed uruchomieniem wersjiObsługa danych typu dowolny tekst
Dowolny tekstPotwierdzono, że kolumna zawiera dowolny tekst. Może być przetwarzana jako dowolny tekst.Ta cecha nie wymaga żadnych dodatkowych konfiguracji.Po uruchomieniu wersjiObsługa danych typu dowolny tekst
Nie można przetworzyć jako dowolnego tekstuDalsza analiza wykazała, że kolumny nie można przetwarzać jako dowolnego tekstu.Usuń zaznaczenie tej cechy w konfiguracji dla kolejnej wersji eksperymentu. Jeżeli cecha nie ma dużej kardynalności, można alternatywnie zmienić typ cechy na kategorialny.Po uruchomieniu wersjiObsługa danych typu dowolny tekst
Wyciek danych celuPodejrzewa się, że na tę cechę wpływa wyciek danych celu. Jeśli tak, zawiera informacje o kolumnie celu, którą próbujesz przewidzieć. Cechy z wyciekiem danych celu mogą dawać fałszywe poczucie pewności co do wydajności modelu. W rzeczywistych predykcjach powodują one bardzo słabe wyniki modeli.Ta cecha nie została użyta do uczenia modelu.Po uruchomieniu wersjiWyciek danych
Niska ważność permutacjiTa cecha nie ma dużego wpływu na predykcje modelu lub nie ma go wcale. Usunięcie tych cech poprawia wydajność modelu poprzez redukcję szumu statystycznego.Ta cecha nie została użyta do uczenia modelu.Po uruchomieniu wersjiOmówienie ważności permutacji
Ścisła korelacjaCecha jest silnie skorelowana z jedną lub większą liczbą innych cech w eksperymencie. Występowanie cech, które są ze sobą silnie skorelowane, zmniejsza wydajność modelu.Ta cecha nie została użyta do uczenia modelu. Cecha, z którą jest silnie skorelowana, nie została odrzucona ze względu na wysoką korelację, ale mogła zostać odrzucona z innego powodu, na przykład niskiej ważności permutacji.Po uruchomieniu wersjiKorelacja

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!