Wyświetlanie wglądów w dane treningowe
W miarę dodawania danych treningowych i uruchamiania wersji treningu możesz uzyskiwać dostęp do wglądów w sposób obsługi danych. Sekcja Wglądy zawiera informacje o celu i cechach w eksperymencie, takich jak cechy, które zostały odrzucone, są niedostępne lub zostaną zakodowane przy użyciu specjalnego przetwarzania.
Kolumna Wglądy znajduje się w widoku Widok schematu na karcie Konfiguracja/Dane treningowe. Skrócone wglądy są również dostępne w widoku
Widok danych. Wglądy są tworzone indywidualnie dla każdego modelu trenowanego w ramach eksperymentu.
Kolumna Wglądy w widoku Widok schematu
Wglądy są generowane:
-
Po dodaniu lub zmianie danych treningowych, ale przed uruchomieniem jakichkolwiek wersji eksperymentu.
-
Po uruchomieniu każdej wersji eksperymentu. Dla każdego trenowanego modelu tworzony jest oddzielny zestaw wglądów.
Wglądy mogą się różnić przed uruchomieniem wersji i po jej uruchomieniu. Dzieje się tak, ponieważ po rozpoczęciu treningu narzędzie Qlik Predict może wstępnie przetworzyć dane i dokładniej zdiagnozować problemy z nimi. Aby uzyskać więcej informacji, zobacz Automatyczne przygotowanie i przekształcanie danych.
Wyświetlanie wglądów przed treningiem
Przed uruchomieniem wersji eksperymentu można przeanalizować Wglądy, aby zobaczyć, jak interpretowane są bieżące dane treningowe. Te wglądy mogą ulec zmianie po uruchomieniu wersji.
Wykonaj następujące czynności:
-
Upewnij się, że do eksperymentu dodano dane treningowe, których chcesz użyć w wersji eksperymentu.
-
Otwórz kartę Konfiguracja/Dane treningowe.
-
Upewnij się, że jesteś w widoku
Widok schematu.
-
Przeanalizuj kolumnę Wglądy. Ekrany pomocy dostarczają dodatkowego kontekstu dla wglądów. Dalsze wyjaśnienia znaczenia poszczególnych wglądów zawiera sekcja Interpretowanie wglądów w zestaw danych.
Wyświetlanie wglądów dla modelu
Po zakończeniu trenowania modeli dla wersji eksperymentu wybierz model i sprawdź, jak zostały obsłużone dane.
Wykonaj następujące czynności:
-
Uruchom wersję eksperymentu, a następnie otwórz kartę Konfiguracja/Dane treningowe.
-
Wybierz model z listy rozwijanej na pasku narzędzi.
-
Upewnij się, że jesteś w widoku
Widok schematu.
-
Przeanalizuj kolumnę Wglądy. Ekrany pomocy dostarczają dodatkowego kontekstu dla wglądów. Dalsze wyjaśnienia znaczenia poszczególnych wglądów zawiera sekcja Interpretowanie wglądów w zestaw danych.
Interpretowanie wglądów w zestaw danych
Poniższe tabele zawierają więcej szczegółów na temat możliwych wglądów, które mogą być wyświetlane w schemacie.
Wglądy ogólne
| Wgląd | Znaczenie | Wpływ na konfigurację | Kiedy wgląd jest określany | Dodatkowe odnośniki |
|---|---|---|---|---|
| Stała | Kolumna ma tę samą wartość dla wszystkich wierszy. | Kolumna nie może być używana jako cel ani uwzględniona cecha. | Przed uruchomieniem wersji i po jej uruchomieniu | Kardynalność |
| Zakodowane metodą one-hot | Typ cechy to kategoryczny, a kolumna ma mniej niż 14 unikalnych wartości. | Brak wpływu na konfigurację. | Przed uruchomieniem wersji i po jej uruchomieniu | Kodowanie kategorialne |
| Zakodowane metodą impact | Typ cechy to kategoryczny, a kolumna ma 14 lub więcej unikalnych wartości. | Brak wpływu na konfigurację. | Przed uruchomieniem wersji i po jej uruchomieniu | Kodowanie kategorialne |
| Wysoka kardynalność | Kolumna ma zbyt wiele unikalnych wartości, co może negatywnie wpłynąć na wydajność modelu, jeśli zostanie użyta jako cecha. | Kolumna nie może być używana jako cel. Zostanie automatycznie wykluczona jako cecha, ale w razie potrzeby nadal można ją uwzględnić. | Przed uruchomieniem wersji i po jej uruchomieniu | Kardynalność |
| Rzadkie dane | Kolumna zawiera zbyt wiele wartości pustych (null). | Kolumna nie może być używana jako cel ani uwzględniona cecha. | Przed uruchomieniem wersji i po jej uruchomieniu | Imputacja wartości null |
| Niedoreprezentowana klasa | Kolumna zawiera klasę z mniej niż 10 wierszami. | Kolumna nie może być używana jako cel, ale może być uwzględniona jako cecha. | Przed uruchomieniem wersji i po jej uruchomieniu | - |
| Przekształcenie cechy nie powiodło się | Typ cechy został ręcznie zmieniony z typu domyślnego. Przy tej konfiguracji wystąpił błąd. | Wersja eksperymentu nie może zostać pomyślnie uruchomiona z tym przekształceniem cechy. Przywróć poprzednią wartość typu cechy lub wyklucz cechę z treningu. | Po uruchomieniu wersji | Zmiana typów cech |
Wglądy dotyczące automatycznej inżynierii cech
| Wgląd | Znaczenie | Wpływ na konfigurację | Kiedy wgląd jest określany | Dodatkowe odnośniki |
|---|---|---|---|---|
| <liczba> automatycznie wygenerowanych cech | Kolumna jest cechą nadrzędną, która może służyć do generowania automatycznie wygenerowanych cech. | Jeśli ta cecha nadrzędna zostanie zinterpretowana jako cecha daty, zostanie automatycznie usunięta z konfiguracji. Zaleca się użycie w zamian automatycznie wygenerowanych cech daty, które można z niej utworzyć. Istnieje możliwość zastąpienia tego ustawienia i uwzględnienia tej cechy zamiast cech automatycznie wygenerowanych. | Przed uruchomieniem wersji i po jej uruchomieniu | Automatyczna inżynieria cech |
| Automatycznie wygenerowana cecha | Kolumna jest automatycznie wygenerowaną cechą, która może być lub została wygenerowana z nadrzędnej cechy daty. Nie występowała ona w oryginalnym zestawie danych. | Możesz usunąć jedną lub wiele z tych automatycznie wygenerowanych cech podczas treningu eksperymentu. Jeśli zmienisz typ cechy nadrzędnej na kategoryczny, wszystkie automatycznie wygenerowane cechy zostaną usunięte. | Przed uruchomieniem wersji i po jej uruchomieniu | Automatyczna inżynieria cech |
| Nie można przetworzyć jako daty | Kolumna prawdopodobnie zawiera informacje o dacie i godzinie, ale nie można jej było użyć do utworzenia automatycznie wygenerowanych cech daty. | Cecha zostaje odrzucona z konfiguracji. Jeśli automatycznie wygenerowane cechy zostały wcześniej utworzone z tej cechy nadrzędnej, zostaną one usunięte z przyszłych wersji eksperymentu. Nadal możesz używać tej cechy w eksperymencie, ale musisz zmienić jej typ na kategoryczny. | Po uruchomieniu wersji | Automatyczna inżynieria cech |
| Możliwy wolny tekst | Kolumna może być dostępna do użycia jako cecha wolnego tekstu. | Do kolumny przypisywany jest typ cechy wolnego tekstu. Musisz uruchomić wersję eksperymentu, aby potwierdzić, czy cecha może być przetwarzana jako wolny tekst. | Przed uruchomieniem wersji | Automatyczna inżynieria cech |
| Wolny tekst | Potwierdzono, że kolumna zawiera wolny tekst. Może być przetwarzana jako wolny tekst. | Dla tej cechy nie są wymagane żadne dodatkowe konfiguracje. | Po uruchomieniu wersji | Automatyczna inżynieria cech |
| Nie można przetworzyć jako wolnego tekstu | Po dalszej analizie okazuje się, że kolumna nie może być przetwarzana jako wolny tekst. | Musisz odznaczyć tę cechę w konfiguracji dla następnej wersji eksperymentu. Jeśli cecha nie ma wysokiej kardynalności, możesz alternatywnie zmienić jej typ na kategoryczny. | Po uruchomieniu wersji | Automatyczna inżynieria cech |
Wglądy dotyczące inteligentnej optymalizacji modelu
| Wgląd | Znaczenie | Wpływ na konfigurację | Kiedy wgląd jest określany | Dodatkowe odnośniki |
|---|---|---|---|---|
| Wyciek celu | Istnieje podejrzenie, że na cechę wpływa wyciek celu. Jeśli tak, zawiera ona informacje o kolumnie docelowej, którą próbujesz przewidzieć. Cechy z wyciekiem celu mogą dawać złudne poczucie pewności co do wydajności modelu. W rzeczywistych prognozach powodują one, że model działa bardzo słabo. | Cecha nie została użyta do wytrenowania modelu. | Po uruchomieniu wersji | Wyciek danych |
| Niska ważność permutacji | Cecha ma niewielki wpływ na prognozy modelu lub nie ma go wcale. Usunięcie tych cech poprawia wydajność modelu poprzez zmniejszenie szumu statystycznego. | Cecha nie została użyta do wytrenowania modelu. | Po uruchomieniu wersji | Omówienie ważności permutacji |
| Silnie skorelowana | Cecha wykazuje silną korelację z jedną lub większą liczbą innych cech w eksperymencie. Posiadanie cech, które są silnie skorelowane ze sobą, obniża wydajność modelu. | Cecha nie została użyta do wytrenowania modelu. Cecha, z którą jest silnie skorelowana, nie została odrzucona z powodu silnej korelacji, ale mogła zostać odrzucona z innego powodu, takiego jak niska ważność permutacji. | Po uruchomieniu wersji | Korelacja |
Wglądy dotyczące prognozowania szeregów czasowych
| Wgląd | Znaczenie | Wpływ na konfigurację | Kiedy wgląd jest określany | Dodatkowe odnośniki |
|---|---|---|---|---|
| Możliwy indeks daty | Cecha może być potencjalnie użyta jako indeks daty dla eksperymentu szeregów czasowych. |
W przypadku użycia jako indeksu daty szeregów czasowych dane w kolumnie mogą wpływać na aspekty konfiguracji szeregów czasowych, takie jak horyzont prognozy w przyszłość. Wartości w indeksie daty muszą rosnąć z każdym wierszem lub unikalną wartością grupy w stałym odstępie czasu. |
Przed uruchomieniem wersji |
Wglądy dotyczące wykrywania uprzedzeń
| Wgląd | Znaczenie | Wpływ na konfigurację | Kiedy wgląd jest określany | Dodatkowe odnośniki |
|---|---|---|---|---|
| Wykryto uprzedzenie w danych | W odniesieniu do wartości w kolumnie docelowej niektóre grupy (wartości) są niedoreprezentowane w porównaniu z innymi. | Przeanalizuj wyniki wykrywania uprzedzeń, aby określić kolejne kroki — mogą one obejmować odrzucenie cechy, zmianę zestawu danych lub utworzenie nowego eksperymentu ze zmodyfikowaną strukturą. | Po uruchomieniu wersji | Wykrywanie stronniczości w modelach uczenia maszynowego |
| Wykryto uprzedzenie reprezentacji | Wykryto uprzedzenie w sposobie, w jaki wytrenowany model wykorzystuje dane z cechy do tworzenia prognoz. | Przeanalizuj wyniki wykrywania uprzedzeń, aby określić kolejne kroki — mogą one obejmować odrzucenie cechy, zmianę zestawu danych lub utworzenie nowego eksperymentu ze zmodyfikowaną strukturą. | Po uruchomieniu wersji | Wykrywanie stronniczości w modelach uczenia maszynowego |