Ocenianie modeli klasyfikacji wieloklasowej
Klasyfikacja wieloklasowa ma miejsce, gdy próbuje się przewidzieć pojedynczy dyskretny wynik, jak w przypadku klasyfikacji binarnej, ale z więcej niż dwiema klasami. Modele klasyfikacji wieloklasowej są oceniane na podstawie różnych średnich F1.
Makro F1
Makro F1 to uśredniona wartość F1 dla każdej klasy bez ważenia, co oznacza, że wszystkie klasy są traktowane jednakowo.
Mikro F1
Mikro F1 to wartość F1 obliczona dla całej tablicy pomyłek. Zliczana jest całkowita liczba wyników prawdziwie pozytywnych, fałszywie negatywnych i fałszywie pozytywnych. Obliczenie wyniku Micro F1 jest równoznaczne z obliczeniem globalnej precyzji lub globalnej czułości.
Ważone F1
Ważone F1 odpowiada F1 klasyfikacji binarnej. Obliczane jest dla każdej klasy, a następnie sumowane jako średnia ważona uwzględniająca liczbę rekordów dla każdej klasy.
Dokładność
Dokładność mierzy średnio, jak często model dokonywał poprawnych predykcji. Oblicza się ją jako liczbę dokładnie pasujących predykcji podzieloną przez liczbę próbek.
Szybkość predykcji
Szybkość przewidywania to wskaźnik modelu, który ma zastosowanie do wszystkich typów modeli: klasyfikacji binarnej, klasyfikacji wieloklasowej i regresji. Szybkość przewidywania mierzy, jak szybko model uczenia maszynowego jest w stanie generować predykcje.
W Qlik Predict szybkość predykcji jest obliczana na podstawie połączonego czasu obliczania cech i czasu predykcji zestawu danych testowych. Jest ona wyświetlana w wierszach na sekundę.
Szybkość przewidywania można przeanalizować w tabeli Wskaźniki modelu po uruchomieniu wersji eksperymentu. Dane dotyczące szybkości przewidywania można również wyświetlać podczas analizowania modeli z wbudowaną analityką. Więcej informacji zawiera temat:
Uwagi
Zmierzona szybkość przewidywania jest oparta na rozmiarze zbioru danych do uczenia, a nie na danych, na których dokonywane są predykcje. Po wdrożeniu modelu można zauważyć różnice w szybkości tworzenia predykcji, jeśli dane do uczenia i do predykcji różnią się znacznie rozmiarem lub podczas tworzenia prognoz w czasie rzeczywistym na jednym lub kilku wierszach danych.