Bewertung von Mehrklassen-Klassifikationsmodellen
Bei der Mehrklassen-Klassifikation versuchen Sie, wie bei der Binärklassifikation ein einzelnes diskretes Ergebnis vorherzusagen, aber mit mehr als zwei Klassen. Mehrklassen-Klassifikationsmodelle werden nach verschiedenen Durchschnitten von F1 bewertet.
Macro F1
Macro F1 ist der durchschnittliche F1-Wert für jede Klasse ohne Gewichtung, d.h., alle Klassen werden gleich behandelt.
Micro F1
Micro F1 ist der F1-Wert, der über die ganze Konfusionsmatrix hinweg berechnet wird. Die gesamten Wahr-positiv-, Falsch-negativ- und Falsch-positiv-Werte werden gezählt. Die Berechnung des Micro F1-Score entspricht der Berechnung der globalen Präzision oder der globalen Trefferquote.
Gewichteter F1
Gewichteter F1 entspricht dem F1 der Binärklassifikation. Er wird für jede Klasse berechnet und dann als gewichteter Durchschnitt kombiniert, wobei die Anzahl der Datensatzeinträge für jede Klasse berücksichtigt wird.
Genauigkeit
Genauigkeit misst, wie oft das Modell im Durchschnitt eine korrekte Vorhersage getroffen hat. Sie wird als Anzahl der genau übereinstimmenden Vorhersagen geteilt durch die Stichprobenanzahl berechnet.