Modelli di classificazione multiclasse a punteggio
La classificazione multiclasse si ha quando si cerca di prevedere un singolo risultato discreto come nella classificazione binaria, ma con più di due classi. I modelli di classificazione multiclasse sono valutati in base a diverse medie di F1.
F1 macro
Macro F1 è la media del valore F1 per ogni classe senza ponderazione, ossia, tutte le classi vengono trattate allo stesso modo.
Micro F1
Micro F1 è il valore F1 calcolato sull'intera matrice di confusione. Vengono contati il totale dei veri positivi, dei falsi negativi e dei falsi positivi. Il calcolo del punteggio Micro F1 è equivalente al calcolo della precisione globale o del richiamo globale.
F1 ponderato
L'F1 ponderato corrisponde alla classificazione binaria F1. Viene calcolato per ogni classe e poi combinato come media ponderata tenendo conto del numero di record per ogni classe.
Accuratezza
L'accuratezza misura la frequenza con cui il modello ha fatto una previsione corretta in media. È calcolata come il numero di previsioni esattamente corrispondenti diviso per il numero di campioni.
Velocità di previsione
La velocità di previsione è una metrica del modello che si applica a tutti i tipi di modello: classificazione binaria, classificazione multiclasse e regressione. La velocità di previsione misura la velocità con cui un modello di apprendimento automatico è in grado di generare previsioni.
In Qlik Predict, la velocità di previsione viene calcolata utilizzando il tempo di calcolo combinato delle funzioni e il tempo di previsione del set di dati di prova. Questa viene visualizzata come righe al secondo.
La velocità di previsione può essere analizzata nella tabella Metriche del modello dopo aver eseguito la versione dell'esperimento. È possibile anche visualizzare i dati sulla velocità di previsione quando si analizzano i modelli con le analisi incorporate. Per ulteriori informazioni, vedere:
Considerazioni
La velocità di previsione misurata si basa sulle dimensioni del training set, piuttosto che sui dati su cui vengono effettuate le previsioni. Dopo aver distribuito un modello, è possibile notare differenze tra la velocità di creazione delle previsioni se i dati di addestramento e di previsione differiscono notevolmente in termini di dimensioni, o quando si creano previsioni in tempo reale su una o poche righe di dati.