Pontuando modelos de classificação multiclasse
Classificação multiclasse é quando você está tentando prever um único resultado discreto como na classificação binária, mas com mais de duas classes. Os modelos de classificação multiclasse são pontuados por diferentes médias de F1.
Macro F1
F1 Macro é o valor médio de F1 para cada classe sem ponderação, ou seja, todas as classes são tratadas igualmente.
Micro F1
Micro F1 é o valor F1 calculado em toda a confusion matrix. O total de verdadeiros positivos, falsos negativos e falsos positivos são contados. Calcular a pontuação Micro F1 é equivalente a calcular a precision global ou o recall global.
F1 ponderado
F1 ponderado corresponde à classificação binária F1. É calculado para cada classe e depois combinado como uma média ponderada levando em consideração o número de registros de cada classe.
Exatidão
A exatidão mede com que frequência o modelo fez uma previsão correta em média. É calculada como o número de previsões exatamente correspondentes dividido pelo número de amostras.
Velocidade de previsão
Velocidade de previsão é uma métrica de modelo que se aplica a todos os tipos de modelo: classificação binária, classificação multiclasse, regressão e série temporal. A velocidade de previsão mede a rapidez com que um modelo de aprendizado de máquina pode gerar previsões.
No Qlik Predict, a velocidade de previsão é calculada usando o tempo combinado de computação do recurso e o tempo de previsão do conjunto de dados de teste. Ela é exibida em linhas por segundo.
A velocidade de previsão pode ser analisada na tabela Métricas do modelo após a execução da versão do experimento. Você também pode visualizar os dados de velocidade de previsão ao analisar modelos com análise incorporada. Para obter mais informações, consulte:
Considerações
A velocidade de previsão medida baseia-se no tamanho do conjunto de dados de treinamento, e não nos dados nos quais as previsões são feitas. Após implementar um modelo, você poderá notar diferenças entre a rapidez com que as previsões são criadas se o tamanho dos dados de treinamento e de previsão for muito diferente, ou ao criar previsões em tempo real em uma ou poucas linhas de dados.