Poängsättning av tidsseriemodeller
Tidsmodeller förutsäger utfall som siffror motsvarande specifika framtida datum. Flera mätvärden genereras för att du ska kunna utvärdera tidsseriemodeller.
MASE
MASE står för medelabsolut skalat fel. MASE är ett av de viktigaste mätvärdena som används för att poängsätta och rekommendera tidsseriemodeller i Qlik Predict.
I Qlik Predict, bestäms MASE genom att jämföra det genomsnittliga absoluta felet (MAE) för en prognos med MAE för en naiv prognos. I den naiva prognosen används den senast tillgängliga värdet som prognosvärde för samtliga steg.
MAE
MAE står för genomsnittligt absolut fel. Tillsammans med MASE är MAE ett av nyckelmåtten som används för att bedöma och rekommendera tidsseriemodeller i Qlik Predict. MAE mäter modellkvalitet genom att beräkna felfrekvensen inom prognoser som skapats av modellen.
RMSE
RMSE (root mean squared error) kan tolkas som den genomsnittliga skillnaden i +/- som förväntas mellan ett förutsagt värde och det faktiska värdet. Det är standardavvikelsen för residualer (skillnaden mellan det observerade värdet och det förutsagda värdet för en funktion). RMSE mäts i samma enhet som målvärdet.
Som exempel kan vi säga att vårt mål är att förutsäga kontraktsvärdet och att vi får RMSE = 1 250. Detta innebär att det förutspådda värdet i genomsnitt skiljer sig +/- 1 250 dollar från det faktiska värdet.
Förutsägelsehastighet
Prognoshastighet är ett modellmått som gäller för alla modelltyper: binär klassificering, flerklassig klassificering, regression, och tidsserier. Prognoshastighet mäter hur snabbt en maskininlärningsmodell kan generera prognoser.
På Qlik Predict beräknas prognoshastigheten med hjälp av den kombinerade beräkningstiden för funktioner och prognostiden för testdatauppsättning. Den visas i rader per sekund.
Prognoshastigheten kan analyseras i tabellen Modellmätvärden efter att du har kört din experimentversion. Du kan också visa data om prognoshastighet när du analyserar modeller med inbäddad analys. Mer information finns här:
Överväganden
Den uppmätta prognoshastigheten baseras på storleken på träningsdatauppsättningen snarare än på de data som prognoserna görs på. När du har distribuerat en modell kan du märka skillnader mellan hur snabbt prognoser skapas om tränings- och prognosdata skiljer sig mycket åt i storlek, eller när du skapar prognoser i realtid på en eller en handfull datarader.