Gå till huvudinnehåll Gå till ytterligare innehåll

Skapa tidskänsliga modeller

Med tidskänslig träning kan du bygga modeller som klarar att förutsäga data längs en tidsbaserad kolumn som finns i dina träningsdata. Aktivera tidskänslig träning om du behöver göra prognoser på en målkolumn som du vet påverkas av den här tidsbaserade kolumnen.

Tidskänslig utbildning hjälper till att minska dataläckage genom att tillämpa specialiserad databehandling på utbildningsdata. Denna bearbetning gör att algoritmer för maskininlärnings bättre kan tolka data och prognoskontext utifrån ett visst datum eller en viss tidsdimension.

För att träna tidskänsliga modeller behöver du en kolumn i din träningsdatadatauppsättning som innehåller datum eller tidsmarkördata. Denna kolumn är det datumindex som används för att sortera datauppsättningen före träning. Se Krav på datumindexering för mer information om datumindexet.

Användning

Tidskänslig modellträning är perfekt för modeller som prognostiserar förändringar över ett tidsmått som redan finns i träningen. Exempel:

  • Du vill prognostisera din försäljning för nästa månad och du har en kolumn för Transaktionsdatum i din datauppsättning.

  • Du vill prognostisera mätdata för sena leveranser och du har en kolumn för Leveransdatum i din datauppsättning.

Överväganden

Beroende på ditt användningsfall kan tidskänslig modellträning hjälpa dig att bygga bättre modeller. Annars kan du få bättre resultat med AutoML:s standardutbildningsprocess. Om dina data är beroende av en specifik tidsbaserad kolumn på ett betydande sätt är rekommendationen att använda tidskänslig modellträning.

I Qlik AutoML utför tidskänslig träning inte automatisk funktionsgenerering för att generera eftersläpande funktioner för tidsserieproblem. För tidskänsliga användningsfall som kräver funktionsgenerering rekommenderas du att utföra all nödvändig funktionsgenerering under förberedelse av datauppsättningarna.

Hur fungerar tidskänslig träning

Ett vanligt problem inom maskininlärning är att hitta ett sätt att se till att modellerna endast tränas på information som skulle vara tillgänglig vid träningstillfället. Om dina träningsdata innehåller framträdande data och tidsinformation kan denna information användas för att förhindra dataläckage.

Krav på datumindexering

För att aktivera tidskänslig träning måste du ha en kolumn i din datauppsättning som innehåller den information om datum och tid som modellträningen utgår ifrån. Du väljer kolumn när du konfigurerar modelloptimering för träningen.

Om du vill använda en kolumn som datumindex i din utbildning måste kolumnen ha samtliga följande egenskaper:

  • Fullständiga datum. Exempelvis kan inte kolumner som endast innehåller månad eller dag användas.

  • Datatyp för datum eller tidsmarkör.

  • Funktionstypen datum.

Undantagna data och korsvalidering

När du väljer hur data ska separeras för undantag och korsvalideringsprocessen går det att introducera framtida data i modellutbildningen via metoder för slumpmässigt urval. När du aktiverar tidskänslig träning använder AutoML istället följande process:

  • Träningsdatauppsättningen sorteras efter din valda indexkolumn innan den separeras i tränings- och undantagsdata.

  • Varje upprepning av träningen använder en fast teststorlek och en gradvis ökande träningsstorlek. Datan blir allt nyare för varje upprepning.

Fullständig information finns i Tidsbaserad korsvalidering.

Annan bearbetning

Tidskänslig modellutbildning använder också andra processer som skiljer sig från standardutbildningsprocesserna. Exempelvis använder tidskänslig utbildning en modifierad process för tillräkning av nollor. Mer information finns i Tillräkning av nollor.

Aktivera tidskänslig utbildning

Tidskänslig modellträning kan aktiveras, inaktiveras eller konfigureras om för varje version som du kör i ett experiment.

  1. I ett experiment klickar du på Schema Visa konfiguration.

  2. Om du redan kört minst en version av experimentet klickar du på Ny version.

  3. Expandera Modelloptimering i panelen.

  4. Under Delning av tidsbaserad testträning väljer du Datumindex för att sortera data.

Du kan ändra den tidskänsliga träningen under förfining av modellen. Du kan till exempel stänga av inställningen eller välja en ny kolumn som datumindex. Mer information finns i Förfining av modeller.

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!