Gå till huvudinnehåll Gå till ytterligare innehåll

Extrapolering och interpolering

Omfattningen av dina data spelar roll när du gör prognoser. Om datapunkter saknas i ett dataområde används interpolering och extrapolering för att förutsäga de värden som finns i det saknade området.

Vi kommer att använda oss av ett exempel där vi förutspår försäljningen av lemonad för att illustrera begreppen interpolering och extrapolering. Det visar också på riskerna med extrapolering som man måste vara medveten om. I vårt diagram visas försäljningen av lemonad i dollar i förhållande till den dagliga maxtemperaturen. Vi kan se att försäljningen ökar med varmare temperaturer.

Försäljningsdata plottade mot temperaturen

Diagram över försäljningen i förhållande till temperaturen.

Vi har endast samlat in data för dagar med temperaturer mellan 70 och 90 grader Fahrenheit. Detta innebär att vårt dataområde, eller domän, är 70–90 °F.

Interpolering

Interpolering är när du gör en prognos mellan kända värden eller inom träningsdatadomänen. I vårt exempel har vi inte samlat in några försäljningsdata för en dag med 77 °F. Värdet 77 ligger mellan 70 och 90, så att förutsäga försäljningen för den dagen skulle betraktas som en interpolering.

Det finns inga data som samlats in för 77 °F

Diagram över försäljning i förhållande till temperatur med en linje vid 77 grader.

Säg att vi vill förutsäga vad försäljningen kommer att vara i morgon om temperaturen når 77 °F. Den trendlinje som visas i diagrammet representerar vad modellen för maskininlärning skulle förutsäga för en given temperatur. Vid 77 °F förutspår modellen en försäljning på 67 dollar.

Beräknat värde längs trendlinjen på 67 dollar vid 77 °F

Diagram över försäljning i förhållande till temperatur som visar det förutspådda värdet för 77 grader.

Extrapolering

Extrapolering innebär att du gör en prognos utanför de kända värdena eller utanför träningsdataområdet. Vi har inga försäljningsdata för en dag med en maximal temperatur under 70 °F eller över 90 °F. Att förutsäga försäljningen för dagar under 70 °F eller över 90 °F skulle betraktas som extrapolering.

Om vi vill förutsäga hur en flytt till en varmare eller kallare plats eller årstid skulle påverka försäljningen måste vi extrapolera till 65 °F och 95 °F. Trendlinjen kan återigen användas för att förutsäga värdena, genom att den förlängs utanför domänen.

Förutsedda värden längs trendlinjen: 7 dollar vid 65 °F och 157 dollar vid 95 °F

Diagram över försäljningen i förhållande till temperaturen som visar de förutspådda värdena för 65 och 95 grader.

Svårigheten med extrapolering

Frågan vi måste ställa oss är om trendlinjen verkligen fortsätter utanför gränserna för våra data. Vår modell förutspår högre försäljning i varmare väder, så ska vi börja sälja lemonad i Arizona där det blir 100 °F? Skulle försäljningen fortsätta att öka på samma sätt som i följande diagram?

Förutsedda värden för temperaturer över 90 °F

Diagram över försäljning i förhållande till temperatur som visar förutsedda värden för höga temperaturer.

Låt oss säga att vi bygger en lemonadkiosk i Arizona och registrerar försäljningsdata. Istället för ökad försäljning visar det sig att kunderna stannar hemma när det blir för varmt och försäljningen sjunker kraftigt! Utmaningen med extrapolering är att mönstret inte alltid förblir detsamma. I vårt exempel med lemonad ledde extrapoleringen till ett dåligt affärsresultat.

Det förutspådda resultatet följer den röda linjen, men det faktiska resultatet i blått har ett annat mönster

Diagram över försäljning i förhållande till temperatur som visar skillnaden mellan förutsagda värden och faktiska värden.

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!