Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Ekstrapolacja i interpolacja

Podczas tworzenia predykcji istotny jest zakres danych. Jeśli brakuje punktów danych w zakresie danych, do przewidywania wartości, które znajdują się w brakującym zakresie, używa się interpolacji i ekstrapolacji.

Aby zilustrować pojęcia interpolacji i ekstrapolacji, posłużymy się przykładem przewidywania sprzedaży lemoniady. Pokazuje on również ryzyko związane z ekstrapolacją, z którego należy zdawać sobie sprawę. Na naszym wykresie sprzedaż lemoniady w dolarach jest przedstawiona w odniesieniu do maksymalnej temperatury dziennej. Widzimy, że sprzedaż rośnie, gdy wzrasta temperatura.

Dane dotyczące sprzedaży w odniesieniu do temperatury

Wykres sprzedaży w odniesieniu do temperatury.

Zebraliśmy dane tylko dotyczące dni z temperaturą od 70 do 90°F (21–32°C). Oznacza to, że nasz zakres danych, czyli domena, to 70–90°F.

Interpolacja

Interpolacja występuje wtedy, gdy dokonuje się predykcji między znanymi wartościami lub w domenie danych do uczenia. W naszym przykładzie nie zebraliśmy żadnych danych dotyczących sprzedaży w dniu o temperaturze 77°F. Wartość 77 mieści się w przedziale 70–90, więc przewidywanie sprzedaży na ten dzień można uznać za interpolację.

Brak danych zebranych z dnia o temperaturze 77°F

Wykres sprzedaży w odniesieniu do temperatury z linią na 77°F.

Załóżmy, że chcemy przewidzieć, jaka będzie jutro sprzedaż, jeśli temperatura osiągnie 77°F. Linia trendu pokazana na wykresie przedstawia predykcje modelu uczenia maszynowego dla dowolnej temperatury. Przy temperaturze 77°F model przewiduje sprzedaż w wysokości 67 USD.

Przewidywana wartość 67 USD wzdłuż linii trendu przy 77°F

Wykres sprzedaży w odniesieniu do temperatury przedstawiający przewidywaną wartość dla 77 stopni.

Ekstrapolacja

Ekstrapolacja oznacza, że dokonujesz predykcji wykraczającej poza znane wartości lub poza domenę danych do uczenia. Nie mamy danych sprzedaży dotyczących dnia z maksymalną temperaturą poniżej 70°F ani powyżej 90°F. Przewidywanie sprzedaży w dniach o temperaturze poniżej 70°F lub powyżej 90°F byłoby uważane za ekstrapolację.

Jeśli chcemy przewidzieć, jak przeniesienie się do cieplejszego lub chłodniejszego miejsca lub inna pora roku wpłynie na sprzedaż, musimy dokonać ekstrapolacji do 65°F i 95°F. Linię trendu można ponownie wykorzystać do przewidywania wartości, rozszerzając ją poza domenę.

Przewidywane wartości 7 USD przy 65°F i 157 USD przy 95°F wzdłuż linii trendu

Wykres sprzedaży w odniesieniu do temperatury przedstawiający przewidywane wartości dla 65°F i 95°F.

Problem z ekstrapolacją

Musimy sobie zadać pytanie: czy linia trendu naprawdę wykracza poza granice naszych danych. Nasz model przewiduje wyższą sprzedaż w cieplejsze dni, więc czy powinniśmy zacząć sprzedawać lemoniadę w Arizonie, w której temperatura osiąga 100°F? Czy sprzedaż nadal rosłaby, jak na następującym wykresie?

Przewidywane wartości dla temperatur powyżej 90°F

Wykres sprzedaży w odniesieniu do temperatury przedstawiający przewidywane wartości dla wysokiej temperatury.

Załóżmy, że budujemy stoisko z lemoniadą w Arizonie i rejestrujemy dane sprzedażowe. Zamiast zwiększonej sprzedaży okazuje się, że gdy robi się zbyt gorąco, klienci pozostają w domach, a sprzedaż gwałtownie spada! Problem związany z ekstrapolacją polega na tym, że wzorzec nie zawsze pozostaje taki sam. W przykładzie z lemoniadą ekstrapolacja doprowadziła do złego wyniku biznesowego.

Przewidywany wynik przebiega wzdłuż czerwonej linii, ale rzeczywisty wynik oznaczony na niebiesko ma inny wzorzec

Wykres sprzedaży w odniesieniu do temperatury przedstawiający różnicę między wartościami przewidywanymi a rzeczywistymi.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!