Ekstrapolasyon ve enterpolasyon
Tahmin yaparken verilerinizin aralığı önemlidir. Veri aralığında veri noktaları eksikse bu eksik aralıktaki değerleri tahmin etmek için enterpolasyon ve ekstrapolasyon kullanılır.
Enterpolasyon ve ekstrapolasyon kavramlarını açıklamak için limonata satışlarının tahmin edildiği bir örneği kullanacağız. Aynı zamanda bu örnekte, dikkat etmeniz gereken ekstrapolasyon riskleri de gösterilmektedir. Grafiğimizde, günlük maksimum sıcaklığa göre dolar cinsinden limonata satışları çizilmiştir. Sıcak havalarda satışların arttığını görebiliyoruz.
Yalnızca sıcaklığın 70-90 Fahrenheit olduğu günlere ait verileri topladık. Bu, veri aralığımızın veya tanım kümemizin 70-90°F olduğu anlamına gelir.
Enterpolasyon
Enterpolasyon, bilinen değerler arasında veya eğitim verilerinin tanım kümesi içinde tahmin yapmaya verilen addır. Örneğimizde, sıcaklığın 77°F olduğu gün için hiç satış verisi toplanmamış. 77 değeri, 70-90 arasında yer aldığından bu güne ait satış tahmini yapıldığında bu enterpolasyon olarak kabul edilir.
Sıcaklık 77°F olursa yarınki satışların ne kadar olacağını tahmin etmek istediğimizi varsayalım. Grafikte gösterilen eğilim çizgisi, makine öğrenimi modelinin belirtilen herhangi bir sıcaklık için yapacağı temsil ediyor. Model, 77°F sıcaklık için 67 $ tutarında satış olacağını tahmin ediyor.
Ekstrapolasyon
Ekstrapolasyon, bilinen değerlerin veya eğitim verilerinin tanım kümesi dışında bir tahmin yaptığınız anlamına gelir. Elimizde, maksimum sıcaklığın 70°F altında veya 90°F üzerinde olduğu bir güne ait hiç satış verisi yok. Sıcaklığın 70°F altında veya 90°F üzerinde olduğu günler için satış tahmini yapmak, ekstrapolasyon olarak kabul edilir.
Daha sıcak veya serin bir konuma ya da mevsime geçiş yapmanın satışları nasıl etkileyeceğini tahmin etmek istediğimizde 65°F ve 95°F için ekstrapolasyon yapmamız gerekir. Tanım kümesi dışına uzanan değerleri tahmin etmek için yine eğilim çizgisi kullanılabilir.
Ekstrapolasyonda karşılaşılan zorluklar
Eğilim çizgisinin gerçekten verilerimizin sınırları dışında devam edip etmediğini sormamız gerekir. Modelimiz, sıcak havalar için yüksek satış tahmininde bulunuyor. Bu nedenle sıcaklığın 100°F olduğu Arizona'da limonata satmaya başlamamız gerekiyor? Satışlar aşağıdaki grafikte olduğu artmaya devam eder mi?
Arizona'da bir limonata standı kurduğumuzu ve satış verilerini kaydettiğimizi varsayalım. Artan satışlar yerine, müşterilerin çok sıcak havalarda evlerinde kaldığı ve satışlarda sert düşüşler olduğu görülüyor! Ekstrapolasyon yöntemindeki sorun, örüntünün her zaman aynı kalmamasıdır. Limonata örneğimizde ekstrapolasyon, iş açısından kötü sonuçlar verdi.