Ana içeriğe geç Tamamlayıcı içeriğe geç

Regresyon problemleri

Regresyon problemleri, sayısal hedef sütununa sahip makine öğrenimi problemleridir. Aşağıdaki örnekte, bir iş sorusunun nasıl kesin bir şekilde oluşturulacağı ve ardından tüm özelliklerin eşit düzeyde olduğu bir eğitim veri kümesinin nasıl toplanacağı gösterilmektedir. Bu, tahmine dayalı bir regresyon modeli oluştururken iyi bir temel sunar.

Regresyon örneği: Müşteri yaşam boyu değeri

Öncelikle, eski müşterilerle eğitilen bir makine öğrenimi modelinin, tahmini etkileyen çeşitli özellikleri kullanarak müşteri yaşam boyu değerini tahmin etmeyi öğreneceğini varsayalım. Eski ve mevcut tüm müşterilerle ilgili geçmiş verileri içeren bir veri kümesi topluyoruz. Her satır bir müşteriye ait ve sütunlar da müşteriyi tanımlayan şu özellikleri temsil ediyor: müşteri kimliği, cinsiyet, yaş, müşteri oldukları tarih, posta kodu, yaptıkları satın almalar ve toplam harcama tutarı.

Toplanan verilerin örneklemi

Eğitim verileri örneklemini içeren tablo.

Müşteri yaşam boyu değerini, toplam harcama tutarı olarak tanımlayabilir, bir makine öğrenimi algoritmasını bu veri kümesiyle besleyebilir ve algoritmanın, toplam harcama tutarını tahmin etmeyi öğrenmesini sağlayabiliriz. Gelecekte yeni müşteriler kazanıldığında, müşteri yaşamları boyunca ne kadar parasal değer sağlayacaklarını tahmin etmek için bu eğitilmiş algoritmayı kullanabiliriz. Ancak bu yaklaşımda birkaç sorun var:

  • Veri kümesi, bir gün, bir ay veya bir yıl boyunca müşteri olmuş kişileri içeriyor olabilir. Toplam harcama tutarı değeri, müşterinin ne kadar harcama yapacağını yansıtmak yerine bugüne kadar yaptığı toplam harcama tutarını temsil ediyor.

  • Bir gün önce hesap oluşturmuş bir müşteri, yüksek kazançlı müşteri niteliklerine sahip olabilir. Ancak yalnızca dünden beri müşterimiz olduğu için bir satın alma işlemi gerçekleştirmiş ve çok fazla harcama yapmamıştır. Bu müşterileri eğitim veri kümesine dahil ettiğimizde, makine öğrenimi algoritmasına yanlış bir şekilde, bu kişilerin fazla para kazandırmayan müşteri tipinde olduklarını öğretmiş oluruz.

  • İlk ayında haftada üç kez ürün siparişi (toplam 12 satın alma) veren yeni bir müşterimiz olabilir. Bir yıldır müşterimiz olan bir başkası ise ayda bir kez satın alma gerçekleştirerek aynı tutarda harcama yapmıştır. Makine öğrenimi bu iki kişiyi, müşteri yaşam boyu değeri açısından eşit seviyede algılar ancak aslında bir aylık müşteri, uzun vadede daha fazla değer sağlayacak olabilir.

Bu yanılgılardan kaçınmak için, müşteri yaşam boyu değerini tanımlarken ve probleme yönelik bir veri kümesi hazırlarken açık olmamız gerekir. Bunu yapmanın iyi bir yolu, problem tanımına zamanı bir faktör olarak eklemektir.

Zaman faktörü ekleme

Zaman faktörü eklemek için öncelikle ilk yıl değerini, müşterinin müşteri olduğu ilk yıl içinde harcadığı toplam para olarak tanımlarız. Daha sonra müşterinin ilk üç ay içindeki davranışlarından, ilk yılındaki toplam harcamasını tahmin ederken kullanacağımız özellikler olarak yararlanabiliriz. İlk yıl değeri, ilgilendiğimiz bir metriğe ait, zaman dilimi içeren açık bir tanım olur. Bu şekilde açıkça tanımlanmış bir metrik oluşturmanın avantajı, eğitim veri kümemizdeki tüm örnekleri eşit seviyeye getirmesidir.

Artık kişilerin, müşteri olarak ilk yıl boyunca harcadıkları toplam parayı bulmaya çalıştığımız için eğitim veri kümesini, yalnızca en az bir yıllık müşteri olan kişilerle sınırlandırmamız gerektiğini unutmayın. Şuna benzer bir veri kümesi hazırlayabiliriz:

Zaman faktörü barındıran bir veri kümesi

Eğitim verileri örneklemini içeren tablo.

Burada her satır, en az bir yıldır müşteri olan bir kişiyi temsil ediyor. Sütunlar, müşterileri, müşteri oldukları an itibarıyla tanımlayan özelliklerin yanı sıra seçilen zaman dilimindeki müşteri etkinliklerini temsil eden özellikleri de içeriyor.

Etkinlik, ilk üç ayda yapılan satın alma işlemi sayısı ve ilk üç aydaki toplam harcama tutarı ile ölçülüyor. Hedef sütun, ilk yılda harcanan toplam parayı temsil ediyor. Bu, makine öğrenimi algoritmasına nasıl tahmin edileceğini öğreteceğimiz ilk yıl değeridir.

Şu anda, bir zaman dilimi içinde tanımlanan çok açık bir soru sorduğumuzu göreceksiniz: "İlk üç ay içindeki davranışlarına dayanarak bir müşterinin ilk yılı boyunca ne kadar para kazandıracağını tahmin et."

İLGİLİ ÖĞRENME KAYNAKLARI:

Daha fazla bilgi

Bu sayfa size yardımcı oldu mu?

Bu sayfa veya içeriği ile ilgili bir sorun; bir yazım hatası, eksik bir adım veya teknik bir hata bulursanız, bize bildirin, düzeltelim!