Yeni özellik sütunları oluşturma
Özellik mühendisliği, mevcut özellik sütunlarından yola çıkarak yeni özellik sütunları oluşturma işlemidir. Bir iş sorusunu yanıtlamak için, topladığınız kaynak verilerden ek tahmin gücü elde etmenize yardımcı olur.
Örneğin, yüksek nicelik nedeniyle müşterilerin adresleri eğitim verilerinden hariç tutulur. Adresleri kullanmak yerine mesafe sütunu biçiminde bir özellik oluşturabiliriz. Müşteri adresinin yanında çeşitli mağaza konumlarını da biliyorsa mağazaya olan mesafe hesaplanabilir. Yeni sütunlar sayısal değerler içereceğinden bunlar, verilerdeki ölçülebilir örüntüleri ortaya çıkarmak için kullanılabilir.
AutoML'de kullanıma hazırlanmak için veri kümeniz üzerinde özellik mühendisliği gerçekleştirebilirsiniz. Ayrıca AutoML, mevcut özelliklerden otomatik olarak oluşturulabilecek yeni özellikler önerir.
Olası sorunları veya yapılabilecek iyileştirmeleri tespit etmek için veri kümenizdeki özellikleri inceleyin. İyi özellikler oluşturma, beceri ve iş deneyimi gerektirir. Özelliklerin, hedef sütuna doğrudan bağlanacak biçimde ifade edilmesi önerilir.
Göz önünde bulundurulması gerekenler:
-
Zaman, özelliğe dahil edilmeli mi?
-
Değişim oranı önemli mi?
-
Veri alt kümelerindeki farklılıkları hesaplamak için özellik normalleştirilmeli mi?
-
Null değerlerin bir anlamı var mı?
Otomatik tasarlanmış özellikler
Otomatik özellik mühendisliği ile yeni özellikler, mevcut özelliklerden otomatik olarak oluşturulur.
AutoML, tarih ve saat bilgisi içeren sütunlardan otomatik tasarlanmış özellikler üretir. Bu yeni özellikler, sütun değerlerinin her bir bileşenini kendi özelliklerine ayırır.
Buna ek olarak, serbest metin içeren sütunlara özel işleme uygulanabilir. Orijinal serbest metin özellikleri, model eğitimini iyileştirecek yeni özelliklere dönüştürülür.
Otomatik tasarlanmış özellikler, siz onları eğittikçe modellerinizin tahmine dayalı ve analitik değerini artırır. Daha fazla bilgi için bk. Otomatik özellik mühendisliği.
Örnekler: Özellik oluşturma
Verilerinizin, tahmini destekleyici niteliğini artırabilecek özelliklerin nasıl oluşturulacağına dair beyin fırtınası yapmaya başlamak için aşağıdaki örnekleri kullanın.
Satış fırsatı kapatılacak mı?
Hedef sütun, satış fırsatının kapatılıp kapatılmayacağını (Evet veya Hayır) belirtir.
-
Orijinal özellik: Toplantı sayısı
-
Alternatif özellikler: Ay başına toplantı sayısı veya belirli bir aşamadaki toplantı sayısı
Ölçümü, toplantı sıklığına dönüştürmek, değişimi daha iyi açıklar. Satış sürecinin belirli bir aşamasındaki toplantıların ölçülmesi, satış ivmesini daha iyi ifade eder ve döngüyü açıklar.
Gelecekteki bir işlem tutarını tahmin etme
Hedef sütun, sonraki işlem tutarıdır.
-
Orijinal özellik: Son sipariş miktarı
-
Alternatif özellikler: Ortalama sipariş tutarı veya sipariş tutarındaki değişim yüzdesi
Ortalama tutar, sipariş davranışına daha geniş bir açıklama sunar. Satın alma örüntüsündeki değişim, normalleştirilmiş bir değer sağlar.
Müşteriyi kaybedecek miyiz?
Hedef sütunda müşterinin kaybedilip kaybedilmeyeceği (Evet veya Hayır) belirtilir.
-
Orijinal özellik: Müşteri hassasiyeti
-
Alternatif özellikler: Müşteri hassasiyetindeki değişim veya geçerli hassasiyeti içeren gün sayısı
Hassasiyetteki değişimi ölçmenin eyleme yol açma olasılığı daha fazladır. Gün sayısı ise geçerli durumun süresini sağlar.
Çalışan gönüllü olarak işten ayrılacak mı?
Hedef sütunda çalışanın işten ayrılıp ayrılmayacağı (Evet veya Hayır) belirtilir.
-
Orijinal özellik: Maaş
-
Alternatif özellikler: Aynı düzeydeki çalışanlara kıyasla maaş veya sektör ortalamasına kıyasla maaş
Maaşı aynı düzeydeki çalışanlarla kıyaslamak, çalışanın deneyimine veya hassasiyetine daha iyi uyarlanır. Sektördeki ortalama maaşla karşılaştırma, çalışanın fırsat maliyetine daha iyi uyarlanır.
Potansiyel müşteri, fırsata dönüşecek mi?
Hedef sütunda, potansiyel müşterinin dönüşüp dönüşmediği (Evet veya Hayır) belirtilir.
-
Orijinal özellik: Bizi nasıl buldunuz?
-
Alternatif özellikler: Yanıtlandı (Evet veya Hayır)
Burada yanıtın ne olduğu değil, eylem önemlidir. Bu senaryoda null değerlerin bir anlamı olduğunu, eylemsizlik belirttiğini unutmayın.
Tarihler
AutoML'in otomatik özellik mühendisliği işleviyle, tarihlerin ve zaman damgalarının bileşenleri otomatik olarak ayrı sütunlara ayrıştırılır.
Tarihler, tek bir veri kümesinde çeşitli özellikler oluşturmak için başka birçok şekilde de tasarlanabilir, örneğin:
-
Tarihleri mevsim, çeyrek veya dönemler halinde bir araya toplayın.
-
Tarih arkını (örneğin, son satın almanın üzerinden geçen gün sayısını) hesaplayın.