Deney eğitiminde SHAP'ın önemini anlama
SHAP importance, deneylerde oluşturulan tahminler hakkında önemli içgörüler sunar. Tahmin açısından en önemli özelliklerin hangileri olduğunu anlamanıza yardımcı olabilir.
SHAP değerleri, o satırdaki diğer tüm özellikler göz önüne alındığında, her bir özelliğin hedefin tahmin edilen değerine ne kadar katkıda bulunduğunu temsil eder.
Bir deney sürümünü eğittikten sonra bir model seçin. Modeller sekmesinde tablonun altındaki SHAP önem grafiği, bekletme (test) verileri üzerinde oluşturulan model tahminlerinden elde edilen SHAP verilerini görselleştirmektedir.
Bu yardım konusu, deney eğitiminde SHAP'ın önemine odaklanmaktadır. Bir tahmin sırasında oluşturulan SHAP önem veri kümeleri hakkında bilgi için bk. Tahminler sırasında SHAP veri kümelerinin oluşturulması.
Genel bakış
SHAP importance, satır düzeyinde ölçülür. Bir özelliğin, tek bir satırın tahminini, söz konusu satırdaki diğer özelliklere ve veri kümesindeki ortalama sonuca kıyasla nasıl etkilediğini temsil eder. Değerin hem yönü hem de büyüklüğü vardır ancak model eğitimi için SHAP önemi mutlak değer biçiminde temsil edilir.
SHAP importance grafiğinde satır düzeyinde değerler toplanır. Bu, özelliğin, verinin alt kümeleri içindeki etkisini anlamanızı sağlar.
İkili sınıflandırma ve regresyon deneyleri
Bir ikili sınıflandırma veya regresyon deneyinde her model sürümünün SHAP importance grafiği, deneydeki her özellik için ortalama mutlak SHAP değerini gösteren bir sütun grafiktir. SHAP importance, en yüksekten en düşük değere göre sıralanır. Grafik, sonucun ne olarak belirlendiğine bakılmaksızın, hedefin tahmin edilen sonucu üzerinde hangi özelliklerin en çok ve en az etkiye sahip olduğunu gösterir.
Çok sınıflı sınıflandırma deneyleri
Bir çok sınıflı sınıflandırma deneyinde, SHAP importance grafiğinin sunumu için birden çok seçenek vardır. Aşağıdaki seçenekler vardır:
Toplam olarak sunulan özellik SHAP'ı
Sınıfa göre ayrılmış özellik SHAP değerleri
Tek sınıflı SHAP importance grafikleri
Toplam olarak sunulan özellik SHAP'ı
Varsayılan olarak, SHAP importance grafiği Tüm sınıflar: Ortalama özellik SHAP'ı ayarlarıyla yapılandırılır.
Bu yapılandırma, hedefin tahmin edilen sonucunun ne olduğuna bakmaksızın her bir özelliğin SHAP importance'ını gösterir. Grafikteki özellikler, toplam ortalama mutlak SHAP değerine göre sıralanmıştır ve sınıfa göre ayrılmamıştır.
Sınıfa göre ayrılmış özellik SHAP değerleri
Deneydeki her sınıfın bir değeri olan hedefin sonucu üzerinde her bir özelliğin ne kadar etkisi olduğunu görüntülemek için Sınıfa göre özellik SHAP'ı ayarını seçin. Yapılandırma, Gruplanmış veya Yığın olarak ayarlanabilir. Deneydeki her sınıfın ortalama mutlak SHAP değerleri, sınıfa göre karşılaştırmaya olanak sağlamak için farklı renklerle sunulmuştur.
Örneğin, deneyinizdeki hedef alanın dört olası sınıfı veya sonucu olduğunu varsayalım (Mor Plan, Yeşil Plan, Mavi Plan ya da Kırmızı Plan). Her özelliğin çok renkli sütunu, o özelliğin deneyin dört olası sonucunun her biri üzerinde ne kadar etki yarattığını gösterir. Sütunun toplam uzunluğuna bakarsanız tahmin edilen sonuç ne olursa olsun, özelliğin hedefin tahmini üzerinde yarattığı toplam etkiyi görürsünüz.
Tek sınıflı SHAP importance grafikleri
Ayrıca hedef tahmininin olası sonuçlarının her biri için bir SHAP importance grafiği görüntüleme seçeneğiniz de vardır. Tek bir sınıfın tahmin edilen sonuçları için ortalama mutlak SHAP değerleri sunulur.
Örneğin, deneyinizin hedefinin dört olası sonucu varsa dört olası sonucun her biriyle sonuçlanan tahminler için en etkili özelliklerin dökümünü çıkaran dört ayrı grafik görüntüleyebilirsiniz.
SHAP değerlerinin hesaplaması
SHAP değerleri çeşitli algoritmalar için hesaplanır. SHAP importance iki farklı yöntemle hesaplanır:
Ağaç SHAP'ı: Ağaç modelleri için SHAP değerlerinin tahmin edildiği hızlı ve kesin bir yöntem
Doğrusal SHAP: Doğrusal modeller için SHAP değerlerini hesaplama yöntemi
Algoritma | Desteklenen model türleri | SHAP hesaplama yöntemi |
---|---|---|
Rastgele Orman Sınıflandırması | İkili sınıflandırma, çok sınıflı sınıflandırma | Ağaç SHAP'ı |
XGBoost Sınıflandırması | İkili sınıflandırma, çok sınıflı sınıflandırma | Ağaç SHAP'ı |
LightGBM Sınıflandırması | İkili sınıflandırma, çok sınıflı sınıflandırma | Ağaç SHAP'ı |
CatBoost Sınıflandırması | İkili sınıflandırma, çok sınıflı sınıflandırma | Ağaç SHAP'ı |
Lojistik Regresyon | İkili sınıflandırma, çok sınıflı sınıflandırma | Doğrusal SHAP |
Lasso Regresyon | İkili sınıflandırma, çok sınıflı sınıflandırma | Doğrusal SHAP |
Elastik Net Regresyon | İkili sınıflandırma, çok sınıflı sınıflandırma | Doğrusal SHAP |
Gauss Naive Bayes | İkili sınıflandırma, çok sınıflı sınıflandırma | SHAP hesaplanmadı |
CatBoost Regresyonu | Regresyon | Ağaç SHAP'ı |
LightGBM Regresyonu | Regresyon | Ağaç SHAP'ı |
Lineer Regresyon | Regresyon | Doğrusal SHAP |
Rastgele Orman Regresyonu | Regresyon | Ağaç SHAP'ı |
SGD Regresyonu | Regresyon | Doğrusal SHAP |
XGBoost Regresyonu | Regresyon | Ağaç SHAP'ı |
Temel etken analizi
Belirli faktörlerin belirli bir iş veya performans metriği için gözlemlenen verileri belirlemedeki önemini karşılaştırmak için doğrudan bir Qlik Sense uygulamasında temel etken analizi oluşturabilirsiniz. Temel etken analizi, değerlendirmeye alınan her bir faktör için SHAP değerlerini satır düzeyince hesaplayıp bunları birleştirilmiş biçimde göstererek çalışır. Bu, uygulama verilerinizdeki trendleri ve davranışı nelerin etkilediğine dair üst düzey bir görünüm sağlar. Kuruluşunuzun veri okuryazarlığını artırmak ve daha bilinçli, etkili kararlar almak için temel etken analizlerinin sonuçlarını kullanabilirsiniz.
Daha fazla bilgi için bkz. Temel etken analizi kullanarak verilerinizin arkasındaki temel etkenleri keşfetme.