Sizin için en iyi modeli seçme
Deneyinizin sonuçlarını analiz ederken, kullanım durumunuz için önemli olan belirli özelliklere sahip modelleri aramanız önemlidir. Örneğin, sürekli olarak doğru tahminlere ek olarak, tahminleri hızlı bir şekilde sunabilen modellere de ihtiyacınız olabilir. Deneyinizdeki Modeller sekmesinde, çeşitli analiz açılarına dayalı olarak size modeller önerilir.
Bir deney için en iyi modelleri analiz etme
Filtrelerinize bağlı olarak, birkaç farklı kalite perspektifini değerlendirmenize yardımcı olmak için önerilen modeller sunulmuştur. Tek bir model birden fazla şekilde en iyi model olarak kabul edilebilir. En iyi model türleri şunlardır:
Kullanıcı arayüzünde en iyi modelleri görüntüleme
Deneyiniz için en iyi modelleri bulma ve keşfetme hakkında bilgi için bkz. Model metrikleri tablosunu analiz etme.
En iyi model
Filtrelerinize bağlı olarak, analiz için en iyi model otomatik olarak seçilir. En iyi model bir simgesiyle vurgulanır.
Qlik Predict içinde en iyi model, hem doğruluk metriklerini hem de tahmin hızını dikkate alan dengeli bir hesaplamaya göre belirlenir.
En iyi modeli belirlemek için aşağıdaki işlem otomatik olarak gerçekleştirilir:
-
Model türü tarafından belirlenen tahmine dayalı performansı metriği için en yüksek puana sahip modeli seçin. Kullanılan metrikler şunlardır:
-
İkili sınıflandırma: F1
-
Çok sınıflı sınıflandırma: F1 Makro
-
Regresyon: R2
-
Zaman serisi: MASE (MASE mevcut değilse MAE)
-
-
1. Adımdaki performans puanlarını kullanarak, en yüksek puan alan modelin puanının yüzde beşi içinde kalan tüm modelleri seçin.
-
Seçilen tüm modeller arasından en yüksek tahmin hızına sahip modeli seçin (bkz. Tahmin hızı). Bu model en iyi modeldir.
En doğru
Modelinizin tutarlı bir şekilde yüksek doğrulukta tahminler üretebilmesi önemlidir. F1, F1 Makro ve R2, model doğruluğunu kapsamlı bir şekilde yansıtan dengeli bir puanlama sağlasa da modelleriniz için ham doğruluk ve kesinlik metrikleriyle de ilgilenebilirsiniz.
En doğru model bir simgesiyle vurgulanır. En doğru modeli belirlemek için aşağıdaki işlem otomatik olarak gerçekleştirilir:
-
Model türü tarafından belirlenen tahmine dayalı performansı metriği için en yüksek puana sahip modeli seçin. Kullanılan metrikler şunlardır:
-
1. Adımdaki performans puanlarını kullanarak, en yüksek puan alan modelin puanının yüzde onu içinde kalan tüm modelleri seçin.
-
Model türüne bağlı olarak aşağıdaki iki yoldan biri kullanılır:
-
İkili sınıflandırma:
-
Çok sınıflı sınıflandırma veya regresyon:
-
Zaman serisi: En iyi (en düşük) MAE puanına sahip modeli seçin.
-
En hızlı model
Bir model seçerken, modelin tahminleri ne kadar hızlı sunabileceğine değer vermek isteyebilirsiniz. En hızlı model bir simgesiyle vurgulanır.
Tahmin hızı, hangi modelin en hızlı olduğunu belirler. Bununla birlikte, modellerin tahmin doğruluğu yine de dikkate alınmaktadır. Çünkü bir model hızlı bir şekilde tahmin üretebilir, ancak aynı zamanda makul bir doğrulukla da tahmin yapabilmesi gerekir.
En hızlı modeli belirlemek için aşağıdaki işlem otomatik olarak gerçekleştirilir:
-
Model türü tarafından belirlenen tahmine dayalı performansı metriği için en yüksek puana sahip modeli seçin. Kullanılan metrikler şunlardır:
-
Model türüne bağlı olarak aşağıdaki yollardan biri kullanılır:
-
İkili sınıflandırma:
-
Eğitim veri kümesi dengeliyse doğruluk puanı 1. adımda seçilen modelin doğruluk puanının yüzde onu içinde olan tüm modelleri seçin. Kullanılan özel metrik hakkında bilgi için bkz. Doğruluk.
-
Eğitim veri kümesi dengesizse 1. adımdaki en yüksek puanlı modelin puanının yüzde onu içinde olan tüm modelleri seçin. 1. adımdaki metrikler kullanılır.
-
-
Çok sınıflı sınıflandırma veya regresyon:
-
Zaman serisi: 1. adımdaki modelin MAE puanının yüzde onu içindeki tüm modelleri seçin.
-
-
Seçilen tüm modeller arasından en yüksek tahmin hızına sahip modeli seçin (bkz. Tahmin hızı). Bu model en hızlı modeldir.
Tahmin hızı
Tahmin hızı tüm model türleri için geçerli olan bir model metiriğidir: ikili sınıflandırma, çok sınıflı sınıflandırma, regresyon ve zaman serisi. Tahmin hızı, bir makine öğrenimi modelinin ne kadar hızlı tahmin üretebildiğini ölçer.
Qlik Predict içinde tahmin hızı, birleşik özellik hesaplama süresi ve test veri kümesi tahmin süresi kullanılarak hesaplanır. Saniye başına satır cinsinden görüntülenir.
Tahmin hızı, deney sürümünüzü çalıştırdıktan sonra Model metrikleri tablosunda analiz edilebilir. Eklenmiş analizler içeren modelleri analiz ederken tahmin hızı verilerini de görüntüleyebilirsiniz. Daha fazla bilgi için şuraya bakın:
Dikkat edilmesi gereken noktalar
Ölçülen tahmin hızı, tahminlerin yapıldığı verilerden ziyade eğitim veri kümesinin boyutuna dayanmaktadır. Bir modeli dağıttıktan sonra, eğitim ve tahmin verilerinin boyutları büyük ölçüde farklıysa veya bir ya da birkaç veri satırı üzerinde gerçek zamanlı tahminler oluştururken tahminlerin oluşturulma hızları arasında farklılıklar olduğunu görebilirsiniz.
Aşırı öğrenme
Aşırı uyum, bir modelin tahmine dayalı davranışı, eğitim veri kümesiyle çok yakından eşlendiğinde ortaya çıkar. Bir model aşırı uyumluysa muhtemelen yalnızca eğitim veri kümesindeki kalıpları ezberlemiştir ve gelecekteki değerleri doğru bir şekilde tahmin edemeyecektir.
Aşırı uyumun, eğitim algoritmalarıyla ilgili sorunlar ve aşırı kısa veya karmaşık eğitim veri kümeleri dahil olmak üzere çeşitli nedenleri olabilir.
Qlik Predict içinde aşırı uyum, tahmin hızı hariç, en iyi model seçimi sürecinde kullanılan tüm metrikler için test-eğitim sonuçlarının analizi yoluyla otomatik olarak belirlenir:
Test ve eğitim sonuçları karşılaştırılırken bu metriklerden herhangi biri arasında yüzde ondan daha büyük bir fark varsa modelin aşırı uyumlu olduğundan şüphelenilir.
Bir modelin aşırı uyumlu olduğundan şüpheleniliyorsa iyi puan alsa bile asla önerilen bir model olarak sunulmaz. Model, Model ölçümleri tablosunda bir uyarısıyla işaretlenir.
Filtrelerinizde gösterilen tüm modellerin aşırı uyumlu olduğundan şüpheleniliyorsa model önerileri verilmez.
Aşırı uyumun ele alınması
Aşırı uyumu şu şekilde ele alabilirsiniz:
-
Aşırı uyum sağladığından şüphelenilen modelleri dağıtmayın.
-
Eğitim veri kümenizde bir sorun olduğundan şüpheleniyorsanız aşırı uyumu önlemek için eğitim verilerinizi nasıl hazırlayabileceğinizi öğrenmek üzere bkz. Veri kümenizi eğitim için hazırlama.