Ana içeriğe geç Tamamlayıcı içeriğe geç

Sizin için en iyi modeli seçme

Deneyinizin sonuçlarını analiz ederken, kullanım durumunuz için önemli olan belirli özelliklere sahip modelleri aramanız önemlidir. Örneğin, sürekli olarak doğru tahminlere ek olarak, tahminleri hızlı bir şekilde sunabilen modellere de ihtiyacınız olabilir. Deneyinizdeki Modeller sekmesinde, çeşitli analiz açılarına dayalı olarak size modeller önerilir.

Bir deney için en iyi modelleri analiz etme

En iyi modellerin öneri olarak sunulduğu bir ML deneyindeki "Model metrikleri" tablosu

Filtrelerinize bağlı olarak, birkaç farklı kalite perspektifini değerlendirmenize yardımcı olmak için önerilen modeller sunulmuştur. Tek bir model birden fazla şekilde en iyi model olarak kabul edilebilir. En iyi model türleri şunlardır:

Kullanıcı arayüzünde en iyi modelleri görüntüleme

Deneyiniz için en iyi modelleri bulma ve keşfetme hakkında bilgi için bkz. Model metrikleri tablosunu analiz etme.

En iyi model

Filtrelerinize bağlı olarak, analiz için en iyi model otomatik olarak seçilir. En iyi model bir Kupa simgesiyle vurgulanır.

Qlik Predict içinde en iyi model, hem doğruluk metriklerini hem de tahmin hızını dikkate alan dengeli bir hesaplamaya göre belirlenir.

En iyi modeli belirlemek için aşağıdaki işlem otomatik olarak gerçekleştirilir:

  1. Model türü tarafından belirlenen tahmine dayalı performansı metriği için en yüksek puana sahip modeli seçin. Kullanılan metrikler şunlardır:

    • İkili sınıflandırma: F1

    • Çok sınıflı sınıflandırma: F1 Makro

    • Regresyon: R2

    • Zaman serisi: MASE (MASE mevcut değilse MAE)

  2. 1. Adımdaki performans puanlarını kullanarak, en yüksek puan alan modelin puanının yüzde beşi içinde kalan tüm modelleri seçin.

  3. Seçilen tüm modeller arasından en yüksek tahmin hızına sahip modeli seçin (bkz. Tahmin hızı). Bu model en iyi modeldir.

En doğru

Modelinizin tutarlı bir şekilde yüksek doğrulukta tahminler üretebilmesi önemlidir. F1, F1 Makro ve R2, model doğruluğunu kapsamlı bir şekilde yansıtan dengeli bir puanlama sağlasa da modelleriniz için ham doğruluk ve kesinlik metrikleriyle de ilgilenebilirsiniz.

En doğru model bir Hedef simgesiyle vurgulanır. En doğru modeli belirlemek için aşağıdaki işlem otomatik olarak gerçekleştirilir:

  1. Model türü tarafından belirlenen tahmine dayalı performansı metriği için en yüksek puana sahip modeli seçin. Kullanılan metrikler şunlardır:

    • İkili sınıflandırma: F1

    • Çok sınıflı sınıflandırma: F1 Makro

    • Regresyon: R2

    • Zaman serileri: MASE (MASE mevcut değilse en düşük MAE olan modeli seçin)

  2. 1. Adımdaki performans puanlarını kullanarak, en yüksek puan alan modelin puanının yüzde onu içinde kalan tüm modelleri seçin.

  3. Model türüne bağlı olarak aşağıdaki iki yoldan biri kullanılır:

    1. İkili sınıflandırma:

      • Eğitim veri kümesi dengeli ise en yüksek doğruluk puanına sahip modeli seçin. Bu en doğru modeldir. Kullanılan özel metrik hakkında bilgi için bkz. Doğruluk.

      • Eğitim veri kümesi dengeli değilse en yüksek kesinlik puanına sahip modeli seçin. Kullanılan özel metrik hakkında bilgi için bkz. Kesinlik.

    2. Çok sınıflı sınıflandırma veya regresyon:

      • En yüksek doğruluk puanına sahip modeli seçin. Aşağıdaki doğruluk metrikleri kullanılır:

        • Çok sınıflı sınıflandırma: Doğruluk

        • Regresyon: MAE

    3. Zaman serisi: En iyi (en düşük) MAE puanına sahip modeli seçin.

En hızlı model

Bir model seçerken, modelin tahminleri ne kadar hızlı sunabileceğine değer vermek isteyebilirsiniz. En hızlı model bir Yıldırım simgesiyle vurgulanır.

Tahmin hızı, hangi modelin en hızlı olduğunu belirler. Bununla birlikte, modellerin tahmin doğruluğu yine de dikkate alınmaktadır. Çünkü bir model hızlı bir şekilde tahmin üretebilir, ancak aynı zamanda makul bir doğrulukla da tahmin yapabilmesi gerekir.

En hızlı modeli belirlemek için aşağıdaki işlem otomatik olarak gerçekleştirilir:

  1. Model türü tarafından belirlenen tahmine dayalı performansı metriği için en yüksek puana sahip modeli seçin. Kullanılan metrikler şunlardır:

    • İkili sınıflandırma: F1

    • Çok sınıflı sınıflandırma: F1 Makro

    • Regresyon: R2

    • Zaman serileri: MASE (MASE mevcut değilse en düşük MAE olan modeli seçin)

  2. Model türüne bağlı olarak aşağıdaki yollardan biri kullanılır:

    1. İkili sınıflandırma:

      • Eğitim veri kümesi dengeliyse doğruluk puanı 1. adımda seçilen modelin doğruluk puanının yüzde onu içinde olan tüm modelleri seçin. Kullanılan özel metrik hakkında bilgi için bkz. Doğruluk.

      • Eğitim veri kümesi dengesizse 1. adımdaki en yüksek puanlı modelin puanının yüzde onu içinde olan tüm modelleri seçin. 1. adımdaki metrikler kullanılır.

    2. Çok sınıflı sınıflandırma veya regresyon:

      • Doğruluk puanı, 1. adımdaki modelin doğruluk puanının yüzde onu içinde olan tüm modelleri seçin. Aşağıdaki doğruluk metrikleri kullanılır:

        • Çok sınıflı sınıflandırma: Doğruluk

        • Regresyon: MAE

    3. Zaman serisi: 1. adımdaki modelin MAE puanının yüzde onu içindeki tüm modelleri seçin.

  3. Seçilen tüm modeller arasından en yüksek tahmin hızına sahip modeli seçin (bkz. Tahmin hızı). Bu model en hızlı modeldir.

Tahmin hızı

Tahmin hızı tüm model türleri için geçerli olan bir model metiriğidir: ikili sınıflandırma, çok sınıflı sınıflandırma, regresyon ve zaman serisi. Tahmin hızı, bir makine öğrenimi modelinin ne kadar hızlı tahmin üretebildiğini ölçer.

Qlik Predict içinde tahmin hızı, birleşik özellik hesaplama süresi ve test veri kümesi tahmin süresi kullanılarak hesaplanır. Saniye başına satır cinsinden görüntülenir.

Tahmin hızı, deney sürümünüzü çalıştırdıktan sonra Model metrikleri tablosunda analiz edilebilir. Eklenmiş analizler içeren modelleri analiz ederken tahmin hızı verilerini de görüntüleyebilirsiniz. Daha fazla bilgi için şuraya bakın:

Dikkat edilmesi gereken noktalar

Ölçülen tahmin hızı, tahminlerin yapıldığı verilerden ziyade eğitim veri kümesinin boyutuna dayanmaktadır. Bir modeli dağıttıktan sonra, eğitim ve tahmin verilerinin boyutları büyük ölçüde farklıysa veya bir ya da birkaç veri satırı üzerinde gerçek zamanlı tahminler oluştururken tahminlerin oluşturulma hızları arasında farklılıklar olduğunu görebilirsiniz.

Aşırı öğrenme

Aşırı uyum, bir modelin tahmine dayalı davranışı, eğitim veri kümesiyle çok yakından eşlendiğinde ortaya çıkar. Bir model aşırı uyumluysa muhtemelen yalnızca eğitim veri kümesindeki kalıpları ezberlemiştir ve gelecekteki değerleri doğru bir şekilde tahmin edemeyecektir.

Aşırı uyumun, eğitim algoritmalarıyla ilgili sorunlar ve aşırı kısa veya karmaşık eğitim veri kümeleri dahil olmak üzere çeşitli nedenleri olabilir.

Qlik Predict içinde aşırı uyum, tahmin hızı hariç, en iyi model seçimi sürecinde kullanılan tüm metrikler için test-eğitim sonuçlarının analizi yoluyla otomatik olarak belirlenir:

Test ve eğitim sonuçları karşılaştırılırken bu metriklerden herhangi biri arasında yüzde ondan daha büyük bir fark varsa modelin aşırı uyumlu olduğundan şüphelenilir.

Bir modelin aşırı uyumlu olduğundan şüpheleniliyorsa iyi puan alsa bile asla önerilen bir model olarak sunulmaz. Model, Model ölçümleri tablosunda bir Uyarı uyarısıyla işaretlenir.

Filtrelerinizde gösterilen tüm modellerin aşırı uyumlu olduğundan şüpheleniliyorsa model önerileri verilmez.

Aşırı uyumun ele alınması

Aşırı uyumu şu şekilde ele alabilirsiniz:

  • Aşırı uyum sağladığından şüphelenilen modelleri dağıtmayın.

  • Eğitim veri kümenizde bir sorun olduğundan şüpheleniyorsanız aşırı uyumu önlemek için eğitim verilerinizi nasıl hazırlayabileceğinizi öğrenmek üzere bkz. Veri kümenizi eğitim için hazırlama.

Bu sayfa size yardımcı oldu mu?

Bu sayfa veya içeriği ile ilgili bir sorun; bir yazım hatası, eksik bir adım veya teknik bir hata bulursanız lütfen bize bildirin!