Ana içeriğe geç Tamamlayıcı içeriğe geç

Çok değişkenli zaman serisi tahminiyle çalışma

Qlik Predict ile zamana özgü metrikleri tahmin etmek için makine öğrenimi modellerini eğitebilirsiniz. Sinir ağı tabanlı yöntemler kullanarak modeller, zamana özgü ilişkilendirmeler, gruplandırılmış hedef veriler, geçmiş özellikleri ve bilinen gelecekteki değişkenleri içeren karmaşık kalıpları öğrenir ve tahmin eder. Zaman serisi tahmini oluşturmak için bir eğitim veri kümesi hazırlayın, bunu bir zaman serisi deneyinde kullanın, bir model dağıtın ve ardından tahminler oluşturmak için kullanabileceğiniz uygulama veri kümeleri oluşturun.

Zaman serisi probleminin bileşenleri

Zaman serisi tahmini ile amaç, gelecekteki belirli tarihler için hedef değerleri tahmin etmektir. Örneğin, gelecek hafta, ay veya çeyrek için satışları tahmin etmek isteyebilirsiniz.

Zaman serisi probleminizi geliştirirken aşağıdaki bileşenleri tanımlayın:

  • Hedef ve gruplar

  • Veri dizini

  • Tahmin ufku

  • Kovaryatlar

Bilgi notuBu çerçeve, zaman serisi tahmin problemlerine yönelik bir makine öğrenimi sorusunun nasıl tanımlanacağını açıklar. Sınıflandırma ve regresyon problemlerine yönelik makine öğrenimi sorularını tanımlamak için Makine öğrenimi sorularını tanımlama bölümüne bakın.

Qlik Predict içinde bir zaman serisi tahmin probleminin bileşenlerini özetleyen basitleştirilmiş çizim.

Hedef

Diğer deney türlerinde olduğu gibi, hedef, modelin gelecekteki değerlerini tahmin etmesini istediğiniz sütundur. Zaman serisi deneyleri için hedef, sayısal veriler (örneğin, satışlar veya envanter) içermelidir.

Zaman serisi tahmininde gruplar kullanıyorsanız, modeller tahmin penceresindeki her zaman adımı için grup başına bir hedef değer tahmin edecektir. Grupları kullanmıyorsanız, eğitilmiş modelleriniz tahmin penceresindeki her zaman adımı için bir hedef değer tahmin edecektir.

Veri dizini

Tarih dizini, zaman serisi metriklerini sürekli bir zaman aralığı (zaman adımı) boyunca izler. Zaman adımınıza erken bir aşamada karar vermeniz gerekir: gelecekteki değerleri ne sıklıkla tahmin etmeniz gerekiyor?

Özellikle, tarih dizini, zaman serisi sorunları için eğitim ve uygulama veri kümelerinizde görünen bir sütundur. Tarih dizini, bu uygulama veri kümelerinin her ikisinin de yapısını belirler; her satır zamanda bir adımı (veya gruplarla, her benzersiz gruplama için zamanda bir adımı) temsil eder.

Bir zaman serisi deneyine eğitim veri kümenizi eklediğinizde, olası tarih dizini sütunları otomatik olarak tanımlanır ve sütun düzeyinde size Öngörüler olarak sunulur. Onları şema görünümündeki Olası tarih dizini öngörüsünden tanımlayabilirsiniz.

Gruplar

Gruplar, ayrı ayrı tahminler oluşturmak istediğiniz kategorik bilgi içeren özelliklerdir. Grupların klasik örnekleri arasında mağaza numarası ve ürün yer alır; bunlar satış gibi bir hedef için verileri düzenlemek amacıyla kullanılabilirdi. Mağaza numarası ve ürün türünü grup olarak seçerek, zaman serisi modelleriniz bu sütunlardaki her bir değer için tahminler sağlayacaktır. Örneğin, satış hedefiyle, üç mağaza numaranız (1, 2 ve 3) ve iki ürün türünüz (bakkaliye ve taze ürün) varsa, modeliniz bu değerlerin her bir benzersiz kombinasyonu için satış tahminleri üretecektir.

Verilere sahipseniz ve kategoriye göre bireysel tahminlere ihtiyacınız varsa, grupları zaman serisi probleminize dahil etmelisiniz. Grupların bir diğer avantajı, modellerin küresel olarak öğrenebilmesi ve tanımladığınız farklı gruplandırmalar arasında var olan kalıpları daha iyi anlayabilmesidir.

Her deney sürümü için kullanılacak grupları yapılandırabilirsiniz. Grupları belirtmezseniz ancak eğitim veri kümenizde gruplar tanımlanmışsa, eğitim grupları kullanır.

Gruplar, tarih dizin sütunundaki çoğalt değerlerle tanımlanır; örneğin, 14.01.2025 tarihi için iki kaydınız vardır: biri A mağazası için, diğeri B mağazası için.

Bir zaman serisi deneyindeki her grup — hedef tek başına dahil olmak üzere — veri kümenizde ayrı zaman serileri olarak kabul edilir. bk. Zaman serisi nedir?.

Tahmin ufku

Tahmin ufku, geleceğe ne kadar süreyle tahmin yapmak istediğinizi belirtir. Tahmin ufku, tahmin penceresinden (tahminlere ihtiyaç duyduğunuz zaman adımı sayısı) ve tahmin boşluğundan (geçmiş verilerinizden sonra tahmin istemediğiniz isteğe bağlı zaman adımı sayısı) oluşur.

Bir deney sürümünü yapılandırırken tahmin penceresini ve boşluk boyutunu ayarlarsınız. Bu değerler hem model eğitimi sırasında hem de ML dağıtımları olarak dağıtılan modellerden tahminler oluşturulurken kullanılır.

Tahmin penceresi, geleceğe yönelik tahmin yapmak istediğiniz zaman adımı sayısıdır. Örneğin, zaman adımınız bir günse ve önümüzdeki iki hafta için satış tahmini yapmak istiyorsanız, tahmin pencerenizi 14 olarak ayarlarsınız.

Tahmin boşluğu, tahminlere ihtiyaç duymadığınız gelecekteki zaman miktarıdır. Tahmin boşluğu ayarlamak isteğe bağlıdır, çünkü buna ihtiyacınız olabilir veya olmayabilir. Tahmin boşluğu, sağladığınız kaydedilmiş geçmiş eğitim verilerinin sonunda başlar. Tahmin penceresi, tahmin boşluğunun bittiği yerde başlar.

Örneğin, gelecekteki satışları tahmin etmek isteyebilirsiniz, ancak yalnızca giriş verilerinizin bitiminden bir hafta sonraki tarihler için gelecekteki satışlarla ilgileniyorsunuz. Bu durumda, gün cinsinden bir zaman adımıyla, tahmin boşluğu boyutunuzu yedi zaman adımına ayarlayabilirsiniz.

Seçtiğiniz tahmin penceresi, sahip olduğunuz eğitim verisi miktarına ek olarak, geleceğe ne kadar tahmin yapabileceğinizi sınırlar. Daha fazla bilgi için bkz. Maksimum tahmin penceresi.

Kovaryatlar

Zaman serisi problemlerinde, özellikler genellikle kovaryatlar olarak adlandırılır. Diğer makine öğrenimi problemlerine benzer şekilde, kovaryatlar, hedefin sonucu üzerinde etkisi olduğundan şüphelendiğiniz diğer değişkenlerdir. Her bir kovaryat, eğitim veri kümenizde tek bir sütun olarak temsil edilir.

Zaman serisi tahmininde, birkaç tür kovaryat vardır ve bunların bazı önemli farklılıkları vardır:

  • Statik kovaryatlar: Bir zaman serisi boyunca değişmeyen sütunlar. Statik kovaryatlar, grupların kullanıldığı zaman serisi deneylerinde uygulanabilir. Örneğin, Ürün ve Mağaza Numarası için gruplarınız olduğunu ve Varsayılan İndirim özelliğinin bulunduğunu varsayalım. Mağaza 1'deki Ürün A'nın varsayılan indirimi %10 ve Mağaza 2'deki Ürün B'nin varsayılan indirimi %20 ise, Varsayılan İndirim statik bir kovaryat olacaktır. Yani, göründüğü grup için veriler içinde değişmez.

    Statik kovaryatlar, deneye dahil ettiğiniz geçmiş özelliklerden otomatik olarak algılanır. Hangi özelliklerin statik kovaryat olduğunu belirtmenize gerek yoktur.

  • Geçmiş kovaryatlar: Yalnızca geçmiş verilerde bulunan ve bu veriler arasında değişen zamana bağlı değişkenler. Geçmiş kovaryatlar, deneye dahil ettiğiniz geçmiş özelliklerden otomatik olarak algılanır. Hangi özelliklerin geçmiş kovaryatlar olduğunu açıkça belirtmenize gerek yoktur.

  • Gelecek kovaryatlar: Gelecek özellikler olarak da bilinen gelecek kovaryatlar, tahmin ufku içinde gelecek değerlerini bileceğiniz zamana bağlı değişkenlerdir. Eğitimde gelecek kovaryatları kullanırken, onları eğitim yapılandırmasında gelecek özellikler olarak belirtmeniz gerekir.

Gelecek özellikleri

Gelecekteki özelliklerle, modellerinize zaten bildiğiniz veya makul bir şekilde bekleyebileceğiniz gelecekteki bilgiler hakkında ek veriler sağlayabilirsiniz. Özellikle, seçtiğiniz tahmin ufku boyunca bu özellik için gelecekteki değerlere erişiminiz vardır. Gelecekteki özellikleri tanımlarken, geçmiş verilerin yanı sıra gelecekteki verileri de sağlamanız gerekir.

Örneğin, bir mağaza tarafından sunulan gelecekteki indirimlerden etkilenebilecek metrikleri tahmin eden bir model için, geçmişte gözlemlenen indirimleri ve tahmin penceresi içindeki gelecekteki zaman dilimleri için indirimleri dahil edebilirsiniz. Gelecekteki özelliklerin diğer örnekleri hava durumu veya takvim bilgileri olabilir.

Diğer önemli kavramlar

Bu bölüm, zaman serisi probleminizle ilgili olan ancak bir deneyde veya ML dağıtımında doğrudan yapılandırmadığınız kavramları özetlemektedir. Bunlar, verileriniz tarafından veya model için yapılandırdığınız diğer özellikler tarafından tanımlanan özelliklerdir.

Zaman kademeleri

Zaman kademesi, eğitim veri kümeniz tarafından tanımlanır ve hem eğitim hem de tahminler için önemlidir.

Eğitim veri kümenizde, zaman adımı, tarih dizininizdeki verilerin kaydedildiği aralıktır. Örneğin, zaman adımı günlük, saatlik, dakikalık veya saniyelik olabilir.

Eğitim verilerinizde kullanılan zaman adımının farkında olmak önemlidir. Tanımladığınız diğer deney parametreleri, tahmin penceresi ve tahmin boşluğu boyutu gibi, bu zaman adımı aralığını takip edecektir.

Modelinizi dağıttıktan sonra, tahmin oluşturmak istediğiniz uygulama verilerinin, eğitim veri kümesinde tanımlandığı gibi aynı zaman adımını takip etmesi gerekecektir.

Kalite

Bir eğitim veri kümesi seçtiğinizde, sistem kullanılan zaman adımını çıkarır. Tarih dizininde eksik değerler veya boşluklar varsa hedef, gruplar ve kovaryantlar gibi sütunlar sistem tarafından otomatik olarak enterpole edilebilir. Ancak, verileriniz farklı zaman adımlarının algılandığı noktaya kadar tutarsız zaman aralıkları içeriyorsa, veriler önce düzeltilmelidir. Örneğin, günlük olarak kaydedilen birkaç aylık veriniz varsa, ancak verilerin tutarlı bir şekilde haftalık olarak kaydedildiği bir bölüm varsa, birden çok zaman adımı algılanacağı için veri kümesi kullanılamaz.

Uygulama zaman aralığı

Uygulama penceresi veya geriye dönük inceleme dönemi, algoritmanın belirttiğiniz tahmin penceresi için tahminleri sağlamak üzere kullanabileceği eğitim verilerinin bir kısmıdır.

Uygulama penceresi sistem tarafından hesaplanır ve ayarlanır. Bu, zaman adımları cinsinden ölçülür. Uygulama penceresi, tahmin penceresi ve boşluk (tahmin ufku) olarak ayarladığınız değerlerle tanımlanır. Uygulama zaman aralığı boyutunuz, en az bir deney sürümü çalıştırdıktan sonra deney yapılandırma panelinde ve Model eğitim özeti bölümünde gösterilir. Bir toplu tahmin yapılandırmasını oluştururken veya düzenlerken ML dağıtımı Model şeması içinde de gösterilir.

Uygulama penceresi, eğitim yapılandırmanızdan otomatik olarak tanımlanır. Belirli bir tahmin penceresi için tahminler oluşturmak üzere, en az uygulama pencerenizi kapsayan geçmiş verileri sağlamanız gerekir. Bu, uygulama veri kümenizde sağlanır. bk. Uygulama veri kümesi hazırlama.

Maksimum tahmin penceresi

Zaman serisi denemenizi yapılandırdığınızda maksimum tahmin penceresi tahmin edilir. Eğitimin bir sürümünü çalıştırdıktan sonra, maksimum tahmin penceresi kesin olarak onaylanır. Maksimum tahmin penceresi, deney yapılandırma panelinde Hedef ve deney türü öğesini açtığınızda, Verilerinize göre altında Tahmini maksimum tahmin veya Maksimum tahmin olarak size gösterilir. Maksimum tahmin penceresi, seçtiğiniz tahmin penceresi, sağladığınız geçmiş veri miktarı ve sistem tarafından beklenen minimum örneklem boyutu göz önüne alındığında, tahminler oluşturabileceğiniz maksimum zaman adımı sayısıdır. Ne kadar çok geçmiş veri sağlarsanız, o kadar ileriye dönük tahmin yapabilirsiniz. Ancak, güvenilir tahminler oluşturmak için makul bir tahmin penceresi seçmek önemlidir.

Maksimum tahmin penceresi 180 zaman adımı kadar büyük olabilir.

Tahmin kesme zamanı

Tahmin kesme zamanı, tahminler sırasında uygulama veri kümenizi tanımlarken özellikle önemlidir. Tahmin kesme zamanı, örnekleminizde hedef değerinizin olduğu son tarihtir. Esasen, bu kesme zamanından sonraki tarihler, tahminler oluşturmak istediğiniz tarihlerdir.

Zaman serisi nedir?

Qlik PredictZaman serisi tahmininde, her grup — yalnızca hedef dahil olmak üzere — eğitim veri kümesi içinde ayrı zaman serileri olarak kabul edilir. Örneğin, eğitim veri kümenizin satış metrikleri içerdiğini varsayalım. Bu satış metrikleri, her mağaza ve ürün türü için tanımlanmıştır. Mağaza ve Ürün Türü sütunları gruplar olarak tanımlandığında, eğitim veri kümesinde üç zaman serisi bulunur.

Eğitim veri kümesi hazırlanıyor

Çok değişkenli zaman serisi tahminleri için, eğitim veri kümenizin aşağıdaki sütunları içermesi gerekir:

  • Veri dizini

  • Hedef sütun

  • Grup sütunları (isteğe bağlı)

  • Özellik sütunları (isteğe bağlı—özellikler olmadan, tek değişkenli bir tahmin modeli eğitiyorsunuz)

Zaman serisi eğitim veri kümeleri için gereken sütunları ve verileri gösteren çizimler. Grup olmayan, bir grup ve iki grup içeren senaryolar açıklanmıştır.

Bir zaman serisi tahmin modeli için bir eğitim veri kümesinin gerekli bileşenlerini ve zaman çizelgesini özetleyen doğrusal diyagram.

Tarih dizin sütunu

Tam tarihler veya zaman damgaları içeren bir tarih dizinine ihtiyacınız var. Bu sütun, hedef ve kovaryat metriklerinin izlendiği kronolojik dizindir. Tarih dizin sütunu, zaman tabanlı ölçümleri tutarlı bir zaman aralığı (zaman adımı) boyunca sıralı olarak düzenler.

Tarih dizini sütunu, grupları kullanıp kullanmadığınıza bağlı olarak şu şekilde düzenlenmiştir:

  • Grup yok: Her zaman adımı için tek bir kayıt. Örneğin, günlük bir tahminle, her satır tek bir günü temsil eder.

  • Gruplarla: Kullanılan gruplara bağlı olarak her zaman adımı için bir veya daha fazla çoğaltılmış giriş.

Çok değişkenli bir eğitim veri kümesiyle, kullanılan gruplara bağlı olarak her zaman adımı için bir veya daha fazla çoğaltılmış giriş olacaktır. Kullandığınız zaman adımında esneklik vardır — örneğin, tarihleri günlük, haftalık veya aylık bazda bir veya daha fazla kez kaydedebilirsiniz vb.

Bu sütundaki eksik veya tutarsız kaydedilmiş değerler, enterpolasyon yapılabilirse bazen kabul edilebilir.Ancak, tarih dizin değerleriniz birden fazla farklı zaman adımı içeremez. Örneğin, aralık günde bir kez olarak belirlenmişse, ancak bir noktada günde iki kez bir aralık tespit edilirse, eğitim sırasında bir hata oluşacaktır.

Hedef sütun ve grup sütunları

Veri kümenizin, tahmin etmek istediğiniz sayısal bir metriği içeren bir hedef sütuna sahip olması gerekir. Sık karşılaşılan bir örnek satışlardır.

Grupları kullanıyorsanız, eklediğiniz gruplardaki her olası değer için geçmiş hedef değerleri sağlarsınız. Örneğin, hedefiniz Satış ise ve Mağaza A ile Mağaza B için veri içeren bir Mağaza Numarası grubu eklerseniz, veri kümenizin her zaman adımı için iki ayrı kayıt içermesi gerekir: biri Mağaza A için satış değeriyle, diğeri ise Mağaza B için satış değeriyle.

Özellik sütunları

Herhangi bir kovaryat olmadan bir zaman serisi modeli eğitebilirsiniz. Ancak, kovaryatları dahil ederseniz, her özellik için veri kümesinde bir sütun sağlayın. Özellik verileri, gelecekteki özellikleri eklemiyorsanız genellikle geçmişte kaydedilmiş veriler olmalıdır. Gelecekteki özellik sütunları hem geçmiş hem de gelecekteki verileri içerebilir. Gelecekteki özellik verilerini eğitim veri kümesine yalnızca, tahminler oluşturduğunuzda bu sütunların gelecekteki değerlerinin bilineceğinden eminseniz dahil etmelisiniz.

Gelecekteki özellikler olarak kullanacağınız özellikleri takip edin, çünkü eğitim yapılandırmasında onları bu şekilde seçmeniz gerekecektir.

Veri hacmi

Veri kümenizin yeterli sayıda kayıt içermesi gerekir. Geçmiş verilerinizin hacmi, gelecekte ne kadar uzağı tahmin edebileceğinizi belirlemede rol oynar. İstediğiniz tahmin penceresi, ne kadar geçmiş veriye ihtiyacınız olduğunu da etkiler.

Genellikle, daha fazla geçmiş veri daha azından daha iyidir. Ancak, verilerin kaliteli olması ve istenen eğilimleri yakalaması gerekir. Veriler alakasız bilgi sağlıyorsa veya yanlışlıklar içeriyorsa, modelde bulunması faydalı değildir. Hacmi optimize etmek ile kaliteyi ve alaka düzeyini korumak arasındaki dengeyi göz önünde bulundurun.

Örnekler

Uygulama veri kümesi hazırlama

Bir zaman serisi modelini dağıttıktan sonra, tahminlerin yapılacağı bir uygulama veri kümesi geliştirmeniz gerekir.

Uygulama veri kümesi — Gereksinimler ve doğrulama

Zaman serisi modelleri için uygulama veri kümesinin ihtiyacı olanlar:

  • Eğitim veri kümesine dahil edilen tüm sütunlar için sütunlar ve sütun başlıkları.

  • Eğitim veri kümesiyle aynı zaman kademesi.

  • Model için uygulama zaman aralığındaki kayıt sayısı kadar veya daha fazla geçmiş veri kaydı (hedef ve gruba göre), tahmin kesme zamanından önce. Bunlar, geçmişte gözlemlenen tarih veya zaman damgasını, hedefi ve kovaryat değerlerini içeren tam kayıtlar olmalıdır. Uygulama zaman aralığı, eğitim sırasında yapılandırılan tahmin zaman aralığı ve boşluğu tarafından belirlenir. Geleceğe yönelik tahmin yapmanız gereken süre ne kadar uzun olursa tahminleri çalıştırmak için uygulama veri kümenizde o kadar fazla geçmiş veriye ihtiyacınız olur.

  • Tahmin ufkunuzdaki tüm gelecekteki zaman kademeleri için kayıtlar. Bu gelecekteki kayıtlar için yalnızca tarih dizini sütunu değerleri ve ayrıca herhangi bir gelecek özelliği dahil edin. Diğer sütunların değerlerini boş bırakın.

İpucu notuUygulama veri kümeniz için geçmiş verilerin çoğu, kabul edilebilir minimum veri hacimlerini belirtmek içindir. Her zaman gerekenden fazlasını sağlayabilirsiniz. Model tahminler oluşturduğunda, yalnızca uygulama penceresini kapsamak için gereken kayıtlar kullanılır.

Zaman serisi tahmin modellerinden tahminler oluşturmak için kullanılan uygulama veri kümeleri için gerekli sütunları ve verileri gösteren çizimler. Grupsuz, tek gruplu ve iki gruplu senaryolar açıklanmıştır.

Zaman serisi tahmin modeliyle tahminler oluşturmak için kullanılan bir uygulama veri kümesinin gerekli bileşenlerini ve zaman çizelgesini özetleyen doğrusal diyagram.

Örnekler

Bu sayfa size yardımcı oldu mu?

Bu sayfa veya içeriği ile ilgili bir sorun; bir yazım hatası, eksik bir adım veya teknik bir hata bulursanız lütfen bize bildirin!