Öğretici - Yeni başlayanlar için veri akışı
Bu eğitimde, bir veri akışı oluştururken gereken farklı adımlara ve sunulan farklı olanaklara daha aşina olmanızı sağlamak için temel bir veri hazırlama kullanım durumu tanıtılacaktır. Birkaç veri kümesi içeren ekteki paket ile bu eğitimin tüm adımlarını yeniden oluşturabileceksiniz.
Bu senaryo, dünyanın dört bir yanından müşteriler ve bu müşterilerin adları, sipariş tarihleri ve durumları, menşe ülkeleri, eyaletleri, adresleri, telefon numaraları vb. bilgileri içeren bir satış verisi örneğine odaklanacaktır. Diyelim ki verileri Amerika Birleşik Devletleri'ndeki müşterilere odaklanacak şekilde hazırlamak istiyorsunuz. ABD müşterileriyle ilgili tüm verileri izole edecek, menşe eyaletlere ilişkin eksik bilgileri ekleyecek, küçük bir biçimlendirme değişikliği yapacak ve verileri örneğin bir analiz uygulaması için kaynak olarak kullanabileceğiniz yeni bir dosyaya aktaracaksınız.
Önkoşullar
Bu paketi indirin ve masaüstünüze çıkarın:
Yeni başlayanlar için veri akışı eğitimi
Pakette, eğitimi tamamlamak için ihtiyacınız olan aşağıdaki veri dosyaları vardır:
-
sales_data_sample.xlsx
-
states.xlsx
Kaynak dosyaları kataloğunuza ekleme
Veri akışı oluşturmaya başlamadan önce, paketteki iki dosyanın analiz platformunda mevcut olması gerekir. Kaynak verileri kataloğunuza eklemek için:
-
Başlatıcı menüsünden Analizler > Katalog'u seçin.
-
Sağ üstteki Yeni oluştur düğmesine tıklayın ve Veri kümesi'ni seçin.
-
Açılan pencerede Veri dosyası yükle’ye tıklayın.
-
Eğitim dosyalarını masaüstünüzden Dosya ekle penceresinin özel alanına sürükleyip bırakın veya Göz at'a tıklayarak bulundukları yerden seçin.
-
Yükle'ye tıklayın.
Veri akışını oluşturma ve bir kaynak ekleme
Artık parçalar ayarlandığına göre, kaynaktan başlayarak veri akışını oluşturmaya başlayabilirsiniz.
-
Başlatıcı menüsünden Analizler > Verileri hazırlaöğesini seçin.
-
Veri akışı kutucuğuna tıklayın veya Yeni oluştur > Veri akışı öğesine tıklayın.
-
Yeni bir veri akışı oluştur penceresinde, veri akışınızın bilgilerini aşağıdaki gibi ayarlayın ve Oluştur'a tıklayın:
-
Ad olarak Veri akışı eğitimi.
-
Alan olarak Kişisel.
-
Açıklama olarak ABD müşterilerine odaklanan satış verilerini hazırlamak için veri akışı.
-
Etiket olarak Eğitim.
Boş veri akışınız açılır.
-
-
Kataloğunuza eklenmiş olan veri kümelerine bakmaya başlamak için boş tuvalde Kataloğa göz at'a tıklayın.
-
Daha önce yüklenen sales_data_sample.xlsx ve states.xlsx veri kümelerini bulmak için filtrelenmiş aramayı kullanın ve adlarının önündeki onay kutularını seçin.
-
İleri'ye tıklayın.
-
Özetteki veri kümelerini ve alanlarını gözden geçirin ve Veri akışına yükle'ye tıklayın.
Her iki kaynak veri kümesi de tuvale eklenir ve işlemcileri kullanarak verileri hazırlamaya başlayabilirsiniz. sales_data_sample.xlsx, birlikte çalışacağınız ana veri kümesidir, states.xlsx ise ek veri olarak kullanılacaktır.
ABD müşterilerine ilişkin verileri filtreleme
Artık işlemcileri kullanarak verileri ardışık değişikliklerle hazırlamaya başlayabilirsiniz. İlk adım, veri kümesinin kapsamını daraltmak ve yalnızca ABD merkezli müşterilere odaklanmaktır. Bunu yapmak için yalnızca COUNTRY alanında USA değeri olan satırları seçmek üzere Filtreleme işlemcisini kullanın.
-
Tuval üzerindeki sales_data_sample kaynağının eylem menüsüne (
) tıklayın.
-
Açılan menüden İşlemci ekle > Filtreleme öğesini seçin.
Filtreleme işlemcisi, zaten kaynak düğümüne bağlı olan tuval üzerine yerleştirilir.
Bilgi notuİşlemcileri sol panelden manuel olarak sürükleyip bırakmak ve düğümleri manuel olarak bağlamak da mümkündür. -
Henüz açılmadıysa işlemcilerinizi yapılandırabileceğiniz, veri önizlemesine ve komut dosyasına bakabileceğiniz işlemci özellikleri panelini açmak için tuvalin sağ üst köşesindeki Özellikler'e tıklayın.
-
Özellikler panelinde, işlemciye ABD filtresi gibi daha anlamlı bir ad ve örneğin ABD müşterilerini filtrele gibi kısa bir açıklama vermek için işlemci adının yanındaki Düzenle simgesine (
) tıklayın.
-
İşlenecek alan açılır listesinden COUNTRY öğesini seçin.
-
İşleç açılır listesinden = öğesini seçin.
-
Şununla birlikte kullan: alanında Değer öğesini seçin ve ABD girin.
-
Eşleşen satırları seç listesinden Tüm filtreler öğesini seçin.
Bu parametreler birden fazla filtreyi birleştirirken daha kullanışlıdır.
-
Uygula'ya tıklayın.
İşlemci yapılandırması geçerlidir, ancak işlemci henüz bir çıkış akışına sahip olmadığı için Bağlı değil mesajı görüntülenmeye devam eder.
-
Alt paneldeki Verileri önizle seçeneğine tıklayın.
Önizlemeye baktığınızda, bu aşamada çıktı akışında yalnızca ülke olarak ABD'nin bulunduğu satırların tutulduğunu ve doldurulacağını görebilirsiniz. Şimdiye kadarki veri akışınız aşağıdaki gibi görünmelidir:
Başka bir veri kümesinden eyalet adları ekleme
Kalan ABD merkezli müşteriler söz konusu olduğunda, EYALET alanı menşe eyaletini içerir, ancak iki harfli bir kod olarak belirtilir. İdeal olarak eyaletin tam adı ile bu bilgilerin okunmasını kolaylaştırmanız iyi olacaktır.
Daha önce kaynak olarak içe aktardığınız states.xlsx veri kümesi, tüm ABD eyaletlerinin iki harfli kodlarının yanı sıra karşılık gelen tam adlarını da içerir. Eyalet adlarını almak ve ana akışınızı tamamlamak için bu iki veri kümesi arasında bir birleştirme gerçekleştireceksiniz.
Birleştirmeyi gerçekleştirmek için:
-
Filtreleme işlemcisinin eylem menüsüne (
) tıklayın ve Eşleşen dala işlemci ekle > Birleştir öğesini seçin.
-
Özellikler panelindeki Düzenle simgesini (
) kullanarak işlemciyi Tam eyalet adları olarak yeniden adlandırın.
-
Eyaletler kaynağını Birleştirme işlemcinin alt bağlantı noktasına bağlayın. Bağlantı oluşturmak için kaynak düğümün sağındaki noktaya tıklayıp basılı tutarak ve bağlantıyı işlemci düğümünün solundaki noktaya sürükleyin.
-
Birleştirme türü açılır listesinde Sol dış birleştirme öğesini seçin.
-
Sol anahtar açılır listesinde EYALET alanını seçin.
-
Sağ anahtar açılır listesinde Kısaltma alanını seçin.
Seçilen iki sütun ortak bilgiler içerir ve iki girdi akışı arasında bağlantı kurulmasını sağlar. Sol dış birleştirme ile yalnızca ikinci veri kümesindeki ek alanlar ana akışa eklenir.
-
Uygula'ya tıklayın.
Veri kümesinin sonuna, her müşteri için tam eyalet adını içeren yeni bir Eyalet alanı eklenmiştir.
Alanları yeniden adlandırma ve taşıma
Şu anda sütunlarınızın adlandırılması ve biçimlendirilmesiyle ilgili birkaç sorun var. EYALET ve Eyalet çok benzer ve kafa karıştırıcıdır ve iki alan birbirinden çok uzaktır. Alanlarınızın tutarlılığını ve istikrarını artırmak amacıyla alanlarınızı yeniden düzenlemek ve taşımak için Alanları seç işlemcisini kullanabilirsiniz.
-
Birleştirme işlemcisinin eylem menüsüne (
) tıklayın ve İşlemci ekle > Alanları seç öğesini seçin.
-
Birleştirme işlemcisini Alanları seç işlemcisine bağlayın.
-
Özellikler panelindeki Düzenle simgesini (
) kullanarak işlemciyi Eyalet alanlarını yeniden adlandır olarak yeniden adlandırın.
-
Farenizi yeniden adlandırılacak alanların üzerine getirin ve iki alan adını aşağıdaki gibi düzenlemek için
Düzenle simgesine tıklayın:
-
STATECODE olarak STATE
-
STATENAME olarak Eyalet
-
-
Yeni STATENAME sütununu STATECODE öğesinin yanına sürükleyip bırakmak için = simgesini kullanın.
-
Uygula'ya tıklayın.
Alanlarınızı yeniden düzenlediniz ve veri akışı şu şekilde görünüyor:
Müşteri adlarını büyük harfle yazma
Müşterilerin soyadlarını vurgulamak ve adlarından ayırmayı kolaylaştırmak için, Dizeler işlemcisinin basit bir biçimlendirme fonksiyonunu kullanarak soyadlarını büyük harfle yazacaksınız.
-
Alanları seç işlemcisinin eylem menüsüne (
) tıklayın ve İşlemci ekle > Dizeler öğesini seçin.
-
Alanları seç işlemcisini Dizeler işlemcisine bağlayın.
-
Özellikler panelindeki Düzenle simgesini (
) kullanarak işlemciyi Büyük harf olarak yeniden adlandırın.
-
Fonksiyon adı açılır listesinde Büyük harfe çevir seçeneğini belirleyin.
-
İşlenecek alanlar açılır listesinde CONTACTLASTNAME öğesini seçin.
-
Uygula'ya tıklayın.
Hedef ekleme ve veri akışını çalıştırma
Ana hazırlık adımları tamamlanmıştır ve artık elde edilen verilerin nasıl dışa aktarılacağını yapılandırarak veri akışını sonlandırabilirsiniz. Bu senaryoda, hazırlanan verileri doğrudan kataloğunuzda depolanan bir .qvd dosyası olarak dışa aktarırsınız, böylece daha sonra örneğin bir analiz uygulamasında kullanmak için uygun hale gelirler.
-
Dizeler işlemcisinin eylem menüsüne (
) tıklayın ve Hedef ekle > Veri dosyaları öğesini seçin.
-
Dizeler işlemcisini Veri dosyaları hedefine bağlayın.
-
Özellikler panelindeki Düzenle simgesini (
) kullanarak işlemciyi QVD hedefi olarak yeniden adlandırın.
-
Alan açılır listesinde Kişisel öğesini seçin.
-
Dosya adı alanına tutorial_output girin.
-
Uzantı açılır listesinde .qvd öğesini seçin.
-
Uygula'ya tıklayın.
Veri akışınız, başlık çubuğundaki durum ve her bir kaynak, işlemci ve hedef düğümün altındaki yeşil tik işaretleriyle gösterildiği gibi artık tamamlanmış ve geçerlidir.
-
Pencerenin sağ üst köşesindeki Akışı çalıştır düğmesine tıklayın.
Çalışmanın ilerleyişini göstermek için bir pencere açılır.
Bir süre sonra pencere kapanır ve çalıştırmanın başarılı olup olmadığını bildiren bir bildirim açılır. Veri akışının çıktısı artık kataloğunuzda veya Veri Akışına Genel Bakış panelinin Çıktılar bölümünde bulunabilir.
Sonraki adım
Kaynak verileri kataloğunuza nasıl aktaracağınızı, verilerinizi filtrelemek ve iyileştirmek için basit bir veri akışı oluşturmayı ve hazırladığınız sonucu kullanıma hazır bir dosya olarak dışa aktarmayı öğrendiniz.
Kendi kullanım durumlarınız için veri akışını kullanmanın çeşitli yolları hakkında bilgi edinmek üzere tam Veri akışı işlemcileri listesine ve sundukları fonksiyonlara göz atabilirsiniz.
Hazırladığınız verileri analiz uygulamalarında nasıl kullanacağınızı öğrenmek için Analiz oluşturma ve verileri görselleştirme bölümüne bakın.