Ana içeriğe geç Tamamlayıcı içeriğe geç

Dosya tabanlı bir bilgi birikimi ambarı oluşturma

Dosya tabanlı bilgi birikimi ambarları, yapılandırılmamış verilerinizi bir vektör veritabanına yerleştirmenize ve depolamanıza olanak tanır. Bu, artırılmış bağlamın, Almayla Artırılmış Üretim (RAG) uygulamaları için bir bağlam olarak kullanılmak üzere anlamsal arama özellikleriyle alınmasını sağlar.

Desteklenen giriş biçimleri şunlardır: PDF, TXT ve Word DOCX.

Bilgi notuQlik Talend Cloud Enterprise aboneliğine ihtiyacınız vardır.
Bilgi notuBu özellik yalnızca Snowflake platformlarında ve müşteri tarafından yönetilen bir veri ağ geçidi için desteklenir.

Qlik Data Gateway - Data Movement uygulamasını yükleme

Dosya tabanlı bilgi birikimi ambarları oluşturmadan önce, belirli bir Qlik Data Gateway - Data Movement yüklemeniz gerekir. Daha fazla bilgi için bk. Bilgi birikimi ambarları için Qlik Data Gateway - Data Movement ayarlama.

Desteklenen bağlantılar

Desteklenen şu öğeler hakkında bilgi için:

Dosyaları oluşturma

  1. Sol menüdeki Projeler'e tıklayın ve bir proje açın.
  2. Proje sayfasından, dosya tabanlı bir bilgi birikimi ambarı oluşturabilirsiniz. Şu iki eylemden birini yapın:
    • Yeni oluştur > Dosya tabanlı bilgi bankası ambarı'na tıklayın.
    • Veri görevi Eylemler simgesi > Dosya tabanlı bilgi bankası ambarı seçeneğine tıklayın.

    Yapılandırma penceresi açılır.

  3. Bir ad girin.
  4. Açıklama girin. Bu isteğe bağlıdır.
  5. Bir Kaynak bağlantısı oluşturun veya seçin.
  6. Vektörleri şurada sakla: açılır listesinden belgelerin depolanacağı yeri seçin. Belgeleri projeyle birlikte saklamak için Veri projesi platformu'nu seçin.

  7. Harici vektör veritabanını seçtiyseniz bir Vektör veritabanı bağlantısı oluşturun veya seçin. Belgeler ve vektörler bu vektör veritabanında saklanacaktır.
  8. Bir LLM bağlantısı oluşturun veya seçin. Bu bağlantı anlamsal aramayı kullanmak için gereklidir.
  9. Oluştur'a tıklayın.
  10. Bilgi birikimi ambarı oluşturulduğunda, belgeleri ekleyin.

Dosyalar ekleme

Bilgi notuBelgelere yalnızca metin yazılır. Diyagramlardan veya görüntülerden metin çıkarılmaz.
  1. Veri görevi sayfasının Klasörler sekmesinde bir klasör seçin veya yeni bir klasör seçmek için Klasör seç'e tıklayın.
  2. Klasöre göz atın, klasörün onay kutusunu seçin.

    Klasörlerdeki tüm dosyalar, klasöre ne zaman eklendiklerine bakılmaksızın, desteklenen biçimlerden birindeyse okunacaktır.

    Dizinde zaten var olan bir dosyayı bir klasörden sildiğinizde, veriler dizinde kalır. Verileri dizinden kaldırmak için aynı dosyayı kullanın ancak boş bırakın.

    Klasördeki dosyaların listesini görüntülemek için klasöre sağ tıklayın.

  3. Klasör seç penceresini kapatmak için Kaydet'e tıklayın.
  4. Yığın boyutunu ve yığın çakışmasını düzenlemek için Ayarlar > Çalışma zamanı'na tıklayın.
  5. Dizin adını düzenlemek için Ayarlar > Vektör veritabanı ayarları'na tıklayın.

    Daha fazla bilgi için bk. Dizin adı.

  6. Sağ taraftaki Eylemler simgesi > Hazırla öğesine tıklayın.
  7. Hazırlık tamamlandığında Çalıştır'a tıklayın. Belgeler ekleniyor ve aktarılıyor.

    Çalıştır düğmesi etkin olduğunda aktarım tamamlanır.

  8. İlk tam yükte her bir dosyanın durumunu doğrulayın:
    1. Menüden İzle'yi seçin.
    2. Sayfanın altındaki Tam yük durumu'nu seçin.

      İzle bölümünde tam yük durumu

    3. Bazı dosyalar başarısız olduğunda ve her şeyi yeniden çalıştırmadan önce, hataları düzeltin veya dosyaları silin. Dosyaları hatalı olarak tutarsanız sonraki çalıştırmalar başarısız olur.
    Bilgi notuTüm dosyaların yeniden yüklenmesi ekstra maliyetlere neden olabilir.

Dosyalarınız doğru olduğunda, verileriniz hakkında sorular sorabilirsiniz. Daha fazla bilgi için bk. Test asistanını kullanma.

Tam yük ve Değişiklik verisi yakalama (CDC)

Tam yük ve CDC desteklenmektedir.

Tam yük: Her belge örneği için bir belge oluşturulur ve hedefe gönderilir.

CDC: Bir belge, herhangi bir değişiklikten sonra yeniden oluşturulur.

Bir dosya değiştirildiğinde veya eklendiğinde, belgeler bu dosyadan okunur. Dosya, yığın boyutuna ve çakışmaya göre yığın belgelerine bölünecektir.

İlk tam yükte her bir dosyanın durumunu doğrulayın:

  1. Menüden İzle'yi seçin.
  2. Sayfanın altındaki Tam yük durumu'nu seçin.

    İzle bölümünde tam yük durumu

  3. Bazı dosyalar başarısız olduğunda ve her şeyi yeniden çalıştırmadan önce, hataları düzeltin veya dosyaları silin. Dosyaları hatalı olarak tutarsanız sonraki çalıştırmalar başarısız olur.
Bilgi notuTüm dosyaların yeniden yüklenmesi ekstra maliyetlere neden olabilir.

Giriş verilerini güncelleme

Giriş verilerini güncellediğinizde, değişiklikleri vektör veritabanına veya veri platformuna aktarmak için veri görevini çalıştırmanız gerekir.

Eski yığınlar silindiğinden ve yeni parçalar eklendiğinden, hdr__operation alanı bir güncelleme işlemine değil, ekleme işlemine karşılık gelir. Daha fazla bilgi için bkz. Bir bulut veri deposundaki veri kümesi mimarisi.

Dizin adı

Her bilgi birikimi ambarının anlamsal arama için kullanılan bir dizin adı vardır.

Görevleri aynı dizine yazacak şekilde yapılandırdığınızda, görevler için aynı LLM parametrelerini yapılandırmanız gerekir.

Belgelerinizin aynı dizinde yer almasını istiyorsanız aynı dizin adına sahip olmaları gerekir.

Dizin adını düzenlemek için:

  1. Veri görevi sayfasında Ayarlar'a tıklayın.
  2. Vektör veritabanı ayarları sekmesini seçin.
  3. Dizin adı'nı düzenleyin.
  4. Tamam üzerine tıklayın.

Dizin adını düzenledikten sonra görevi hazırlamanız gerekir. Aksi takdirde, değişiklikleriniz sonraki çalıştırmalarda geçerli olmayacaktır.

Ayarlar

Bir bilgi birikimi ambarının ayarlarını görüntüleyebilir ve düzenleyebilirsiniz.

Veri görevi sayfasından > Ayarlar'a tıklayın.

Bilgi notuAyarlar depolama alanına (Databricks, Snowflake vb.) bağlı olduğundan, aşağıdaki tablolarda her zaman kullanılabilir olan ayarlar açıklanmaktadır. Daha fazla ayar mevcut olabilir.
Bu tabloda, Bağlantılar sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Kaynak bağlantısı

Kaynak bağlantısı.

Vektörleri şurada sakla:

Açılan listeden bir şunu seçin:

  • Harici vektör veritabanı
  • Veri projesi platformu
Vektör veritabanı bağlantısı

Bu ayar, Vektörleri şurada sakla: için Harici vektör veritabanı seçildiğinde kullanılabilir.

Vektör veritabanı bağlantısı.

Daha fazla bilgi için bk. Vektör veritabanlarına bağlanma.

LLM bağlantısıLLM bağlantısı.

Daha fazla bilgi için bk. LLM bağlantılarına bağlanma.

Databricks'i bir LLM bağlantısı olarak kullanmak istediğinizde, bilgi birikimi ambarı oluştururken Ekleme modeli hizmet uç noktası'nı ve Tamamlama modeli hizmet uç noktası'nı yapılandırın. Daha fazla bilgi için Databricks belgelerine bakın.

Bu tabloda, Platform ayarları sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Veri görevi şemasıVeri görevi şemasının adı.
Dahili şemaDahili şemanın adı.
Tüm tablo ve görünümler için ön ekBirden çok veri görevi arasındaki çakışmaları çözümlemek ön ek.
Bu tabloda, Vektör veritabanı ayarları sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Dizin şeması

Bu ayar, Vektörleri şurada sakla: için Harici vektör veritabanı seçildiğinde kullanılamaz.

Dizin şemasının adı.
Dizin adıDizinin adı.
Dizin zaten mevcutsaAynı dizine birden fazla görev yazıldığında, dizinin silinmesi gerekip gerekmediğini seçin:
  • Mevcut dizini kullan: Dizin silinmez.
  • Dizini bırak ve oluştur: Dizin silinir.
Bu tabloda, Çalışma zamanı sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Paralel yürütme

Maksimum veritabanı bağlantısı sayısı. 

1 ile 50 arasında bir değer girin.

Toplu boyutBilgi birikimi ambarı için yığın boyutu, her bir yığın talebinde yüklenen belge sayısıdır.

Dosya tabanlı bilgi birikimi ambarları için yığın boyutu, her bir yığın talebinde yüklenen dosya sayısıdır.

Snowflake'te, her şey tek bir sorguda yüklendiğinden yığın boyutu gerekli değildir.

Yüklenecek maksimum kayıt sayısı0, tüm kayıtların yüklendiği anlamına gelir.
Bu tabloda, Görünümler sekmesinin ayarları açıklanmaktadır.
Ayarlar Açıklama
Standart görünümler Bir sorgunun sonuçlarını bir tabloymuş gibi görüntülemek için standart görünümleri kullanın.
Snowflake güvenli görünümleri Temel tabloların tüm kullanıcılarına açık olmaması gereken hassas verilere erişimi sınırlamak üzere oluşturulan görünümler gibi veri gizliliği veya hassas bilgi koruması için belirlenmiş görünümler için Snowflake güvenli görünümlerini kullanın.

Snowflake güvenli görünümleri Standart görünümlere göre daha yavaş çalışabilir.

Bu tabloda, Test asistanı sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Bağlamdaki belge sayısıBağlam olarak modele aktarılacak alakalı belgelerin sayısı.
Komut istemi şablonuYapay zekanın dahil edilecek belgeleri filtrelemek için izlemesi gereken şablonu girin.
FiltreDahil edilecek belgeleri filtrelemek için ifadeyi girin.

Filtre, meta verilere dayandığından ve dosya tabanlı bilgi birikimi ambarlarında meta veri olmadığından, yapılandırdığınız filtreyi dikkatlice düşünün. Verileri dahil etmek yerine hariç tutmak daha uygun olabilir.

Daha fazla bilgi için bk. Test asistanını kullanma.

Belge almaAçılan listeden seçeneği seçin:
  • Alınan içerikleri göster: Test asistanı, cevabı oluşturduğu belgeleri sağlar.
  • Alınan içerikleri gösterme: Test asistanı bir yanıt oluşturur ancak belgeleri sağlamaz.
Yanıt oluşturmaAçılan listeden seçeneği seçin:
  • Yanıt oluştur: Test asistanı, belgelere dayalı olarak bir yanıt oluşturur.
  • Yanıt oluşturma: Test asistanı yalnızca belgelerle yanıt verir.

Bu sayfa size yardımcı oldu mu?

Bu sayfa veya içeriği ile ilgili bir sorun; bir yazım hatası, eksik bir adım veya teknik bir hata bulursanız lütfen bize bildirin!