Ana içeriğe geç Tamamlayıcı içeriğe geç

Bilgi birikimi ambarı oluşturma

Bilgi birikimi ambarları, yapılandırılmış verilerinizi bir vektör veritabanına yerleştirmenize ve depolamanıza olanak tanır. Bu, artırılmış bağlamın, Almayla Artırılmış Üretim (RAG) uygulamaları için bir bağlam olarak kullanılmak üzere anlamsal arama özellikleriyle alınmasını sağlar.

Çıktı JSON biçimindedir.

Gereksinimler

  • Qlik Talend Cloud Enterprise aboneliğine ihtiyacınız vardır.

  • Snowflake ve Databricks platformlarında desteklenir. Snowflake Iceberg desteklenmez.

  • Müşteri tarafından yönetilen bir veri ağ geçidi gereklidir.

    Databricks, Qlik Data Gateway - Veri Hareketi sürüm 2024.11.95 veya sonraki bir sürümü gerektirir.

Qlik Data Gateway - Veri Hareketi uygulamasını yükleme

Bir bilgi birikimi ambarı oluşturmadan önce, belirli bir Qlik Data Gateway - Veri Hareketi yüklemeniz gerekir. Daha fazla bilgi için şuraya bakın: Bilgi birikimi ambarları için Qlik Data Gateway - Veri Hareketi ayarlama.

Desteklenen bağlantılar

Desteklenen şu öğeler hakkında bilgi için:

Veri oluşturma

  1. Sol menüdeki Projeler'e tıklayın ve bir proje açın.
  2. Proje sayfasından bir vektör veritabanına belge oluşturabilir ve yayınlayabilirsiniz. Şu iki eylemden birini yapın:
    • Yeni oluştur > Bilgi bankası ambarı'na tıklayın.
    • Veri görevi Eylemler simgesi > Bilgi bankası ambarı seçeneğine tıklayın.

    Yapılandırma penceresi açılır.

  3. Bir ad girin.
  4. Açıklama girin. Bu isteğe bağlıdır.
  5. Vektörleri şurada sakla: açılır listesinden belgelerin depolanacağı yeri seçin. Belgeleri projeyle birlikte saklamak için Veri projesi platformu'nu seçin.
  6. Harici vektör veritabanını seçtiyseniz bir Vektör veritabanı bağlantısı oluşturun veya seçin. Belgeler ve vektörler bu vektör veritabanında saklanacaktır.
  7. Bir LLM bağlantısı oluşturun veya seçin. Bu bağlantı anlamsal aramayı kullanmak için gereklidir.
  8. Oluştur'a tıklayın.
  9. Veriler oluşturulduğunda, belgeleri ekleyin.

Belge ekleme

Bilgi notuYalnızca metin biçimi desteklenir. Örneğin, diyagramlardan veya görüntülerden metin çıkarılamaz.
  1. Veri görevi sayfasının Veri kümeleri sekmesinde, sol paneldeki Ekle'ye tıklayın.
  2. Belgenin oluşturulacağı temel veri kümesini seçin. Her kayıt için bir belge oluşturulacaktır. Örneğin, bir hasta listesi için, her hastaya yönelik olarak bir belge oluşturulacaktır.
  3. Belge şeması adı alanı, seçilen temel veri kümesinin adıyla önceden doldurulur. Gerekirse yeniden adlandırın.
  4. Açıklama girin. Bu isteğe bağlıdır.
  5. Belgeyi zenginleştirmek için eklemek istediğiniz verileri seçin.
  6. Tamam'a tıklayın. Belge şemaları sekmesine geri dönersiniz.
  7. Veri kümeleri sekmesini seçin.
  8. Sol panelde, daha önce temel veri kümesi olarak seçtiğiniz veri kümesini seçin.
  9. Belgelere dahil etmek istemediğiniz verileri kaldırmak için onay kutusunu seçin ve Kaldır'a tıklayın.
  10. LLM tarafından gerçekleştirilen anlamsal aramayı iyileştirmek için, adları yeterince açık olmayan verileri yeniden adlandırın.

    Örnek: dt öğesini date olarak yeniden adlandırın.

  11. Verileri gerektiği gibi kaldırıp yeniden adlandırdığınızda, sağdaki Eylemler simgesi > Hazırla öğesine tıklayın. Belgeler JSON biçiminde oluşturulmaktadır.
  12. Belgeler oluşturulduğunda:
    1. Veri kümeleri sekmesini seçin.
    2. Görevi çalıştırmadan önce belgelerinizi doğrulamak için Verileri görüntüle'ye tıklayarak bir veri örneği görüntüleyin.
    3. Çalıştır'a tıklayın. Belgeler, yapılandırmaya bağlı olarak vektör veritabanına veya veri platformuna aktarılmaktadır.

Çalıştır düğmesi etkin olduğunda aktarım tamamlanır.

Her şeyin aktarıldığından emin olmak için verileriniz hakkında sorular sorabilirsiniz. Daha fazla bilgi için şuraya bakın: Test asistanını kullanma.

Tam yük ve Değişiklik Verisi Yakalama (CDC)

Tam yük ve CDC desteklenmektedir.

Tam yük: Her belge örneği için bir belge oluşturulur ve hedefe gönderilir.

CDC: Bir belge, temel veya ilgili varlıktaki herhangi bir değişiklikten sonra yeniden oluşturulur.

Temel varlığa bir giriş eklendiğinde yeni bir belge oluşturulur. İlgili varlıklardaki hiçbir giriş bir temel varlığa bağlanamazsa belgelerde görünmez.

Giriş verilerini güncelleme

Giriş verilerini güncellediğinizde, değişiklikleri vektör veritabanına veya veri platformuna aktarmak için veri görevini çalıştırmanız gerekir.

Dizin adı

Her bilgi birikimi ambarının anlamsal arama için kullanılan bir dizin adı vardır.

Görevleri aynı dizine yazacak şekilde yapılandırdığınızda, görevler için aynı LLM parametrelerini yapılandırmanız gerekir.

Belgelerinizin aynı dizinde yer almasını istiyorsanız aynı dizin adına sahip olmaları gerekir.

Dizin adını düzenlemek için:

  1. Veri görevi sayfasında Ayarlar'a tıklayın.
  2. Vektör veritabanı ayarları sekmesini seçin.
  3. Dizin adı'nı düzenleyin.
  4. Tamam üzerine tıklayın.

Ayarlar

Bir bilgi birikimi ambarının ayarlarını görüntüleyebilir ve düzenleyebilirsiniz.

Veri görevi sayfasından > Ayarlar'a tıklayın.

Bilgi notuAyarlar depolama alanına (Databricks, Snowflake vb.) bağlı olduğundan, aşağıdaki tablolarda her zaman kullanılabilir olan ayarlar açıklanmaktadır. Daha fazla ayar mevcut olabilir.
Bu tabloda, Bağlantılar sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Kaynak bağlantısı

Kaynak bağlantısı.

Vektörleri şurada sakla:

Açılan listeden bir şunu seçin:

  • Harici vektör veritabanı
  • Veri projesi platformu
Vektör veritabanı bağlantısı

Bu ayar, Vektörleri şurada sakla: için Harici vektör veritabanı seçildiğinde kullanılabilir.

Vektör veritabanı bağlantısı.

Daha fazla bilgi için şuraya bakın: Vektör veritabanlarına bağlanma.

LLM bağlantısıLLM bağlantısı.

Daha fazla bilgi için şuraya bakın: LLM bağlantılarına bağlanma.

Databricks'i bir LLM bağlantısı olarak kullanmak istediğinizde, bilgi birikimi ambarı oluştururken Ekleme modeli hizmet uç noktası'nı ve Tamamlama modeli hizmet uç noktası'nı yapılandırın. Daha fazla bilgi için Databricks belgelerine bakın.

Bu tabloda, Platform ayarları sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Veri görevi şemasıVeri görevi şemasının adı.
Dahili şemaDahili şemanın adı.
Tüm tablo ve görünümler için ön ekBirden çok veri görevi arasındaki çakışmaları çözümlemek ön ek.
Bu tabloda, Vektör veritabanı ayarları sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Dizin şeması

Bu ayar, Vektörleri şurada sakla: için Harici vektör veritabanı seçildiğinde kullanılamaz.

Dizin şemasının adı.
Dizin adıDizinin adı.
Dizin zaten mevcutsaAynı dizine birden fazla görev yazıldığında, dizinin silinmesi gerekip gerekmediğini seçin:
  • Mevcut dizini kullan: Dizin silinmez.
  • Dizini bırak ve oluştur: Dizin silinir.
Databricks vektör arama uç noktası

Databricks'te oluşturulan vektör arama uç noktasının adı. Daha fazla bilgi için şuraya bakın: Bilgi birikimi ambarları için Databricks platformunu yapılandırma .

Bilgi notuYalnızca Databricks'i veri platformu olarak kullanan projeler için geçerlidir.
Bu tabloda, Çalışma zamanı sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Paralel yürütme

Maksimum veritabanı bağlantısı sayısı. 

1 ile 50 arasında bir değer girin.

Toplu boyutBilgi birikimi ambarı için yığın boyutu, her bir yığın talebinde yüklenen belge sayısıdır.

Dosya tabanlı bilgi birikimi ambarları için yığın boyutu, her bir yığın talebinde yüklenen dosya sayısıdır.

Snowflake ve Databricks'te, her şey tek bir sorguda yüklendiğinden yığın boyutu gerekli değildir.

Yüklenecek maksimum kayıt sayısı0, tüm kayıtların yüklendiği anlamına gelir.
Bu tabloda, Snowflake için Görünümler sekmesinin ayarları açıklanmaktadır.
Ayarlar Açıklama
Standart görünümler Bir sorgunun sonuçlarını bir tabloymuş gibi görüntülemek için standart görünümleri kullanın.
Snowflake güvenli görünümleri Temel tabloların tüm kullanıcılarına açık olmaması gereken hassas verilere erişimi sınırlamak üzere oluşturulan görünümler gibi veri gizliliği veya hassas bilgi koruması için belirlenmiş görünümler için Snowflake güvenli görünümlerini kullanın.

Snowflake güvenli görünümleri Standart görünümlere göre daha yavaş çalışabilir.

Bu tabloda, Test asistanı sekmesinin ayarları açıklanmaktadır.
AyarlarAçıklama
Bağlamdaki belge sayısıBağlam olarak modele aktarılacak alakalı belgelerin sayısı.
Komut istemi şablonuYapay zekanın dahil edilecek belgeleri filtrelemek için izlemesi gereken şablonu girin.
FiltreDahil edilecek belgeleri filtrelemek için ifadeyi girin.

Filtre, meta verilere dayandığından ve dosya tabanlı bilgi birikimi ambarlarında meta veri olmadığından, yapılandırdığınız filtreyi dikkatlice düşünün. Verileri dahil etmek yerine hariç tutmak daha uygun olabilir.

Daha fazla bilgi için bk. Test asistanını kullanma.

Belge almaAçılan listeden seçeneği seçin:
  • Alınan içerikleri göster: Test asistanı, cevabı oluşturduğu belgeleri sağlar.
  • Alınan içerikleri gösterme: Test asistanı bir yanıt oluşturur ancak belgeleri sağlamaz.
Yanıt oluşturmaAçılan listeden seçeneği seçin:
  • Yanıt oluştur: Test asistanı, belgelere dayalı olarak bir yanıt oluşturur.
  • Yanıt oluşturma: Test asistanı yalnızca belgelerle yanıt verir.

Bu sayfa size yardımcı oldu mu?

Bu sayfa veya içeriği ile ilgili bir sorun; bir yazım hatası, eksik bir adım veya teknik bir hata bulursanız lütfen bize bildirin!