Saltar al contenido principal Saltar al contenido complementario

Creación de almacenes de conocimiento

Crear almacenes de conocimiento permite integrar y almacenar sus datos tanto estructurados como no estructurados en una base de datos vectorial. Esto permite recuperar el contexto aumentado con funciones de búsqueda semántica para utilizarlo como contexto en aplicaciones de generación aumentada de recuperación (RAG).

RAG optimiza la salida del LLM proporcionándole un contexto adicional con la consulta.

Nota informativaNecesita una suscripción a Qlik Talend Cloud Enterprise.
Nota informativaEsta función solo es compatible con las plataformas de Snowflake y para una pasarela de datos administrada por el cliente. Snowflake Iceberg no es compatible.

Instalar Qlik Data Gateway - Data Movement

Para utilizar los almacenes de conocimiento, necesita conectarse a bases de datos vectoriales y conexiones LLM, lo que requiere instalar un Qlik Data Gateway - Data Movement específico. Para más información, vea Configuración de Qlik Data Gateway - Data Movement para almacenes de conocimiento.

Visualización y descarga de registros

Puede ver y descargar los registros de los almacenes de conocimiento. Para más información, vea Resolución de problemas Data Movement gateway.

Requisitos previos

Puede utilizar tareas de datos de los siguientes tipos como fuente para un almacén de conocimiento:

  • Almacenamiento

  • Transformar

Antes de poder crear un almacén de conocimiento, debe hacer lo siguiente en las tareas de la fuente de datos:

  • Rellene los conjuntos de datos con los datos que desee utilizar en su almacén de conocimiento. Para más información, vea Incorporación de datos a un almacén de datos.
  • Cree un modelo relacional de conjuntos de datos para definir las relaciones entre los conjuntos de datos de origen. Para obtener más información, consulte Crear un modelo de datos.

    Nota de avisoTodos los conjuntos de datos de origen deben tener claves.

Limitaciones

Existen limitaciones cuando se utilizan conjuntos de datos fuente que reúnen todas estas condiciones:

  • Creado por una transformación de SQL o un flujo de transformación

  • No materializado

  • Almacén de datos históricos (tipo 2) desactivado

Estos conjuntos de datos se consideran actualizados en cada ejecución, lo que puede afectar a la eficacia y al coste. Puede mitigar esto de las siguientes maneras:

  • Cambiando los conjuntos de datos fuente que se han de materializar.

  • Utilizando transformaciones explícitas de los conjuntos de datos.

  • Creando reglas globales que transformen varios conjuntos de datos.

Formato de codificación admitido

Sus archivos deben estar codificados correctamente en UTF-8. Otros formatos pueden interpretarse de forma errónea.

Nota informativaQlik añade 2 reglas de transformación que eliminan todo el contenido binario del resultado de salida: QLIK__REMOVE_BLOB_COLUMNS y QLIK__REMOVE_BYTES_COLUMNS.

Caracteres admitidos

Los nombres de archivos y carpetas pueden contener los siguientes caracteres:

  • [0-9], [a-Z], [A-Z]
  • ! - _ . * ' ()

Es posible que se admitan otros caracteres especiales, pero, debido a la importante manipulación de caracteres especiales, se recomienda utilizar únicamente los caracteres incluidos en la lista anterior.

Relaciones

  • No es posible relacionar los datos de dos conjuntos de datos. Cree una tarea de transformación en la que defina la relación en el modelo de datos y utilice la tarea de transformación como fuente para la tarea.

  • Cuando dos conjuntos de datos están relacionados en el modelo de datos, ambos estarán disponibles en la tarea, aunque solo haya seleccionado uno de ellos.

Modificar las conexiones o la pasarela de datos

Si cambia la conexión de vector o la pasarela de datos de vector, debe preparar la tarea de nuevo.

Resolución de problemas

Los archivos movidos a OneDrive no son reconocidos por el almacén de conocimiento File

Posible causa  

Si los archivos se mueven a OneDrive o sincronizan con OneDrive utilizando opciones que conservan la fecha de creación y modificación del archivo antiguo, el archivo no se reconoce como un archivo nuevo.

Acción propuesta  

Cambie la fecha de modificación del archivo a la fecha actual.

Error en tiempo de ejecución al usar Pinecone

Posible causa  

Los valores NULL en las columnas de metadatos no son compatibles con Pinecone. El resultado sería un error en tiempo de ejecución.

Acción propuesta  

  • Transforme los valores NULL en otros valores, por ejemplo, una cadena vacía o la palabra NULL, en una transformación antes del almacén de conocimiento.

  • Utilice otra base de datos vectorial.

  • No utilice la columna como metadatos.

¿Esta página le ha sido útil?

Si encuentra algún problema con esta página o su contenido (errores tipográficos, pasos que faltan o errores técnicos), no dude en ponerse en contacto con nosotros.