Creación de almacenes de conocimiento
Crear almacenes de conocimiento permite integrar y almacenar sus datos tanto estructurados como no estructurados en una base de datos vectorial. Esto permite recuperar el contexto aumentado con funciones de búsqueda semántica para utilizarlo como contexto en aplicaciones de generación aumentada de recuperación (RAG).
RAG optimiza la salida del LLM proporcionándole un contexto adicional con la consulta.
Instalar Qlik Data Gateway - Data Movement
Para utilizar los almacenes de conocimiento, necesita conectarse a bases de datos vectoriales y conexiones LLM, lo que requiere instalar un Qlik Data Gateway - Data Movement específico. Para más información, vea Configuración de Qlik Data Gateway - Data Movement para almacenes de conocimiento.
Visualización y descarga de registros
Puede ver y descargar los registros de los almacenes de conocimiento. Para más información, vea Resolución de problemas Data Movement gateway.
Requisitos previos
Puede utilizar tareas de datos de los siguientes tipos como fuente para un almacén de conocimiento:
-
Almacenamiento
-
Transformar
Antes de poder crear un almacén de conocimiento, debe hacer lo siguiente en las tareas de la fuente de datos:
- Rellene los conjuntos de datos con los datos que desee utilizar en su almacén de conocimiento. Para más información, vea Incorporación de datos a un almacén de datos.
-
Cree un modelo relacional de conjuntos de datos para definir las relaciones entre los conjuntos de datos de origen. Para obtener más información, consulte Crear un modelo de datos.
Nota de avisoTodos los conjuntos de datos de origen deben tener claves.
Limitaciones
Existen limitaciones cuando se utilizan conjuntos de datos fuente que reúnen todas estas condiciones:
-
Creado por una transformación de SQL o un flujo de transformación
-
No materializado
-
Almacén de datos históricos (tipo 2) desactivado
Estos conjuntos de datos se consideran actualizados en cada ejecución, lo que puede afectar a la eficacia y al coste. Puede mitigar esto de las siguientes maneras:
-
Cambiando los conjuntos de datos fuente que se han de materializar.
-
Utilizando transformaciones explícitas de los conjuntos de datos.
-
Creando reglas globales que transformen varios conjuntos de datos.
Formato de codificación admitido
Sus archivos deben estar codificados correctamente en UTF-8. Otros formatos pueden interpretarse de forma errónea.
Caracteres admitidos
Los nombres de archivos y carpetas pueden contener los siguientes caracteres:
- [0-9], [a-Z], [A-Z]
- ! - _ . * ' ()
Es posible que se admitan otros caracteres especiales, pero, debido a la importante manipulación de caracteres especiales, se recomienda utilizar únicamente los caracteres incluidos en la lista anterior.
Relaciones
-
No es posible relacionar los datos de dos conjuntos de datos. Cree una tarea de transformación en la que defina la relación en el modelo de datos y utilice la tarea de transformación como fuente para la tarea.
-
Cuando dos conjuntos de datos están relacionados en el modelo de datos, ambos estarán disponibles en la tarea, aunque solo haya seleccionado uno de ellos.
Modificar las conexiones o la pasarela de datos
Si cambia la conexión de vector o la pasarela de datos de vector, debe preparar la tarea de nuevo.
Resolución de problemas
Los archivos movidos a OneDrive no son reconocidos por el almacén de conocimiento File
Posible causa
Si los archivos se mueven a OneDrive o sincronizan con OneDrive utilizando opciones que conservan la fecha de creación y modificación del archivo antiguo, el archivo no se reconoce como un archivo nuevo.
Acción propuesta
Cambie la fecha de modificación del archivo a la fecha actual.
Error en tiempo de ejecución al usar Pinecone
Posible causa
Los valores NULL en las columnas de metadatos no son compatibles con Pinecone. El resultado sería un error en tiempo de ejecución.
Acción propuesta
-
Transforme los valores NULL en otros valores, por ejemplo, una cadena vacía o la palabra NULL, en una transformación antes del almacén de conocimiento.
-
Utilice otra base de datos vectorial.
-
No utilice la columna como metadatos.