Construir un flujo de datos

Crear un flujo de datos

Empiece creando un nuevo flujo de datos.

En el menú de Inicio, seleccione Análisis > Crear o Análisis > Preparar datos.
Haga clic en Flujo de datos.

Se abre el cuadro de diálogo Crear un nuevo flujo de datos.
En el campo correspondiente, indique un Nombre para su flujo de datos.
En la lista desplegable correspondiente, seleccione en qué Espacios desea guardar el flujo de datos.
Añada una Descripción para documentar el propósito del flujo de datos.
Añada algunas etiquetas al flujo de datos para facilitar su localización.
Si lo desea, marque la casilla Abrir flujo de datos para ver directamente el flujo de datos una vez creado.
Haga clic en Crear.

Su flujo de datos vacío se abre y llega a la pestaña Vista general de la cabecera de navegación. El nuevo flujo de datos también puede encontrarse más adelante en la página Análisis > Inicio de Qlik Cloud.

Para más información sobre la información que puede encontrar en la vista general de su flujo de datos, consulte Navegar por los flujos de datos.

Para empezar a diseñar su flujo de datos, vaya a la pestaña Editor de la cabecera de navegación.

Seleccionar una fuente

El primer bloque de construcción de su flujo de datos es la fuente que contiene los datos que desea preparar. Puede utilizar cualquier dato de su catálogo o de una conexión.

Añadir datos desde un conjunto de datos

Los conjuntos de datos almacenados en su catálogo pueden estar basados en archivos (.qvd,.xls,.csv,.parquet,.json, etc.) o tablas de bases de datos y almacenes de datos. Consulte Formatos de archivo para ver la lista de formatos admitidos.

Los conjuntos de datos creados en Qlik Talend Data Integration como parte de un proyecto de datos también pueden utilizarse para crear flujos de datos.

Para seleccionar un conjunto de datos como fuente para su flujo de datos:

Desde la pestaña Fuentes del panel izquierdo, arrastre una fuente de Conjuntos de datos y suéltela en el lienzo central.

Se abre la ventana Catálogo de datos, en la que puede buscar conjuntos de datos cargados anteriormente o haga clic en Cargar archivo de datos para buscar archivos en su ordenador y cargarlos sobre la marcha.

Nota de avisoAl cargar archivos grandes, de más de 300 MB, el proceso puede tomar algún tiempo. No cierre la ventana, el progreso se muestra en una ruleta que puede parecer vacía al principio.
Utilizando la búsqueda y los filtros, seleccione la casilla situada delante de uno o varios conjuntos de datos de su lista y haga clic en Siguiente.

Cuando seleccione un conjunto de datos añadido desde una conexión del catálogo y coincidan varias conexiones, podrá utilizar una lista desplegable para seleccionar la conexión específica que desea utilizar.
En la pestaña Resumen, puede revisar los conjuntos de datos que ha seleccionado, comprobar los campos que contienen y excluir algunos si lo desea. Haga clic en Cargar en flujo de datos.

La fuente o fuentes se añaden al lienzo, con una advertencia que le indica que debe conectarlas a otros nodos.

Una vez colocada una fuente en el lienzo, puede hacer clic en ella y acceder al panel Propiedades para editar los campos seleccionados si es necesario, si se ha actualizado el esquema de la fuente, por ejemplo.

Cargar y configurar un archivo csv

Si está utilizando como fuente un conjunto de datos de un archivo csv cargado previamente en su catálogo o cargado directamente durante el proceso y los datos no se muestran correctamente en la vista previa, podría significar que el archivo no tiene el formato adecuado.

Por ejemplo, estos datos de clientes que utilizan la coma como separador se muestran en una sola columna.

datos separados por coma que se muestran erróneamente en una sola columna

El archivo estaba mal formateado o no se detectó correctamente el separador durante la carga. Para solucionar este problema, tendrá que ir a la configuración del conjunto de datos.

En el menú Inicio, seleccione Análisis > Catálogo.
Abra el conjunto de datos que hay que corregir.

En la vista general del conjunto de datos, puede ver una advertencia que indica que existe un posible error de formato.
Haga clic en el enlace a la configuración del formato de archivo del mensaje de advertencia o utilice el menú Más acciones situado en la parte superior derecha de la vista general.

Puede ver que el delimitador se ha establecido erróneamente como punto y coma.
En la lista desplegable Delimitador, seleccione Coma.

Con el delimitador esperado, la vista previa muestra ahora correctamente los distintos campos.
Haga clic en Guardar.
Vuelva a su flujo de datos, elimine la fuente de datos obsoleta si el lienzo no estaba vacío y añádala de nuevo. Esta vez, la fuente reflejará la configuración correcta del conjunto de datos.

Añadir datos de una conexión

Qlik Cloud y los flujos de datos admiten diversas conexiones a fuentes de datos. Consulte la Lista de fuentes de datos compatibles para obtener más información.

Los únicos tipos de conexión que actualmente no se admiten son los siguientes:

AI21 Labs (Amazon Bedrock), Advanced Analytics, Amazon Comprehend, Amazon SageMaker, Amazon Titan (Amazon Bedrock), Anthropic (Amazon Bedrock), Azure ML, Azure OpenAI, Cohere (Amazon Bedrock, DataRobot, Databricks MLflow, Google Ads, Google Calendar, Hugging Face, Meta (Amazon Bedrock), MeaningCloud, OData, OpenAI, Qlik Predict, Qlik Big Data Index (QBDI), Qlik GeoOperations, Qlik GeoOperations GeoJSON, Qlik GeoOperations Shapefile, Sentiment140, SMTP, Watson Natural Language Understanding, YouTube Analytics.

Para seleccionar una conexión como fuente de su flujo de datos:

Desde la pestaña Fuentes del panel izquierdo, arrastre una fuente de Conexiones y suéltela en el lienzo.

Se abrirá la ventana Seleccionar conexión, donde podrá buscar conexiones creadas anteriormente o hacer clic en Crear conexión para definir una nueva conexión sobre la marcha tras autenticarse.
Utilizando la búsqueda y los filtros, seleccione la casilla situada delante de una conexión de su lista y pulse Siguiente.
Dependiendo de la conexión, podrá examinar los archivos, introducir una ruta a sus datos o seleccionar tablas de una base de datos.
Tras seleccionar los datos de origen, haga clic en Guardar o en Finalizar.

La fuente se añade al lienzo, con una advertencia que le indica que debe conectarla a otro nodo.

Añadir procesadores

Los procesadores son los bloques de construcción que contienen las distintas funciones de preparación disponibles en un flujo de datos. Reciben los datos entrantes y devuelven los datos preparados al siguiente paso del flujo. Los procesadores le permiten realizar operaciones complejas de extracción, mejora y limpieza de datos diversos con una vista previa en directo. Consulte la página Procesadores de un flujo de datos completa para obtener más información sobre las funciones disponibles.

Para conectar un primer procesador a su fuente de datos:

Tiene una de dos opciones:
- Desde la pestaña Procesadores del panel izquierdo, arrastre el procesador de su elección y suéltelo en el lienzo junto a su fuente.
  
  Deberá conectar manualmente la fuente y el procesador. Cree un enlace haciendo clic en el punto situado a la derecha del nodo de origen, manteniéndolo pulsado y arrastrando el enlace hasta el punto situado a la izquierda del nodo procesador.
- Haga clic en el menú de acciones de la fuente, seleccione Añadir procesador y haga clic en el procesador de su elección.
  
  El procesador se coloca en el lienzo y se conecta automáticamente a la fuente.
Haga clic en el procesador para empezar a configurarlo en el panel a la derecha.

Las diferentes funciones disponibles y los parámetros que se han de configurar dependen de cada procesador. Consulte la documentación de cada procesador para obtener más información.
Haga clic en Guardar.
Añada y conecte tantos procesadores como necesite para preparar sus datos.

Active la opción de Vista previa de datos en el panel de Vista previa para ver los efectos de un procesador en una muestra de sus datos. Haga clic en el icono de engranaje para abrir la vista previa Configuración y configurar el tamaño de la muestra hasta 10.000 filas. También puede activar la opción Script para ver el script de Qlik equivalente para su flujo de datos en este punto.

Seleccionar un destino

Para finalizar el flujo de datos, debe conectar el último procesador a un nodo de destino. Puede elegir entre dos tipos de destino:

Archivos de datos para archivos almacenados en su catálogo en Qlik Cloud.
Conexiones para escribir en una fuente externa añadida como conexión en Qlik Cloud.

Ambas opciones le permiten exportar los datos preparados como archivo .qvd, .parquet, .txt o .csv.

Para conectar un destino al resto del flujo:

Tiene una de dos opciones:
- Desde la pestaña Destinos del panel izquierdo, arrastre el tipo de objetivo de su elección y suéltelo en el lienzo junto al último procesador.
  
  Conecte manualmente el último procesador al destino del mismo modo que conectó los procesadores anteriormente.
- Haga clic en el menú de acciones del último procesador, seleccione Agregar destino y haga clic en el objetivo de su elección.
Haga clic en el destino para empezar a configurarlo en el panel derecho.

Nota informativaEn el caso de los Archivos de datos, puede escribir en una carpeta específica del espacio deseado. Si ha creado una carpeta llamada nombre_carpeta en su espacio personal, por ejemplo, utilice nombre_carpeta/flujo_de_datos_resultado.qvd como nombre de archivo para su destino. El archivo resultante se enviará directamente a su carpeta.
Haga clic en Guardar.

Con un mínimo de una fuente, un destino y un procesador opcional, ya se puede ejecutar el flujo de datos.

Ejecutar el flujo de datos

Cuando todos los nodos de su flujo de datos están conectados, configurados y marcados como Aceptar, una marca de verificación verde indica que el flujo de datos se considera válido y puede ejecutarse. En este punto, es posible utilizar el botón Vista previa del script en la parte superior derecha del lienzo para ver el script completo que se generará detrás de la escena.

Un flujo de datos válido listo para ejecutarse

Haga clic en Ejecutar flujo para empezar a procesar los datos.

Se abre una notificación para mostrar el estado de la ejecución.
Cuando el flujo se haya completado con éxito, los datos preparados que hayan salido como resultado pueden encontrarse en diferentes lugares según sea el destino:
- En su Catálogo entre sus otros activos de datos, y en la sección Salidas de la Vista general del flujo de datos para archivos de datos
- En la sección Salidas de la Vista general del flujo de datos para los conjuntos de datos basados en conexiones.
  
  Si el flujo falla, puede abrir el registro de ejecución para ayudarle a identificar qué fue mal.

Ahora ya puede utilizar estos datos preparados como fuente limpia para alimentar un experimento de Qlik Predict o una app de visualización.

¿Esta página le ha sido útil?

Si encuentra algún problema con esta página o su contenido (errores tipográficos, pasos que faltan o errores técnicos), no dude en ponerse en contacto con nosotros.

Deje aquí sus comentarios