Saltar al contenido principal Saltar al contenido complementario

Paso 4: crear un proyecto Qlik Open Lakehouse

Cree una canalización de datos en Qlik Open Lakehouse para ingerir datos de cualquier fuente. Almacene sus datos en formato de tabla abierta Iceberg.

Requisitos previos

Para crear un proyecto de Qlik Open Lakehouse, necesita:

  • Una integración de red para permitir que Qlik aprovisione y administre recursos informáticos en su nombre.

  • Un clúster de lakehouse configurado para ejecutar la tarea de almacenamiento de datos dentro de su proyecto de Iceberg.

  • Una conexión a un catálogo de datos para utilizarlo como destino de los datos de su proyecto, o los detalles necesarios para que pueda crear una nueva conexión.

Tareas que admite

En un proyecto de Qlik Open Lakehouse se admiten las siguientes tareas:

  • Tarea de aterrizaje de datos en un lago

    Aterrice datos en formato CSV en S3, desde cualquier fuente compatible con Qlik, incluidos los streams de datos de gran volumen.

  • Tarea de almacenamiento de datos

    La tarea de almacenamiento de datos consume los datos aterrizados en la nube por la tarea de ubicación de destino/aterrizaje en el lago. La tarea escribe datos en tablas Iceberg para un almacenamiento y consulta eficaces.

  • Tarea de datos de reflejo

    Refleje las tablas Iceberg de su Qlik Open Lakehouse a Snowflake. Los usuarios pueden consultar los datos a través de tablas externas sin necesidad de migrar los datos a Snowflake.

Ejemplo de creación de un proyecto Qlik Open Lakehouse

En el siguiente ejemplo se crea un proyecto de canalización de Qlik Open Lakehouse, se introducen los datos y se almacenan en tablas con formato Iceberg. Este ejemplo crea una canalización de datos sencilla, que podría ampliar incorporando más fuentes de datos. Podría añadir una tarea de Reflejar datos para reflejar sus tablas en Snowflake sin duplicar los datos, o utilizar este proyecto como fuente para un proyecto que requiera transformaciones en Snowflake.

Para crear un proyecto de Qlik Open Lakehouse, haga lo siguiente:

  1. En la página de inicio de Integración de datos , haga clic en Crear canalización y configúrelo:

    • Nombre: indique el nombre del proyecto.

    • Espacio: seleccione el espacio al que pertenecerá el proyecto.

    • Descripción: si lo desea, escriba una descripción para el proyecto.

  2. En Caso de uso, seleccione Canalización de datos.

  3. Configure la Plataforma de datos:

    • Plataforma de datos: seleccione Qlik Open Lakehouse en la lista.

    • Conexión con el catálogo de datos: en la lista, seleccione una conexión disponible o haga clic en Crear nueva para añadir una nueva conexión al catálogo de datos.

    • Conexión de aterrizaje en destino: seleccione el depósito de S3 para el destino temporal o aterrizaje de los datos, o haga clic en Crear nuevo para añadir una nueva ubicación del depósito.

    • Clúster de cómputo de almacenamiento: seleccione el clúster de lakehouse que ejecutará la tarea de almacenamiento.

  4. Cree el proyecto.

  5. Siga los pasos del asistente de incorporación de datos.Para más información, consulte Incorporar datos.

¿Esta página le ha sido útil?

Si encuentra algún problema con esta página o su contenido (errores tipográficos, pasos que faltan o errores técnicos), no dude en ponerse en contacto con nosotros.