Transformar datos
Puede crear transformaciones de datos reutilizables y basadas en reglas como parte de su canalización de datos. Puede realizar transformaciones como parte de su incorporación de datos o crear tareas de datos de transformación reutilizables. Puede realizar transformaciones a nivel de fila y crear conjuntos de datos que o bien se materialicen como tablas, o bien se creen como vistas que realizan transformaciones sobre la marcha.
Puede realizar transformaciones explícitas por conjunto de datos o crear reglas globales que transformen varios conjuntos de datos. También puede filtrar un conjunto de datos para crear un subconjunto de filas.
Crear un activo de datos de transformación
La forma más fácil de crear una tarea de transformación de datos es hacer clic en ... en una tarea de almacenamiento de datos y luego seleccionar Transformar datos.
También puede hacer clic en Añadir nuevo en un proyecto de datos y seleccionar Transformar datos. En este caso, debe definir qué tarea de datos de origen utilizar.
-
Defina sus datos de origen en Transformar conjunto de datos.
Seleccione conjuntos de datos de origen y haga clic en Añadir para agregarlos al Resultado.
Puede agregar un conjunto de datos basado en SQL seleccionando un conjunto de datos y haciendo clic en Añadir conjunto de datos basado en SQL.
Agregar conjuntos de datos basados en SQL
Nota de sugerenciaTambién puede agregar más conjuntos de datos de otros activos de almacenamiento de datos haciendo clic en Seleccionar datos de origen. -
Haga todos los cambios necesarios en los conjuntos de datos incluidos, como transformaciones, filtrado de datos o adición de columnas.
Para más información, vea Administrar conjuntos de datos.
-
Cuando haya agregado las transformaciones que desea, puede validar los conjuntos de datos haciendo clic en Validar conjuntos de datos. Si la validación encuentra errores, corríjalos antes de continuar.
Para más información, vea Validar y ajustar los conjuntos de datos.
-
Crear un modelo de datos
Haga clic en Modelo para establecer las relaciones entre los conjuntos de datos incluidos.
Para más información, vea Crear un modelo de datos.
-
Haga clic en Preparar para preparar la tarea de datos y todos los artefactos necesarios. Esto puede tomar un poco de tiempo.
-
Cuando el estado muestra Preparado, puede ejecutar la tarea de datos.
Haga clic en ... y después en Ejecutar.
La tarea de datos ahora comenzará a crear conjuntos de datos para transformar los datos.
Agregar conjuntos de datos basados en SQL
En Transformar conjunto de datos, seleccione los conjuntos de datos que desee incluir en la consulta y haga clic en Agregar tabla basada en SQL.
-
Indique un nombre para el conjunto de datos en Nombre del conjunto de datos.
También puede agregar una descripción más larga en Descripción.
-
Escriba la consulta para devolver la tabla basada en SQL en SELECT query.
La consulta solo puede leer desde los conjuntos de datos de origen. No puede hacer referencia a otras tablas basadas en SQL o tablas de salida agregadas en este activo de datos.
Puede seleccionar entre Conjuntos de datos y Columnas.
-
Haga clic en Analizar para analizar los parámetros en la consulta SELECT.
Nota de sugerenciaPuede reemplazar un parámetro con una referencia para tener una consulta que sea más fácil de leer. Cambie el valor en Parámetro y la referencia en SELECT query también cambiará. -
Haga clic en Describir tabla para obtener una vista previa de los metadatos de salida de la consulta.
-
Cuando esté satisfecho con los resultados de la consulta, haga clic en Aceptar. El conjunto de datos ahora se agrega a la lista de conjuntos de datos y puede obtener una vista previa.
Cuando agrega conjuntos de datos basados en SQL, la clave principal no se define automáticamente. Agregue una clave al conjunto de datos en la pestaña Conjunto de datos.

Supervisar una tarea de transformación
Puede programar una tarea de transformación para que se actualice periódicamente. Puede establecer una programación basada en el tiempo o configurar la tarea para que se ejecute cuando las tareas de datos de entrada hayan terminado de ejecutarse.
Haga clic en ... en una tarea de datos y seleccione Programación para crear una programación. La configuración de programación predeterminada se hereda de la configuración del proyecto de datos. Para obtener más información sobre la configuración predeterminada, vea Transformar valores predeterminados.
Siempre debe establecer Programación en Activado para habilitar la programación.
Programaciones basadas en el tiempo
Puede utilizar una programación basada en el tiempo para ejecutar la tarea independientemente de cuándo se actualicen las distintas fuentes de entrada.
-
Seleccione A una hora específica en Ejecutar la tarea de datos.
Puede establecer una programación por hora, diaria, semanal o mensual.
Programaciones basadas en eventos
Puede usar un programa basado en eventos para ejecutar la tarea cuando las tareas de datos de entrada hayan terminado de ejecutarse.
-
Seleccione En un evento específico en Ejecutar la tarea de datos.
Puede seleccionar si desea ejecutar la tarea cuando cualquiera de las tareas de entrada se haya completado correctamente, o cuando alguna de las tareas de entrada seleccionadas se haya completado correctamente.
Supervisar una tarea de transformación
Puede supervisar el estado y el progreso de una tarea de transformación haciendo clic en Supervisar.
Para más información, vea Supervisar las tareas de datos.
Opciones de configuración de la transformación
Puede establecer propiedades para la tarea de transformación de datos.
-
Haga clic en Configuración.
Configuración general
-
Base de datos
Base de datos que se utilizará en el origen de datos.
-
Esquema de activos de datos
Puede cambiar el nombre del esquema de activos de almacenamiento de datos. El nombre predeterminado es store.
-
Esquema interno
Puede cambiar el nombre del esquema de almacenamiento interno. El nombre predeterminado es store__internal.
-
Materializado
Puede seleccionar crear tablas (Materializado), o solo crear vistas que realicen transformaciones sobre la marcha (No materializado).
-
Historial
Puede conservar los datos de cambios históricos para permitirle recrear fácilmente los datos tal y como se veían en un punto específico en el tiempo. Puede usar las vistas del historial y las vistas del historial en vivo para ver los datos históricos.
Configuración de tiempo de ejecución
-
Ejecución en paralelo
Puede establecer el número máximo de conexiones de datos para cargas completas en un número del 1 al 5.
-
Almacén
El nombre del almacén de datos en la nube.
Limitaciones
-
No es posible cambiar los tipos de datos en una tarea de transformación de datos cuando se selecciona la opción No materializado.
-
Actualmente, los conjuntos de datos basados en SQL proporcionan solo soporte de carga completa. Esto significa que cada ejecución de la tarea de transformación recargará los datos. Los conjuntos de datos basados en SQL también proporcionan solo datos actuales y no mantienen registros históricos.