Hitachi Vantara Pentaho Community Wiki
Child pages
  • .08 Configuración de Transformaciones
Skip to end of metadata
Go to start of metadata

Configuración de Transformaciones

La configuración de Transformaciones es un conjunto de propiedades que describe la Transformación y configura su comportamiento.
Para acceder a la configuración de una Transformación se debe seleccionar en el menú principal: "Transformación -> Configuración". O presionando: CTRL + T.

A continuación se describirá el contenido de cada una de las pestañas de esta opción:

Y se explicará la función del #botón SQL.

Transformación


La pestaña Transformación permite especificar propiedades generales de la Transformación, incluyendo:

Propiedad

Descripción

nombre transformación

Nombre de la Transformación. Información requerida si se utiliza el catálogo.

Transformation filename

Ubicación física de la Transformación.

Descripción

Breve descripción de la Transformación, que se muestra en el explorador de catálogo.

Descripción extendida

Descripción ampliada de la Transformación.

Estado

Estado de la Transformación: ninguno, producción o diseño.

Versión

Información acerca de la versión de la Transformación.

Directorio

Directorio del catálogo donde se almacena la transformación.

Creado por

Muestra el creador original de la Transformación.

Creado en

Muestra la fecha y la hora de creación de la Transformación.

Ultima modificación por

Muestra el nombre de usuario del último usuario que modificó la Transformación.

Ultima modificación a

Muestra la fecha y la hora de la última modificación de la Transformación.

Parameters


  La pestaña Parameters permite establecer variables de entorno con su respectivo valor y descripción.

Archivado



 
La pestaña Archivado permite configurar cómo y dónde se captura la información de archivado. Las propiedades incluyen:

Propiedad

Descripción

archivar paso de LECTURA

Usar la cantidad de líneas leídas desde este paso para escribir en la tabla de archivado. Leídas significa: leídas desde pasos fuente.

archivar paso de ENTRADA

Usar la cantidad de líneas de entrada desde este paso para escribir en la tabla de archivado. Entrada significa: entrada desde un archivo o base de datos.

archivar paso de ESCRITURA

Usar la cantidad de líneas escritas desde este paso para escribir en la tabla de archivado. Escritas significa: escritas en pasos destino.

archivar paso de SALIDA

Usar la cantidad de líneas de salida desde este paso para escribir en la tabla de archivado. Salida significa: salida hacia un archivo o base de datos.

archivar paso de ACTUALIZACIÓN

Usar la cantidad de líneas actualizadas desde este paso para escribir en la tabla de archivado. Actualizadas significa: actualizadas en una base de datos.

Paso de log RECHAZADO

Usar la cantidad de líneas rechazadas desde este paso para escribir en la tabla de archivado. Rechazadas significa: error de registro.

Conexión Archivado

Conexión utilizada para escribir en la tabla de archivado.

Tabla de archivado

Especifica el nombre de la tabla de archivado (por ejemplo L_ETL)

¿Utilizar Id-Lote?

Habilitar si se desea tener un ID de lote en el archivo L_ETL. Deshabilitar para compatibilidad con versiones < 2.0 de Spoon/Pan.

¿Utilizar campo para almacenar archivado?

Almacena el texto del acceso en un campo CLOB de la tabla de archivado. Esto permite tener el texto del acceso junto con el resultado de la ejecución en la misma tabla. Deshabilitar para compatibilidad con versiones < 2.1 de Spoon/Pan.

Fechas



 
La pestaña Fechas permite configurar las siguientes propiedades relacionadas con la fecha:

Propiedad

Descripción

Conexión Máxima Fecha

Obtener el límite superior de un rango de fechas en esta conexión.

Tabla Máxima Fecha

Obtener el límite superior de un rango de fechas en esta tabla.

Campo Máxima Fecha

Obtener el límite superior de un rango de fechas en este campo.

Desplazamiento Máxima Fecha (segundos)

Incrementa el límite superior de la fecha en esa cantidad. Utilizar esto por ejemplo, si se encuentra que el campo DATE_LAST_UPD tiene un valor máximo de 2009-03-21 23:00:00, pero se sabe que los valores del último minuto no están completos. En este caso, simplemente establecer el desplazamiento en -60.

Diferencia Máxima Fecha (segundos)

Establece la máxima diferencia de fechas en el rango de fechas obtenido. Esto permitirá limitar el tamaño de los trabajos.

Dependencias


 
La pestaña Dependencias permite ingresar todas las dependencias de la Transformación.
Por ejemplo, si una dimensión depende de 3 tablas de consulta, a través de esta opción podemos asegurarnos que las mismas no han cambiado. Si los valores de estas tablas de consulta han cambiado, se puede ampliar el rango de fechas para forzar una actualización completa de la dimensión.

Las dependencias permiten determinar si una tabla ha cambiado cuando hay una columna "datos modificados por última vez" en la tabla. Hacer clic en "Obtener dependencias" para detectar automáticamente las dependencias.

Misceláneos


 
La pestaña Misceláneos permite configurar las siguientes propiedades:

Propiedad

Descripción

Nro de filas del conjunto de filas

Permite cambiar el tamaño de los buffers entre los pasos conectados en una Transformación. No cambiar este parámetro a menos que esté ejecutando con poca memoria, por ejemplo.

¿Mostrar una fila de retroalimentación en los pasos de transformación?

Controla si se agrega o no una entrada de retroalimentación en el archivo de log mientras se ejecuta la Transformación. Por defecto, esta característica está habilitada y configurada para mostrar un registro de retroalimentación cada 50000 filas.

Tamaño de la retroalimentación

Establece la cantidad de filas a procesar antes de ingresar una entrada de retroalimentación en el log. Establecer un valor más alto cuando se procesa grandes cantidades de datos para reducir la cantidad de información en el archivo de log.

Utilizar conexiones únicas

Permite utilizar para abrir una conexión única mediante una conexión de base de datos definida y utilizada en la Transformación. Se requiere habilitar esta opción para permitir que un defecto de la Transformación se pueda deshacer completamente. También es necesario habilitar esta opción al tratar de modificar los ajustes de conexión antes de una consulta utilizando un paso "Ejecutar script SQL".

Fichero de Objetos Compartidos

Especifica la ubicación del archivo XML que se usa para almacenar objetos compartidos como conexiones de base de datos, esquemas de clustering, etc.

¿Administrar prioridades de hilo?

Permite habilitar o deshabilitar la lógica interna para cambiar las prioridades de los hilos en Java basada en la cantidad de filas de entrada y salida en los buffers "rowset". Esto puede ser útil en algunas situaciones donde el costo de utilizar la lógica excede el beneficio de la priorización de hilos.

Particionando


 
La pestaña Particionando proporciona una lista de las particiones disponibles de la base de datos.

Hacer clic en "Nuevo" para crear una nueva partición.
El botón "Obtener particiones" recupera una lista de particiones disponibles definidas para la conexión.

Monitoring


 
La pestaña Monitoring proporciona información relacionada al monitoreo de la Transformación.

Botón SQL


El botón SQL en la parte inferior permite generar el código SQL necesario para crear la tabla de archivado. El DDL se muestra en el "Editor SQL Simple" para permitir la ejecución de esta o cualquier otra/s sentencia/s SQL contra la conexión de acceso.

  • No labels