Hitachi Vantara Pentaho Community Wiki

.08 Configuración de Transformaciones

Skip to end of metadata
Go to start of metadata

Configuración de Transformaciones

La configuración de Transformaciones es un conjunto de propiedades que describe la Transformación y configura su comportamiento.
Para acceder a la configuración de una Transformación se debe seleccionar en el menú principal: "Transformación -> Configuración". O presionando: CTRL + T.

A continuación se describirá el contenido de cada una de las pestañas de esta opción:

Y se explicará la función del botón SQL.

Transformación


La pestaña Transformación permite especificar propiedades generales de la Transformación, incluyendo:

Propiedad Descripción
nombre transformación Nombre de la Transformación. Información requerida si se utiliza el catálogo.
Transformation filename Ubicación física de la Transformación.
Descripción Breve descripción de la Transformación, que se muestra en el explorador de catálogo.
Descripción extendida Descripción ampliada de la Transformación.
Estado Estado de la Transformación: ninguno, producción o diseño.
Versión Información acerca de la versión de la Transformación.
Directorio Directorio del catálogo donde se almacena la transformación.
Creado por Muestra el creador original de la Transformación.
Creado en Muestra la fecha y la hora de creación de la Transformación.
Ultima modificación por Muestra el nombre de usuario del último usuario que modificó la Transformación.
Ultima modificación a Muestra la fecha y la hora de la última modificación de la Transformación.

Parameters


  La pestaña Parameters permite establecer variables de entorno con su respectivo valor y descripción.

Archivado



 
La pestaña Archivado permite configurar cómo y dónde se captura la información de archivado. Las propiedades incluyen:

Propiedad Descripción
archivar paso de LECTURA Usar la cantidad de líneas leídas desde este paso para escribir en la tabla de archivado. Leídas significa: leídas desde pasos fuente.
archivar paso de ENTRADA Usar la cantidad de líneas de entrada desde este paso para escribir en la tabla de archivado. Entrada significa: entrada desde un archivo o base de datos.
archivar paso de ESCRITURA Usar la cantidad de líneas escritas desde este paso para escribir en la tabla de archivado. Escritas significa: escritas en pasos destino.
archivar paso de SALIDA Usar la cantidad de líneas de salida desde este paso para escribir en la tabla de archivado. Salida significa: salida hacia un archivo o base de datos.
archivar paso de ACTUALIZACIÓN Usar la cantidad de líneas actualizadas desde este paso para escribir en la tabla de archivado. Actualizadas significa: actualizadas en una base de datos.
Paso de log RECHAZADO Usar la cantidad de líneas rechazadas desde este paso para escribir en la tabla de archivado. Rechazadas significa: error de registro.
Conexión Archivado Conexión utilizada para escribir en la tabla de archivado.
Tabla de archivado Especifica el nombre de la tabla de archivado (por ejemplo L_ETL)
¿Utilizar Id-Lote? Habilitar si se desea tener un ID de lote en el archivo L_ETL. Deshabilitar para compatibilidad con versiones < 2.0 de Spoon/Pan.
¿Utilizar campo para almacenar archivado? Almacena el texto del acceso en un campo CLOB de la tabla de archivado. Esto permite tener el texto del acceso junto con el resultado de la ejecución en la misma tabla. Deshabilitar para compatibilidad con versiones < 2.1 de Spoon/Pan.

Fechas



 
La pestaña Fechas permite configurar las siguientes propiedades relacionadas con la fecha:

Propiedad Descripción
Conexión Máxima Fecha Obtener el límite superior de un rango de fechas en esta conexión.
Tabla Máxima Fecha Obtener el límite superior de un rango de fechas en esta tabla.
Campo Máxima Fecha Obtener el límite superior de un rango de fechas en este campo.
Desplazamiento Máxima Fecha (segundos) Incrementa el límite superior de la fecha en esa cantidad. Utilizar esto por ejemplo, si se encuentra que el campo DATE_LAST_UPD tiene un valor máximo de 2009-03-21 23:00:00, pero se sabe que los valores del último minuto no están completos. En este caso, simplemente establecer el desplazamiento en -60.
Diferencia Máxima Fecha (segundos) Establece la máxima diferencia de fechas en el rango de fechas obtenido. Esto permitirá limitar el tamaño de los trabajos.

Dependencias


 
La pestaña Dependencias permite ingresar todas las dependencias de la Transformación.
Por ejemplo, si una dimensión depende de 3 tablas de consulta, a través de esta opción podemos asegurarnos que las mismas no han cambiado. Si los valores de estas tablas de consulta han cambiado, se puede ampliar el rango de fechas para forzar una actualización completa de la dimensión.

Las dependencias permiten determinar si una tabla ha cambiado cuando hay una columna "datos modificados por última vez" en la tabla. Hacer clic en "Obtener dependencias" para detectar automáticamente las dependencias.

Misceláneos


 
La pestaña Misceláneos permite configurar las siguientes propiedades:

Propiedad Descripción
Nro de filas del conjunto de filas Permite cambiar el tamaño de los buffers entre los pasos conectados en una Transformación. No cambiar este parámetro a menos que esté ejecutando con poca memoria, por ejemplo.
¿Mostrar una fila de retroalimentación en los pasos de transformación? Controla si se agrega o no una entrada de retroalimentación en el archivo de log mientras se ejecuta la Transformación. Por defecto, esta característica está habilitada y configurada para mostrar un registro de retroalimentación cada 50000 filas.
Tamaño de la retroalimentación Establece la cantidad de filas a procesar antes de ingresar una entrada de retroalimentación en el log. Establecer un valor más alto cuando se procesa grandes cantidades de datos para reducir la cantidad de información en el archivo de log.
Utilizar conexiones únicas Permite utilizar para abrir una conexión única mediante una conexión de base de datos definida y utilizada en la Transformación. Se requiere habilitar esta opción para permitir que un defecto de la Transformación se pueda deshacer completamente. También es necesario habilitar esta opción al tratar de modificar los ajustes de conexión antes de una consulta utilizando un paso "Ejecutar script SQL".
Fichero de Objetos Compartidos Especifica la ubicación del archivo XML que se usa para almacenar objetos compartidos como conexiones de base de datos, esquemas de clustering, etc.
¿Administrar prioridades de hilo? Permite habilitar o deshabilitar la lógica interna para cambiar las prioridades de los hilos en Java basada en la cantidad de filas de entrada y salida en los buffers "rowset". Esto puede ser útil en algunas situaciones donde el costo de utilizar la lógica excede el beneficio de la priorización de hilos.

Particionando


 
La pestaña Particionando proporciona una lista de las particiones disponibles de la base de datos.

Hacer clic en "Nuevo" para crear una nueva partición.
El botón "Obtener particiones" recupera una lista de particiones disponibles definidas para la conexión.

Monitoring


 
La pestaña Monitoring proporciona información relacionada al monitoreo de la Transformación.

Botón SQL


El botón SQL en la parte inferior permite generar el código SQL necesario para crear la tabla de archivado. El DDL se muestra en el "Editor SQL Simple" para permitir la ejecución de esta o cualquier otra/s sentencia/s SQL contra la conexión de acceso.

Enter labels to add to this page:
Please wait 
Looking for a label? Just start typing.