dimensión temporal datawarehouse para kettle
Ayer un amigo y ex-compañero de trabajo me pedía como montar una ETL para obtener la dimensión temporal de un datawarehouse.
Esta dimensión es siempre particular pues no suele existir una tabla de tiempo en los sistemas transaccionales.
Sin embargo es una tabla clave para los sistemas de análisis de datos y no siempre fácil ni evidente de construir.
Hace ya unos años cuando empecé a trabajar con Pentaho y Kettle me encontré con el mismo problema que mi
amigo y buscando por Internet encontré un valioso ejemplo de ETL de kettle para este propósito.
Se trata de una transformación que utiliza elementos de Java y Javascript (concretamente la clase java locales y calendar)
para obtener la dimensión temporal.
Yo en su día hice una adaptación del ejemplo que me ha funcionado durante años a la perfección.
Os dejo mi versión aquí para que podáis utilizarla libremente.
Viene con comentarios en el interior que espero os ayuden a entenderla.
Descargar transformación aquí (load_time_dimension.ktr)
Si tenéis dudas podéis recurrir a la entrada original en la que yo me inspiré en su día del gurú de Pentaho Roland Bouman
Espero que os sea útil.
ETL, Kettle, Pentaho













Gracias Saruman por el aporte es una de las cosas que mas faltan en pentaho ejemplos útiles eres un crack