Arquitectura de un datawarehouse
Hoy me gustaría hablar de mi visión de la arquitectura de un datawarehouse. Mucho se ha escrito sobre ello y hoy me gustaría dar mi opinión de las diferentes alternativas. Primero un resumen de las diferentes áreas o capas que pueden conformar un almacén de datos:
Staging Area:Área que reproduce los datos del entorno transaccional que vamos a utilizar en nuestro datawarehouse. Su misión es proporcionar un entorno de extracción estable, fijo y no cargar el entorno transaccional con continuas extracciones durante la ejecución de los procesos. Puede servir también para incorporar datos de múltiples orígenes.
Delivery Area: Área donde se realizan las transformaciones y se preparan los datos para la carga en el datawarehouse. Puede ser una replica de la estructura del datawarehouse para preparar los datos y validar el éxito de todos los procesos a cargar antes de efectuar la carga.
Datawarehouse Area: Área donde reside la información de nuestro datawarehouse ya consolidada.
History Area ( o recovery ): Más que una área dentro de un datawarehouse es un espacio en nuestro sistema donde podemos almacenar un histórico de las cargas que ha recibido nuestro datawarehouse con los datos originales de cada carga para poder recuperar el estado de nuestro datawarehouse en un momento determinado del tiempo. También se pueden guardar snapshots del datawarehouse en un momento determinado del tiempo.
Respecto a cual es la arquitectura perfecta, creo que no existe y que según el entorno, el volumen de datos y otras muchas variables debemos decidir que arquitectura nos conviene más.
Para poner algunos ejemplos:
Una staging area es útil cuando tenemos un transaccional muy activo o ventanas de tiempo cortas para la extracción de datos.
Una delivery area la podemos usar cuando los datos a cargar son críticos o cuando sean cargas incrementales que nos puedan dejar el sistema inconsistente en cada carga, para prevenir desastres.
Una history area puede ser útil para recuperar el estado consistente de nuestros datos. Para volver a momentos del pasado,etc…
Que opináis vosotros?
datawarehouse, OLAP, TI












Prefiero modelos estrella ROLAP, aunque a veces la flexibilidad de tener un ODS funcionando permite un rápido desarrollo para soluciones del día a día,
Saludos,
Ciertamente diego esta arquitectura debe ser independiente de como sea el diseño del datawarehouse en concreto. Uno puede usar esta arquitectura o la que desee sobre un modelo en star o snowflake no?
Saludos
eeeeeeeeeeeey enric que tal???!!!
Si les coses em van bé i tinc una nena que es un trato jejeje.
De vegades parlo amb l’Esther i em va comentant coses de vosaltres.
A veure si ens veiem un dia.
Petons!!!!!!!!!
cris
volia dir trasto jejeje