Tras muchas experiencias en desarrollo de procesos ETL con Integration Services, en los que buena parte de ellos tienen como destino final un Data Mart o un Data Warehouse, hemos ido recopilando buenas prácticas, pros y contras de dar un enfoque u otro a la solución de cada problema, cuáles de ellas obtienen mejores resultados de rendimiento según qué casos, etc.

Por otro lado, cuando llevas años haciendo procesos de este tipo, ves que hay muchas casuisticas que se repiten en buena parte de los procesos que tienes que diseñar, incluso ya tienes una imagen grabada en tu mente de cómo son algunos de estos procesos, debido a que los has repetido multitud de veces. Por ejemplo, los procesos de carga de una dimensión que tiene atributos a los que vas a aplicar SCD tipo 1 o SCD tipo 2.

Y si estos procesos son tan repetitivos ¿Por qué no automatizarlos? Esa fue la pregunta que nos hicimos hace tiempo, y a partir de ahí nos pusimos a trabajar en el tema.

¿Cuál fue nuestra solución? Crear un generador de paquetes que permitiera crear de forma automatizada paquetes que solucionasen casuísticas muy frecuentes. Comenzamos implementando una primera versión que era capaz de generar automáticamente un paquete que sincronizaba dos tablas. Le indicabas el origen, la tabla de origen, y el destino, y a partir de esa información generaba un paquete que sincronizaba el origen con el destino y además creaba una tabla reflejando el historial de cambios que se habían producido. Por tanto, además de sincronizar, auditaba cambios.

De ahí seguimos avanzando y nos planteamos ¿Y si pudiera rellenar los datos del origen, las transformaciones más frecuentes (lookups, merge join, derived columns) en un Excel y que a partir de ahí me generase el paquete para ciertos procesos ETL que son repetitivos?

Bien pues ya lo tenemos desde hace un tiempo disponible. ¿Te imaginas la cantidad de tiempo que te puede ahorrar, tanto de desarrollo como de mantenimiento y solución de bugs? Muchísimo, así es.

Ahora con este generador de paquetes de SSIS, puedes generar un Excel que incluya un buen porcentaje de los paquetes ETL de cualquier proyecto en el que quieras hacer procesos que traen información a un área de staging y posteriormente desde ese área de staging alimentan el Data Mart o Data Warehouse. Por supuesto, recopilando todas las buenas prácticas que implementamos en nuestros proyectos habitualmente.

Eso si, siempre habrá algunos más específicos que tengas que generar como hasta ahora, desde Visual Studio, pero serán los mínimos.

Si quieres conocer más sobre nuestro Generador de paquetes y ver un caso práctico en el que se muestra desde el excel que rellenamos hasta el resultado final, te recomiendo ver este video:

Video Generando Paquetes SSIS automáticamente

0 Shares:
2 comments
  1. Hola.
    Sigue estando vigente el Generador de paquetes SSIS? No sé en estos años si ha habido alguna evolución, si merece la pena (creo que sí) y si aplica a SQL Server 2016.

    Muchas gracias por los comentarios.

    1. Hola Miriam,

      Claro que si, aunque ha evolucionado muchísimo. Ahora incluye muchos más patrones habituales. También está integrado dentro de una solución mayor, todo un framework de desarrollo de soluciones de BI. Te dejo este enlace con más información:
      http://www.adaptivebi.it/?lang=es

      Saludos
      Salvador Ramos

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like

Backups y restores “al vuelo” sin almacenamiento intermedio

Seguramente los más “senior” recordarán la posibilidad que existía en versiones SQL Server antiguas de realizar backups utilizando named pipes. Cuando hablo de versiones antiguas, me refiero a “antiguas de verdad”, ya que esta funcionalidad fue marcada como obsoleta en SQL Server 7, se mantuvo en SQL 2000 pero ya se eliminó de SQL Server 2005 y posteriores.

Data Masking de datos sensibles… piénsalo dos veces

Dynamic data masking (enmascaramiento) es una técnica que busca limitar/ocultar información sensible sin requerir cambios en las aplicaciones. Los datos en la base de datos realmente no se modifican, se alteran “al vuelo” de forma que cuando las consultas devuelven resultados se aplican las máscaras apropiadas. Esto hace que esta funcionalidad sea sencilla de implementar ya que no requiere cambios sustanciales y sea bastante transparente para las aplicaciones que utilizan los datos enmascarados.