Como vimos en la entrada anterior sobre la creación de procesos de ETL. Uno de los puntos que comentaba era la generación automática de los paquetes de SSIS que componen nuestro proceso ETL.

En SolidQ hemos trabajado mucho dentro de esta línea, y en la actualidad contamos con una herramienta que aporta un pilar muy importante a nuestro marco de desarrollo. Dicha herramienta se basa en tres pilares fundamentales:

  1. Una arquitectura que nos aporte un conjunto de plantillas de desarrollo, así como unos procesos ETL comunes para situaciones comunes (bajadas de datos, carga de dimensiones con atributos tipo 1 y tipo 2 (SCD), carga de tablas de hechos, etc.)
  2. Un diseño detallado del proceso de ETL, donde especifiquemos claramente las tablas de salida y sus orígenes de datos, así como las transformaciones a realizar en los flujos de datos.
  3. Una herramienta que combine los puntos anteriores para agilizar el desarrollo evitando las tareas repetitivas.

Enbreve publicaremos un video, en el que mostramos cómo podemos desarrollar un gran número de paquetes en tiempo record (unos minutos vs un día de trabajo) habiendo hecho un buen trabajo de diseño y habiendo automatizado las tareas repetitivas.

La herramienta es adaptable a distintos orígenes de datos, pudiendo conectarnos a AS 400, Oracle, SQL Server, etc. además de poder incorporar o modificar los procesos en función de las necesidades y las definiciones que tengamos en nuestra arquitectura.

0 Shares:
1 comment
Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like

PowerApprízate

En un mundo que se mueve rápido, la capacidad de reacción ante la toma de decisiones es primordial. Te enseñaremos a llevar tus datos allá donde vayas, visualizarlos como necesites y tomar el control. Para ello PowerApps permite visualizarlos como necesites y tomar el control. Para ello PowerApps permite integrar la suite de aplicaciones de Microsoft, de una manera ágil e intuitiva.
Leer más

Extraer datos de Twitter desde un servicio creado con Python en Visual Studio 2017

En el post que os traemos hoy vamos a ver como crear (con Visual studio 2017) mediante un script en python un programa que podremos ejecutar como un servicio de windows y que extraiga en tiempo real los twitts relacionados con determinadas palabras o hashtags, los almacene en una base de datos sql server, para luego explotarlos con powerbi. El objetivo de este script es el de conectar al api de streaming de twitter al que le pasaremos una lista de hashtags o terminos y nos devolverá de forma indefinida en tiempo real los twitts que se van publicando que contienen estos terminos.