Si bien es cierto que la mayoría de las dimensiones suelen cambiar poco y no contienen grandes volúmenes de datos, en casi todos los sistemas suele aparecer alguna dimensión monstruo que contiene tanta o más información que la tabla de hechos (clientes, catálogos, visitantes de una página web). ¿Cómo manejar el procesamiento de esa información?

El particionamiento no se puede aplicar sobre las dimensiones y a través de la ventana de procesamiento nuestras únicas opciones parecen ser realizar un procesamiento completo o una actualización. Sin embargo hay una tercera opción; A través de un script XMLA podemos ejecutar el comando ProcessAdd. Este comando va a permitir realizar un procesamiento incremental de la dimensión, añadiendo solo aquellos registros nuevos que identifiquemos sin necesidad de tocar la información almacenada actualmente en la dimensión.

Este tipo de procesamiento no se podrá aplicar sobre dimensión de tipo 1, es decir, aquellas que requieren actualización de los datos históricos.

El proceso incremental de una dimensión tiene varias diferencias con respecto al proceso incremental de un cubo:

  1. No duplica información. Cuando se ejecuta un proceso incremental de una dimensión, si en el conjunto de datos hay información que ya fue previamente cargada, esa información no se carga, es más, ni siquiera llega a actualizarse con los posibles cambios que hubiera sobre los datos anteriores.
  2. Se ejecuta únicamente a través de XMLA. Hay que crear un script específico para que la dimensión pueda actualizarse incrementalmente, dicho script se puede ejecutar tanto desde el SQL Server Management Studio como a través de un paquete de Integration Services.
  3. La fuente es siempre un esquema. Si el esquema del Data Source View no nos aporta el conjunto de datos incrementales entonces habría que indicar el esquema que va a utilizar la dimensión para obtener los datos incrementales.

En los próximos post iremos viendo estos tres puntos en detalle con ejemplos prácticos.

0 Shares:
Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like
Leer más

Operador unario y jerarquías padre-hijo en SSAS MD

Recientemente nos hemos visto involucrados en un proyecto SSAS Multidimensional en el que existía una dimensión de cuentas padre-hijo bastante compleja y con un operador unario por en medio. Es por esto que nos hemos decidido a describir brevemente la implementación por defecto de SSAS y la que utilizamos finalmente para mejorar el rendimiento.

Excel conectado a Analysis Services y la propiedad MDX Missing Member Mode

Encontramos muchas veces Excel como herramienta que los usuarios utilizan para pre cocinar datos, crearse informes, navegar cubos… En esta entrada voy a compartir una experiencia reciente, en un escenario en el que Excel es la aplicación cliente para mostrar datos de un cubo, algo bastante común. Lo que no resulta tan común es Excel muestre un error cuando puedo ejecutar la misma consulta MDX en SQL Server Management Studio.
Leer más

Power BI embedded: Tus informes se vuelven omnipresentes

Crear reportes es esencial, pero, de nada sirve si no puedes compartirlos. Además de ver formas básicas de embeber un reporte de Power BI, esta sesión se centrará en cómo mostrar reportes dentro de sus propias aplicaciones web/móviles para compartir información con gente que está dentro y fuera de su organización (sin necesidad de cuenta de Power BI). Se trata brevemente Power BI Premium y Azure Power BI Embedded, así como otros temas relacionados con el licenciamiento.