En algunas ocasiones necesitamos relacionar una tabla con sigo misma, construyendo una relación de autoreferencia o lo que se conoce como relación padre-hijo en el mundo de Inteligencia de Negocio. PowerPivot no tiene soporte explícito para este tipo de relaciones pero con la nueva versión de PowerPivot en SQL Server 2012 disponemos de funciones que nos permiten simularla perfectamente. Ejemplos de estas relaciones son: empleados o las cuentas del libro de cuentas de la organización. Nuestro objetivo es construir algo como lo siguiente:

Novedades de PowerPivot en Denali (XI): Relación padre-hijo o autoreferencia en PowerPivot

 

En esta imagen podemos ver que empleado es manager de cada uno de los empleados. En la versión anterior de PowerPivot no disponíamos de jerarquías y los distintos niveles los teníamos que calcular en la consulta contra el origen sobrecargando así los orígenes debido a la complejidad de estas consultas. Ahora con la nueva versión de PowerPivot podemos resolverlo en 3 pasos:

  • Crear una columna calculada en la tabla que nos permita obtener la ruta desde el primer nivel hasta el nivel de la fila concreta. Esto lo hacemos con una función nueva en PowerPivot para SQL 2012 que se llama PATH y que la podemos utilizar de la siguiente manera:
    =PATH(DimEmployee[EmployeeKey],DimEmployee[ParentEmployeeKey])

    Esta función recibe como primer parámetro la columna de la tabla que tiene que utilizar para buscar el valor del padre y el segundo nos dice que valor tiene que buscar. La función construirá una ruta con el siguiente aspecto:”112|23|18|1”, lo que nos indica que estamos en el empleado con EmployeeKey es el 1 y que su manager es el 18, que a su vez tiene como manager el 23, y así sucesivamente. Este es el resultado de la columna para el ejemplo de AdventureWorks:

Novedades de PowerPivot en Denali (XI): Relación padre-hijo o autoreferencia en PowerPivot

  • Crear columnas calculadas para cada una de las columnas y para cada nivel que queremos utilizar. Para este ejemplo de empleados con Adventure Works, vamos a obtener el nombre de los tres primeros niveles. Esto lo hacemos también con 2 funciones nuevas que son: LOOKUPVALUE y PATHITEM, y que las podemos utilizar en las columnas calculadas como vemos en el siguiente ejemplo:
    =LOOUPVALUE(DimEmployee[FistName],DimEmployee[EmployeeKey],PATHITEM(DimEmployee[RutaEmpleado],1))

    En esta columna tenemos que explicar el funcionamiento de dos funciones:

  • PATHITEM –> Recibe como primer parámetro la lista generada con la función path y como segundo el elemento que queremos obtener. En este caso estamos diciéndole que queremos obtener el primer elemento de la lista (el empleado que es manager de todos los demás).
  • LOOKUPVALUE –> Recibe como primer parámetro la columna que queremos obtener (en nuestro caso el nombre del empleado), como segundo parámetro espera la columna con la que localizaremos al empleado (normalmente la columna que representa a cada elemento de la tabla) y por último, en el tercer parámetro enviaremos el elemento que estamos buscando (el EmployeeKey del manager)

Este es el resultado que obtenemos al crear las tres columnas:

Novedades de PowerPivot en Denali (XI): Relación padre-hijo o autoreferencia en PowerPivot

  • Por último, podemos construir la jerarquía en PowerPivot utilizando las columnas calculadas creadas.
    Novedades de PowerPivot en Denali (XI): Relación padre-hijo o autoreferencia en PowerPivot

De esta manera ya podemos construir el informe que necesitábamos. Espero que os haya gustado y nos vemos en futuros post.

También recordaros que este Jueves 24 de Noviembre de 2011 a las 16:00 horas (horario España) impartiré un webcast sobre novedades de DAX, en que hablaremos de este tema y otros relacionados con el mundo de las expresiones para el Análisis de Datos. Espero veros por allí, aquí tenéis el link de registro (Webcast de novedades en DAX).

Un saludo

Ilde

 

0 Shares:
Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like

El RGPD y la anonimización mediante HASH

Antes de cargar nuestros datos en la nube debemos tener muy en cuenta el Reglamento General de Protección de Datos RGPD o sus siglas en inglés GDPR, se trata de una norma europea relativa a la protección de las personas físicas en lo que respecta al tratamiento de sus datos personales y la libre circulación de estos datos.

Un paseo por Azure ML Services 

Azure ML y sus recursos han expandido enormemente las posibilidades para los desarrolladores de Machine Learning y los Científicos de Datos para obtener datos, analizarlos, entrenar modelos y publicarlos. Acompañame en éste artículo para conocer los elementos básicos y saber cómo puedes aprovechar la potencia de Azure para tus desarrollos ML.

Más ejemplos de validación de datos con T-SQL

¿Cómo validas que los datos están proporcionando la información correcta? La validación es un aspecto imprescindible en tus proyectos. ¡Toma nota! A veces podemos realizar conteos a tablas muy grandes que llevan mucho tiempo, o necesitamos comprobar si existe una tabla o un campo dentro de una tabla, o poder comparar los resultados de 2 consultas distintas. Hoy veremos ejemplos de estos casos empleando diferentes técnicas y ejemplos prácticos con T-SQL para detectar posibles errores y su validación.