[et_pb_section admin_label=”section”][et_pb_row admin_label=”row”][et_pb_column type=”4_4″][et_pb_text admin_label=”Texto” background_layout=”light” text_orientation=”left” use_border_color=”off” border_color=”#ffffff” border_style=”solid”]

En esta sesión de SolidQ Summit revisaremos diferencias iniciales sobre cosas que se pueden hacer y que no se pueden hacer (nativamente) y veremos casos concretos comparando rendimiento, precisión en los resultados, como lo haríamos en cada herramienta.


Presentación realizada en el SolidQ Summit por: Pau Sempere, Dani Gil

Maching Learning vs SSAS Data Mining from SolidQ on Vimeo.

 

[/et_pb_text][et_pb_code admin_label=”Código”]<iframe src="//www.slideshare.net/slideshow/embed_code/key/jwAXM5egXeqHX" width="595" height="485" frameborder="0" marginwidth="0" marginheight="0" scrolling="no" style="border:1px solid #CCC; border-width:1px; margin-bottom:5px; max-width: 100%;" allowfullscreen> </iframe>[/et_pb_code][et_pb_text admin_label=”Texto” background_layout=”light” text_orientation=”left” use_border_color=”off” border_color=”#ffffff” border_style=”solid”]
  1.  #SQSummit Maching Learning vs SSAS Data Mining Daniel Gil – DPS (dgil@solidq.com) Pau Sempere – DPA (psempere@solidq.com)
  2. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  3. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  4. Introducción SSAS Data Mining • On premises • Integrado en SSAS • 9 algoritmos disponibles • DMX
  5. Introducción Azure Machine Learning • Cloud • Múltiples orígenes, todos desde nube • Transformaciones específicas • 25+ algoritmos disponibles • Integra Python y R • Servicios web
  6. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  7. ¡Enfrentando las herramientas!
  8. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  9. Diferencias – Orígenes Azure ML • Hive • SQL Database • Blob Storage • Table Storage • Odata • HTTP SSAS Data Mining • Bases de datos • Cubos SSAS
  10. Diferencias – Dimensionamiento Azure ML • 10 GB en total • Hay módulos que aceptan menos • Recomendadores • SMOTE • Scripts (R, Python, SQL) • Cross-validation, Tune Model Hyperparameters SSAS Data Mining • Dependiente del hardware
  11. Diferencias – Tiempos Azure ML • 1 hora en versión free • 7 días de ejecución • 24 horas por módulo SSAS Data Mining • Ilimitado
  12. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  13. Market Basket Analysis ¿Qué compran nuestros usuarios? ¿Cómo lo compran? ¿Siguen un patrón?
  14. Market Basket Analysis Usuario Producto Cantidad Dani Disfraz 1 Pau Disfraz 1 Dani Capa 1 Pau Cables 2 Pau Switch 1 Pau Capa 1 Usuario Edad Sueldo Daniel 25 Poco Pau 29 Menos aun
  15. Market Basket Analysis Usuario Edad Sueldo Producto Cantidad Daniel 25 Poco Disfraz 1 Capa 1 Pau 29 Menos aun Disfraz 1 Capa 1 Cables 2 Switch 1
  16. Market Basket Analysis • Association rules / Árboles de decisión • Podemos añadir clustering para identificar patrones de compra
  17. Demo Market Basket Analysis con SSAS
  18. Market Basket Analysis • No hay un algoritmo específico • Preprocesado del dato para darle otra forma Matriz de productos / Usuarios Dani Pau Disfraz 1 1 Capa 1 1 Cable 0 1 Switch 0 1
  19. Demo Market Basket Analysis con Azure ML
  20. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  21. Clasificación • Predicción de categorías • Muerto / vivo • Solvente / deudor • Comprador / no comprador • …
  22. Clasificación
  23. Clasificación • Varios algoritmos: • Árboles de decision • Múltiples modos de ejecución • Regresión logística • Red neural • Clustering • Análisis de precisión • Lift chart • Profit chart • Red de dependencias
  24. Clasificación • Múltiples algoritmos • Boosted decision tree • Red neural • Regresión logística • Máquina bayesiana • … • Análisis de precisión • ROC • Lift chart • Puntuaciones ponderadas
  25. Demo Clasificación binaria
  26. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  27. Series temporales • Datos sobre un eje temporal / numérico • Cumplen patrones cíclicos
  28. Series temporales • Dos algoritmos nativos • ARTXP • ARIMA • Comprar contra casos conocidos (training-test) • Visualmente • Métricas de error
  29. Series temporales • No hay un algoritmo nativo • Pero siempre está … ? • ARIMA • ETS • Otros • Mismo método para estimar la precision que en SSAS
  30. Demo Series temporales
  31. Conclusiones Azure ML • Fuentes Azure • Variedad de algoritmos • R! Python! • 100 % Online • Todo en 1 SSAS Data Mining • On premises • Sin limite de datos y tiempos • Menos algoritmos nativos • Necesidad de herramientas complementarias
  32. ¿PREGUNTAS?
  33. También puedes preguntar tus dudas con el hashtag #SQSummit en Twitter ADAPTIVE BI FRAMEWORK Te ayudaremos a mejorar la velocidad de desarrollo de tu plataforma de analítica de negocio basada en nuestra experiencia: •Diseña antes de construir •Automatización de procesos por ETL •Servicios de mentoring para ayudarte a conseguir mejores prácticas para la construcción de procesos específicos y plataformas de analítica de negocio •Muy fácil de mantener SOLIDQ FLEX SERVICES Con SolidQ Flex Services evitarás sustos, consiguiendo que tus sistemas sean estables. Desde una solución sencilla de monitorización, hasta un servicio de atención de incidencias 24/7, mantenimiento proactivo, resolución de problemas y línea de soporte. Todo con un coste fijo mensual… y tú dedica el tiempo a las cosas importantes. ¡Gracias!
[/et_pb_text][/et_pb_column][/et_pb_row][/et_pb_section]
0 Shares:
2 comments
  1. Buen video, pero tambien se pueden considerar como fuente de orígenes de datos en Azure Machine Learning repositorios on premises, esto se puede utilizando un gateway.
    Saludos

    1. Hola Raul! Tienes razón, pero dado que Azure Machine Learning es un producto completamente en nube tiene funcionalidades nuevas que aparecen y mejoran a lo largo del tiempo. En el momento de realizar esta charla ésta posibilidad no estaba disponible Gateway. Sin embargo, como bien indicas, ahora sí, se puede encontrar la información para conseguirlo en https://docs.microsoft.com/en-us/azure/machine-learning/studio/use-data-from-an-on-premises-sql-server. Muchas gracias! 🙂

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like