Como actividad complementaria dentro de la asignatura de «Estadística y Optimización» de 1º de Ingeniería Civil, vamos a ofrecer una Charla-Taller de introducción ala Ciencia de Datos de 1 hora, dirigida a estudiantes y profanos.
El taller se realizará online via Collaborate el Miércoles 26 a las 16h, siguiendo el siguiente enlace:
https://eu.bbcollab.com/guest/5da285dae7bd420ba707fd988a0bf07c
Durante el taller, se ofrecerá a los asistentes el acceso a un notebook interactivo con comandos y herramientas en Python de análisis y visualización de datos, así como el acceso a ciertos conjuntos de datos relacionados con la Ingeniería Civil, sobre los cuales se construirá un modelo predictivo.
- Título: «Introducción a la Ciencia de Datos» (por Manuel López Sheriff, matemático así como profesional y experto en Machine Learning, actualmente Data Analytics Lead Teacher)
- Resumen de la charla-taller: La Ciencia de Datos es un campo actual de conocimiento que combina matemáticas, estadística y programación centrados en el análisis de datos. Es un campo transversal con múltiples aplicaciones en varias ramas de la Ciencia (biología, sociología, física,..) al mismo tiempo que provee herramientas de toma de (mejores) decisiones dentro de la Industria (ingeniería civil, diseño, construcción, marketing,…) a partir de los datos.
En particular, la Ciencia de Datos trata básicamente de:
- Explorar y analizar volúmenes de datos para detectar y entender patrones, así como las distribuciones estadísticas subyacentes.
- Construir modelos predictivos basados en datos pasados con el objetivo de predecir comportamientos futuros.
En este Taller, vamos a «jugar» con un conjunto de datos relacionado con la Ingeniería Civil: 1000 muestras de hormigón, describiendo sus propiedades físicas y correspondientes esfuerzos de compresión.
- Primero, haremos una exploración de los datos, estudiando ciertas propiedades estadísticas que se presentarán visualmente.
- En una segunda parte, construiremos un modelo predictivo, explicando por encima algunas herramientas y conceptos clave en la Ciencia de Datos: regresión lineal, árboles de decisión, métricas, modelos de evaluación…