Universitat Internacional de Catalunya
MÓDULO 3.2: Métodos Estadísticos y Data Mining
Otras lenguas de impartición: catalán, inglés
Profesorado
Faculty:
Imanol Morata (imorata@uic.es)
José Antonio Esteban (jaesteban@uic.es)
David Roche (droche@uic.es)Presentación
Esta asignatura se compone de una parte de repaso de estadística básica y otra parte dedicada a aprender alguna de las técnicas clásicas relacionadas con la obtención de conocimiento y la toma de decisiones.
La estadística es un componente esencial y básico para poder entender técnicas más propias de la ciencia de datos y la extracción de patrones, reglas y conocimiento.
En resumen, en esta asignatura se retomarán aspectos estadísticos básicos junto con alguna técnica más concreta relativa a la ciencia de datos
Requisitos previos
Para cursar esta asignatura se supone ciertos conocimientos de estadística básica y programación en R y Python
Objetivos
Los objetivos de esta asignatura se refieren al uso de la estadística y de ciertas técnicas algorítmicas para completar conocimientos básicos necesarios para la formación en ciencia de datos.
En resumen, se abordarán aspectos como test de hipótesis, regresión lineal, componentes principales y computación evolutiva. También se realizará alguna sesión sobre ciclo de vida de los proyectos de ciencia de datos y sobre técnicas de aprendizaje automático
Competencias/Resultados de aprendizaje de la titulación
- 31 - Desarrollar la capacidad para identificar e interpretar datos numéricos.
- 36 - Ser capaz de interpretar datos cuantitativos y cualitativos, y de usar herramientas matemáticas y estadísticas aplicables a los procesos empresariales.
- 64 - Capacidad de planificación y organización del trabajo.
- 32 - Adquirir habilidades en la resolución de problemas a partir de información cuantitativa y cualitativa.
- 40 - Ser capaz de seleccionar el método estadístico adecuado atendiendo al objeto de análisis.
- 43 - Adquirir habilidad en el manejo de software estadístico.
- 50 - Aquirir la capacidad de relacionar conceptos y realizar ejercicios de análisis y de síntesis.
- 51 - Desarrollar habilidades en la toma de decisiones.
- 53 - Adquirir habilidades para el aprendizaje autónomo.
- 54 - Ser capaz de expresar ideas y argumentos de manera ordenada y coherente tanto oralmente como de forma escrita.
- 56 - Ser capaz de hacer argumentaciones que favorezcan el razonamiento crítico y autocrítico.
- 65 - Adquirir la capacidad de aplicar los conocimientos en la práctica.
- 66 - Capacidad de recuperación y tratamiento de la información.
Resultados de aprendizaje de la asignatura
Al acabar esta asignatura el alumno será capaz de enfrentarse a problemas cuantitativos y cualitativos y a aplicar técnicas clásicas de estadística y algunos algoritmos propios de la ciencia de datos para obtener información a partir de los datos para apoyar la toma de decisiones
Contenidos
Contenidos de la asignatura:
- Repaso elementos de programación
- Test de hipótesis para la diferencia de medias
- Paramétricos dos medias y más de dos medias
- No Paramétricos dos medias y más de dos medias
- Regresión lineal
- Modelo simple
- Modelo múltiple
- Análisis de componentes principales
- Computación evolutiva
- Sesiones de empresas sobre uso de técnicas de aprendizaje automático
Metodología y actividades formativas
Modalidad totalmente presencial en el aula
La técnica de aprendizaje de esta asignatura es “learning by doing” por lo que se realizarán casos prácticos aplicados a cada concepto teórico que se desarrolle en las diferentes sesiones y para los diferentes lenguajes. El objetivo siempre es acercar al alumno a la realidad de su profesión donde tendrá que aplicar los conocimientos teórico-prácticos aprendidos a lo largo de la asignatura.
La mayoría de las sesiones se estructuran de la siguiente forma:
- Presentación del resumen teórico por parte del profesorado
- Aplicación ejemplo por parte del profesorado
- Planteamiento de problemas y solución por parte del alumnado
- Solución del problema de forma conjunta
- Caso práctico simulado o con datos reales
- Trabajo práctico para realizar en casa con la intención de asimilar los conceptos aprendidos en la sesión
Sistemas y criterios de evaluación
Modalidad totalmente presencial en el aula
La evaluación de esta asignatura se obtendrá con la ponderación equitativa de todas las entregas realizadas a lo largo del curso.
La nota final es la nota de la evaluación continuada.
Bibliografía y recursos
-Statistics for Business and Economics, Global Edition. Paul Newbold, William Carlson, Betty Thorne. 2019
- An Introduction to Statistical Learning: with Applications in R. Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani. 2014. Springer Publishing Company, Incorporated.
- R Cookbook: Proven Recipes for Data Analysis, Statistics, and Graphics. J D Long y Paul Teetor. 2019